如何用3个月零基础入门机器学习?

来源| 微调的知乎专栏
��0.背景
写这篇文章的初衷是大部分私信我的朋友都想了解如何入门/转行机器学习,搭上人工智能这列二十一世纪的快车。再加上这个问题每隔一阵子就会在知乎时间线上出现一次,因此想写一篇文章来“一劳永逸”的分享我的观点。
文章的宗旨是:1.指出一些自学的误区2.不过多的推荐资料3.提供客观可行的学习表4.给出进阶学习的建议。这篇文章的目标读者是计划零基础自学的朋友,对数学/统计基础要求不高,比如:
在读的学生朋友非计算机行业的读者已经工作但想将机器学习/数据分析和自己的本职工作相结合的朋友
因此,这篇文章对于已经身处机器学习领域可能帮助不大。同时再次声明这只是我的个人看法,请大家有选择的性阅读,探索适合自己的学习方法。
��1.自学机器学习的误区和陷阱
1.1.不要试图掌握所有的相关数学知识再开始学习
在很多相关的回答中(#sphx-glr-auto-examples-linear-model-plot-iris-logistic-py)
sklearn的文档不仅提供了练习数据、sklearn的相关代码实例,还提供了可视化图。
3.2.2.周志华机器学习
再次提到周老师是因为西瓜书是值得常常翻看的一本书,在kaggle挑战和阅读sklearn文档的过程中你还会时不时的遇到一些新的名词,比如流形学习(manifoldlearning)等。这个时候你会发现西瓜书真的是一本中级阶段大而全的书籍:)
3.3.第三阶段(可选*):深度学习(3-6个月)
因为深度学习是当下的热点,很多公司都在寻找深度学习人才。虽然深度学习只是机器学习的一个子集,但有兴趣朝这个方向发展的朋友可以在完成以上学习后单独学习一下深度学习。
3.3.1.吴恩达深度学习课程
吴恩达在八月份的时候通过deeplearning.ai和coursera平台推出了最新系列的五门深度学习课程(deeplearning.ai)。有条件的朋友可以通过coursera学习获得证书,最近网易云课堂也上线了这门课的翻译版。如果想要上其中的课程,需要先注册报名「深度学习工程师微专业」深度学习工程师微专业-一线人工智能大师吴恩达亲研-网易云课堂-网易云课堂(),之后就可以分别点开每门课单独进行学习。和coursera上的dl同步,现在云课堂也上线了五门中的前三门课程,而卷积网络(cnn)和循环网络(rnn)还未开放。
更多关于网易云课堂上深度学习课程的介绍可以看:如何评价网易云课堂上线的吴恩达deeplearning课程?(/question/64615398/answer/222596302)
3.3.2.deeplearning- byiangoodfellow
深度学习这本书是由当下深度学习领域的几位领军人物所著,包含三大巨头之一的bengio,还有教父hinton来作序推荐。这本书的中文本翻译由张志华教授团队负责,在github上免费放出了翻译版本,印刷版也可以从亚马逊中国上买到。
英文版:deeplearning
/exacity/deeplearningbook-chinese
这本书的阅读建议:
为了补充基础可以阅读第1-5章其中也包含了一些数学知识只关注主流神经网络知识可以阅读6-10章,介绍了dnn/cnn/rnn需要进一步了解一些调参和应用技巧,推荐阅读11和12章
第13-20章为进阶章节,在入门阶段没有必要阅读。其实比较实际的做法是吴恩达的课程讲到什么概念,你到这本书里面可以阅读一些深入的理论进行概念加深,按章节阅读还是比较耗时耗力的。
3.4.第四阶段:深入研究
恭喜你!如果你已经完成了上面的计划表,代表你已经有了相当的机器学习能力。这个阶段,最重要的就是不要贪多嚼不烂。如果你浏览知乎,会发现大家都说你必须读elementsofstatisticallearning,mlapp之类的大部头。我承认阅读这样的书会有帮助,但在你有了一定的基础知识后,相信你已经知道自己需要接着做什么了也有了志同道合的朋友,我希望把选择权交还给你,而不是继续推荐成堆的课程和书籍。当然,如果你希望继续深入的话,中文可以继续阅读周志华老师的《机器学习》和李航老师的《统计学习基础》,英文可以入手《elementsofstatisticallearning》。在这个阶段,重点要形成成体系的知识脉络,切记贪多嚼不烂,切记!
从阅读论文角度来说,订阅arxiv,关注机器学习的顶级会议,如icml/nips等,相关的方法在知乎上可以很容易搜索到�...