本文介绍了 10 大常用机器学习算法,包括线性回归、Logistic 回归、线性判别分析、朴素贝叶斯、KNN、随机森林等。
不得不说开源的世界真的非常的无私,程序员绝对是世界上最懂得分享的一个群体。在机器学习这么火热的时候,竟然有人开源了一个项目:100-Days-Of-ML-Code,也就是100天学会机器学习。
【新智元导读】Big Think网站整理了19个受欢迎的AI课程资源列表,从MOOC的免费在线课程到著名大学的学位课程,不管你对AI的兴趣程度如何,这份清单都将对你有帮助。
机器学习目前已经有非常多的应用,它相比于传统的软件工程,最大的特点即我们编写的是学习过程,因此系统能根据数据改善性能。正因为这种特性,从嵌入循环神经网络的输入法到嵌入卷积神经网络的摄像头,机器学习应用已经无处不在。但在真正做产品时,我们需要的不是机器学习专家或顶尖的深度学习技术,而是大量的模型压缩调优、部署测试和模型交互等。因此,在实践中成为一名出色的工程师极为重要。
机器学习的主要目标是对训练集之外的样本进行泛化。因为无论有多少数据,都不太可能在测试中再次看到完全相同的例子。在训练集上具有良好表现很容易。
本文介绍了元学习,一个解决「学习如何学习」的问题。
本篇文章是由留德华叫兽 在知乎的优秀回答改编扩展而成的, 作者留德华叫兽有着应用数学和硕士运筹学、优化理论的背景转到德国海德堡大学读博,主要从事机器学习、计算机视觉的研究,希望自己的一些经验可以对想入门机器学习的朋友们有点借鉴作用。
在此,我借垃圾邮件分类来解释朴素贝叶斯分类器。首先,我们先来看一下贝叶斯公式
我刚开始学习数据科学时,第一个接触到的算法就是线性回归。在把这个方法算法应用在到各种各样的数据集的过程中,我总结出了一些它的优点和不足。
上周做了个股指的回顾,想用Python画图看看最近20年不同指数的变化情况,需要用到常用的matplotlib库来绘制折线图。整个plot函数的功能和参数很多,但作为初学者,我只用到了一些基本和常用的功能,想必普通画图也已经够了。
人工智能与机器学习已经成为当今的热门话题,这对程序员的要求也越来越高。如果你接触过很多项目原型,可以帮助你掌握新的库类与方法,当然作为初学者也应该多掌握和积累一些库类的使用,以便更好地用在机器学习上。
随着越来越多的企业探索机器学习,对技能的需求也在不断上升。谷歌,微软,IBM和AWS只是一些在机器学习,创建API和开发一些复杂的深度学习框架的领先者。
由于机器学习的十个算法内容比较多,我的回答篇幅会较长些,我尽量浓缩每个知识点,欢迎各位讨论指点。
本次实验是用EM来学习HMM中的参数,并用学好了的HMM对一些kinect数据进行动作分类。实验内容请参考coursera课程:Probabilistic Graphical Models 中的的最后一个assignmnet.实验用的是kinect关节点数据。
本次实验包含了2部分:贝叶斯模型参数的学习以及贝叶斯模型结构的学习,在前面的博文PGM练习七:CRF中参数的学习 中我们已经知道怎样学习马尔科夫模型(CRF)的参数,那个实验采用的是优化方法。
本次实验主要任务是学习CRF模型的参数,实验例子和PGM练习3中的一样,用CRF模型来预测多张图片所组成的单词,我们知道在graph model的推理中,使用较多的是factor,而在graph model参数的学习中,则使用较多的是指数线性模型。
本次实验是将一些简单的决策理论和PGM推理结合,实验内容相对前面的图模型推理要简单些。决策理论采用的是influence diagrams,和常见图模型本质一样。
这次练习完成的是图模型的近似推理,参考的内容是coursera课程:Probabilistic Graphical Models . 上次实验PGM练习四:图模型的精确推理 中介绍的是图模型的精确推理,但在大多数graph上,其精确推理是NP-hard的,所以有必要采用计算上可行的近似推理。
这次实验完成的是图模型的精确推理。exact inference分为2种,求边缘概率和求MAP,分别对应sum-product和max-sum算法。
接着coursera课程:Probabilistic Graphical Models 上的实验3,本次实验是利用马尔科夫网络(CRF模型)来完成单词的OCR识别,每个单词由多个字母组合,每个字母为16×8大小的黑白图片。