在第一章的Collective Intelligence的介绍中,作者通过Netflix和google两个公司的例子来说明了Collective Intelligence的应用.但具体Collective Intelligence的定义到底是什么呢?作者并没有明确给出,所以我在读书笔记中也就直接用这两个单词了.
这本书将会告诉读者,通过一些API,应用机器学习算法和统计方法来收集数据的一些方法.那么什么是机器学习呢?这个概念我倒是还有映像,幸好以前研究过语音识别,所以对人工智能方面的知识还有一点基础^_^作者给出的定义是:
An algorithm is given a set of data and infers information about the properties of the data---and that information allows it to make predictions about other data that it might see in the future.简单的说,就是给定一组数据,然后通过一个算法推断出一个数据模型,然后,利用这个模型可以对未来的其它数据做出预测.作者通过一个垃圾邮件过滤的简单例子形象的说明了机器学习的过程!
机器学习常用到的一些算法包括决策树,神经网络等,我还记得语音识别中用到了隐马尔科夫模型,DTW,线性预测LPC,聚类等模型,但主要的都是基于数学方法和统计方法,真是后悔数学没学好啊:(
作者罗列了一些机器学习算法的应用场景,例如Google的page rank,Amozon的推荐系统,在金融系统中的防欺骗检测,产品市场预测,供应链管理等方面.