人工智能和机器学习入门 (AI & Machine Learning 101)

2017-08-23

Francis Kao

估计这是这几个月来写过最难写的一篇文章, 因为人工智能产业变化太快, 每天都有行业新报导, 新应用，新学术突破。写这么新又大的主题，不免需要加入不少预测和主观看法，很可能6个月后回顾起来, 即成为行业笑话....既然分享观点风险如此高, 那么为什么还要写这篇文章呢? 以下是我给自己的几点理由：努力做个有观点的VC。写篇文章帮自己把抽象观点具象化。虽然不一定对, 但提出观点和他人交流, 总是好的。 AI和机器学习将会是未来5-10年最大的技术变革基石，想多解相关背景。最近AI和机器学习太火, 好像应该在公众号上写篇和相关文章.... 既然有了学习和分享的理由，就从最基础的开始吧 : )

什么是人工智能(Artificial Intelligence, a.k.a. AI) ?

人工智能(AI)一词，最早由一群学者于1956年在Dartmouth大学的学术论坛正式提出, 人工智能作为一门新兴学科也正式诞生。然而，学术界对于什么是“人类智能”至今还没有一个令人满意且统一定义，更别说是给人工智能。以下是几个早期学者对人工智能提出的定义：

著名管理和社会学家赫伯特·西蒙(H.Simon)主张 - AI是学习如何用计算机程序完成智能行为，和学习人类如何完成智能行为的行为科学。
人工智能框架理论的创立者马文·明斯基(M.Minsky)提出 - AI是一方面帮助人们思考，另一方面使计算机更有用的学科。
著名的MIT计算机教授派翠克·温斯顿(P.Winston)在AI教科书里下定义 - AI就是研究如何使计算机去做只有人类才能做的智能工作。

随着时间推移，AI渐渐成为技术创新的集合和一种人类对未来的憧憬。以下是现代各权威网站对AI的定义：

Wiki - Artificial intelligence (AI) is intelligence exhibited by machines. In computer science, an ideal "intelligent" machine is a flexible rational agent that perceives its environment and takes actions that maximize its chance of success at some goal. (基本上是说 - AI是机器展现出的智能行为, 如运用逻辑和对环境的感知做出成功率最高的行为。)
Gartner - Artificial intelligence is technology that appears to emulate human performance typically by learning, coming to its own conclusions, appearing to understand complex content, engaging in natural dialogs with people, enhancing human cognitive performance or replacing people on execution of non-routine tasks. (基本上是说 - AI是一种模拟人类行为及替代人类做非例行工作的技术。)
百度 - 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并产生出一种能做出和人类智能反应相类似的智能机器。(基本上是说 - AI是计算机科学的一门分支，试图做出能做出类似人类智能反应的机器。)

以上几个现代定义大多着重于“模拟人类智能”, 然而，我更认同凯文·凯利(Kevin Kelly)的看法 - AI不只是模拟人类的智能, 更是一种人造的智能。AI所要做的(可以做好的)不是模拟人类的多维思考方式, 而是在某些领域上辅助或超越人类的思考能力，解决人类智慧解决不了的问题，帮助人们过更好的生活。举个例来说，在某些领域动物其实比人更聪明，小猪仔可以在意大利的森林里精准的嗅出黑冬松露，人类不行。在某些领域人工智能也很容易比人类更聪明，比如说需要详细阅读和分析成千上万的客户行为资料，来找出最有可能流失的客户群时，人工智能很可能可以做的比人类更快更好。还有还听过另一种偏浪漫的说法 - AI就是任何还没有被实现的科技。比如笔记型电脑，在我长时间不用时，会推断接下来一段时间我可能也不使用，于是自动把屏幕调暗。比如大厦电梯，在我按电梯钮的那一刻，知道哪一部电梯离我最近，自动指派离我最近的电梯来接。这些在一百年前听起来好像都是不可思议的智能体验，变成日常生活一部分后就不再智能了。我估计我们今天觉得很神奇的人工智能，在5-10年后，也许就是另一种优化算法，另一种生活中的科技。

什么是机器学习(Machine Learning, a.k.a. ML)?

以上是A16Z partner Frank Chen所整理的机器学习(Machine Learning)和深度学习(Deep Learning)关系图, 是我看过众家之说中最清晰易懂的一张。机器学习是试图实现人工智能的众多算法和技巧之一，深度学习是实现机器学习的众多算法和技巧中目前最有效的一种。然而，机器学习一词其实比AI更早出现。机器学习不是指任何一种算法，而是指“程序透过数据样本自我学习”的一种方法论。1952年，IBM的研究学者Arthur Samuel(后来的AI界大拿)设计第一套可透过跟人对弈, 精进程序本身棋艺的程序，Arthur也是第一个提出机器学习一词的学者。他对机器学习的定义是 - 研究如何不透过编程直接赋予机器新能力的学科 (a field of study that gives computer the ability without being explicitly programmed)。自学者在50年代提出机器学习后, 我们比较常听到的相关名词如Perceptron, Neural Networks, Decision Tree, Support Vector Machine(SVM), Random Forests, AdaBoost都是研究人员陆续提出各种机器学习能力的算法和技巧, 其各时期受学者欢迎程度可以参考下图(from Brief History of Machine Learning on Erengolge.com), 近年来Deep Learning人气直线上升, 有一统机器学习江湖的趋势。

什么是深度学习(Deep Learning)?

想了解什么是深度学习，我们先来看看深度学习可以将机器学习提升到什么层度：

2012年, Google利用深度学习和Youtube的数据，让机器自己“领悟”到猫的概念。
2014年, Google在ImageNet图像识别测试中，以93.4%的准确度首度超越人类。(虽然人类在经过集训后以94.9%的准确度扳回了一程, 但下次比赛就很难说了...)
在交通号志图像辨识测试中，深度学习算法早以98%的辨识度超越人类。
2016年, Google的Alpha Go击败韩国围棋冠军李世石。
相较于Alpha Go更让我亲身感受到自己即将被机器超越的是这个视频 - MarI/O - Machine Learning for Video Games

那么深度学习是怎么做到这神奇效果的呢？简单的说，深度学习是按照大脑累积知识的方式进行建模。 1981 年诺贝尔医学奖得主David和Torsten发现一种被称为“方向选择性细胞”(Orientation Selective Cell)的神经元细胞。当瞳孔发现了眼前的物体的边缘，而且这个边缘指向某个方向时，这种神经元细胞就会活跃。这个发现激发了人们对于神经系统的进一步思考。神经-中枢-大脑的工作过程，或许是一个不断抽象、不断迭代的过程。这里的关键词有两个，一个是抽象，一个是迭代。从原始信号，做低级抽象，逐渐向高级抽象迭代。例如，从原始信号摄入开始（瞳孔摄入像素 Pixels），接着做初步处理（大脑皮层某些细胞发现边缘和方向），然后抽象（大脑判定，眼前的物体的形状，是圆形的），然后进一步抽象（大脑进一步判定该物体是只气球)。

这个生理学的发现，促成了计算机人工智能，在四十年后的突破性发展。然而，直到近年GPU的运算能力发展和算法突破，才让大规模的非监督式多层级神经网络训练成为可能。典型的深度学习模型看起来像下图：

多个隐藏层的特征节点都是由深度学习算法自动提取，不经人工干预。好处在于: 1) 由机器提取的神经网络参数数量远比人类能处理的数量更庞大，更能够精确表达人类所能感知到的复杂世界。2) 不需要人工干预，机器学习效率大幅提升, 成本大幅下降, 因此才有机会被规模化的广泛运用。(i.e. 创业公司也用的起高精度的机器学习了, hooray!) 3) 简单的AI应用将不再需要机器学习专家参与，只要略懂AI/机器学习的工程师, 就可以利用开源框架和云端工具在实际产品上实现AI/机器学习功能。随着GPU效率的再提升, 更多大公司和开源社区投入深度学习算法和应用研究，未来5-10年深度学习(Deep Learning)能持续大幅提升机器学习能力的可能性几乎是必然，但深度学习也不是万能，如需要超大规模数据才能有效建模(想象人类需要做3道题就能学会的题目vs深度学习要做几万道题才能学会)和机器学习专家是否能跳出现有深度学习框架思考等都是待解决的难题。如果大家对于深度学习的理论和实践技巧感兴趣，我建议可以阅读在CSDN博客上zouxy09所写的专栏 - Deep Learning(深度学习)学习笔记整理系列, 这是我看过最深入浅出的深度学习入门学习材料之一，另外可以参考同在CSDN博客上Liu_LongPo的专栏 - 机器学习(Machine Learning)&深度学习(Deep Learning)资料，汇集不少中外机器学习的相关材料。

现在AI是否过热?

最近发现不少朋友都有听到AI就倒胃的现象, 感觉AI已经被主流媒体, 投资人, 创业者及各种所谓的专家给过度渲染，造成极度感官和思考疲劳。大多数人已经开始觉得AI不cool了，感觉和过去好几回的AI泡沫一样，又是一次狼来了。然而，我的观察是 - 现在AI的确是被炒的过热, 但这次不会是海市蜃楼般的泡沫, 这次AI真的来了。因为AI在某些事情上做的已经比人类更好, 更便宜，另外，近年人类所产生的数据量早已超过人类能直觉性理解范围，我相信在未来5-10年，会有很多平台型的AI应用产生。但AI应用的发展还在早期，大多数人对AI的期待早已达到不合理高度，就像2000年互联网泡沫一样, 很多AI创业公司会创立, 大多数会倒或被收购, 但最后也会留下一批属于AI时代的伟大公司。

另外，我观察到一个现象是不少人想要用“和几岁人类一样的能力”来描述AI，其实这是很错误的比喻，AI(至少短时间内)不会像人类一样思考, AI在某些领域做的比人类好很多(i.g. 如需要解读大量数据和重复性高的工作), 在某些领域还差人类一大截(i.g. 如创造性工作), 我认为短期内最有可能发生的是人类和AI肩并肩工作，取各之所长，更有效率的完成更高难度的工作(i.g. 如回电子邮件, 送快递, 科学研究和战争) 同时，我也深信AI和机器学习会是未来5-10年人类科技进展最根本性的改变，就像现在没有一家科技公司会说自己是“移动应用”公司一样，每家公司现在几乎都需要自己的移动应用和移动策略。我估计未来5-10年所有(至少50%以上)的科技公司都是AI/机器学习公司, 每个公司从产品设计到用户体验设计, 都需要考虑AI和机器学习在其中扮演的角色。

说了这么多，有哪些适合VC的AI相关投资机会?

总结一句话 - 不多。因为深度学习天生就是需要巨大数据量才能建立有效模型, 另外国内外都面临机器学习人才严重短缺问题，短期内能有效解决这两个问题的都是巨型公司如BAT, 或得天独厚的极少数创业公司。然而，我估计目前这波AI投资热大多是适合天使/pre-A轮投资人的机会，因为大多现阶段AI创业公司退出可能都会来自于人才或技术并购，这也意味着，很可能只有成本够低的天使/pre-A轮投资人赚的到钱。另外，有独特获得数据方法或渠道的垂直应用公司，有可能成为新一代的成功AI公司。因为垂直领域的机会太小, BAT不一定看的上, 所以竞争少。另外，初期的独家数据应用得当，有机会建立起长期的数据网络效应(Data Network Effect: 大量又有用的独家数据 -> 更好的产品体验 -> 更多用户 -> 更多数据)，但这门槛有多难跨越还很难说。(e.g. BAT一天收的数据量可能比小公司一年多 or 一亿用户数据建立模型的有效性可能和十亿用户数据差不多) 然而，随着机器学习技术成熟, 成本降低, 模型训练效率提升, 人才普及，我估计还会不断地有适合VC的投资机会出现，就像iPhone刚上市时没有Uber和滴滴一样, 新机会总会在时机成熟后出现, 需要的只是时间和用心观察。 P.S. 有不少人问我会不会担心AI发展会毁灭人类。我的统一回答是“现在, 我还看不到在有生之年被机器统治的一天。只希望在那之前，能先有个C-3PO陪我玩玩。” : ) P.P.S. AI的发展还太早太快, 我会努力定期更新观察，顺便打打自己的脸... 哈

- Francis

2016.12.18, in Beijing

本文作者：Francis Kao

本文来源：牛透社

分享到：

声明：本文由入驻牛透社的作者撰写，观点仅代表作者本人，绝不代表牛透社赞同其观点或证实其描述。