简评:「人工智能入门」系列的第一篇,讲解了 AI 、机器学习、深度学习是怎么回事,他们之间的关系,常见的 AI 算法等知识。当有人问你这些概念的时候,你可以通熟易懂地讲解。
本文知识点(想省事就不用往下了):
人工智能(AI)、机器学习(ML)、深度学习(DL)的关系如下,DL ⊆ ML ⊆ AI。
人工智能比喻成的孩子大脑,而机器学习就是让孩子去掌握认知能力的过程,而深度学习是这过程中很有效率的一种教学体系。人工智能是目的,是结果;深度学习、机器学习是方法,是工具。人工智能的概念是在 1955 年提出的;机器学习概念是 1990 年提出的;深度学习概念是 2010 年提出的。深度学习曾经是以机器学习中的「神经网络算法」的身份存在的,随着大数据的爆发,深度学习被单拿出来,成为一种学习思想。
“The last 10 years have been about building a world that is mobile-first. In the next 10 years, we will shift to a world that is AI-first.” (Sundar Pichai, CEO of Google, October 2016)从亚马逊、Facebook、谷歌、微软这些顶级科技公司能都看出,世界上最具影响力的技术公司的领导者都在强调他们对人工智能(AI)的关注。
但是什么是 AI?
为什么 AI 很重要?
为什么 AI 现在正是好时候?
我们对人工智能越来越感兴趣,但该领域主要由专家来理解。本文的目的就是希望「能够用浅显的语言解释 AI」。
先解释 AI 的含义和关键术语。
本文将说明 AI 的最有效的领域之一,「深度学习(Deep Learning)」是如何工作的。
将探索 AI 解决的问题以及它们为什么 AI 很重要。
了解 AI 的历史,为什么 20 世纪 50 年代就有 AI 概念,可等到今天才爆发。
风险投资家,一直努力寻找新的趋势,为消费者和公司创造价值。他们相信 AI 是一种比移动或云计算转变更重要的计算演进。
「这是很难夸大」亚马逊首席执行官杰夫·贝佐斯写道,「在未来20年,AI 将对社会造成巨大的影响」。无论你是消费者、公务员,企业家或投资者,这种新兴趋势对我们所有人都很重要。
什么是 AI?
★ 人工智能:智能程序的科学
(Artificial intelligence: The science of intelligent programs)
1956 年 John McCarthy 创建的「人工智能」(AI)是一个通用术语,指的是表现出智能的行为的硬件或软件。
用 McCarthy 教授的话来说,它是「制造智能机器,特别是智能计算机程序的科学和工程」。
「AI」这个词儿已经存在了几十年,然而,一直以来进步有限,因为解决许多现实世界问题的算法太复杂了。
复杂的活动包括进行医疗诊断,预测何时机器将失效或测量某些资产的市场价值,涉及成千上万的数据集和变量之间的非线性关系。
在这些情况下,很难使用我们最好的数据来「优化」我们的预测。在其他情况下,包括识别图像中的对象和翻译语言,我们甚至不能制定规则来描述我们目标。举个例子:我们怎么能写一套规则,完整地描述一只狗的外观?
如果我们可以降低从程序员到程序的复杂预测(数据优化和特性规范)的难度呢?
这是现代人工智能的关键点。
★ Machine Learning 机器学习:推理 - 知识 - 学习
机器学习(ML)是 AI 的一个子集。所有机器学习是 AI,但不是所有的 AI 是机器学习。「AI」的兴趣在今天表现于人们对「机器学习」的热情,进展迅速且明显。
机器学习让我们通过算法来解决一些复杂的问题。正如人工智能先驱 Arthur Samuel 在 1959 中写道的那样,机器学习是需要研究的领域,它给计算机学习的能力而不是明确地编程能力。
大多数机器学习的目标是为特定场景开发预测引擎。一个算法将接收到一个域的信息(例如,一个人过去观看过的电影),权衡输入做出一个有用的预测(未来想看的不同电影的概率)。
通过计算机学习的能力,通过优化 任务 衡量变量的可用数据,做出算法,来对未来做出准确的预测。
机器通过训练学习。算法最初接收其输出是已知的示例,此时要注意其预测和正确输出之间的差异,并且调谐输入的权重以提高其预测的准确性,直到它们被优化。因此,机器学习算法的定义特征是,它们的预测的质量随着经验而改进。
我们能提供的数据越多(通常达到一个点),就可以创建越好的预测引擎(图 2、图 3 连起来看)
常见的有超过 15 种机器学习方法,每种方法使用不同的算法结构以基于接收的数据优化预测。深度学习最受欢迎,其他的受到较少的关注,但却非常是有价值,它们更适用于广泛的使用情况。
具体的机器学习算法有:
构造间隔理论分布:聚类分析和模式识别人工神经网络决策树感知器支持向量机集成学习AdaBoost降维与度量学习聚类贝叶斯分类器构造条件概率:回归分析和统计分类高斯过程回归线性判别分析最近邻居法径向基函数核通过再生模型构造概率密度函数:最大期望算法概率图模型:包括贝叶斯网和Markov随机场Generative Topographic Mapping近似推断技术:马尔可夫链蒙特卡罗方法变分法最优化:大多数以上方法,直接或者间接使用最优化算法。每种方法都有其优点和缺点,可以使用组合。选择的算法来解决一个特定的问题将取决于因素,包括可用的数据集的性质。在实践中,开发人员倾向于实验来选择采取哪种方法。
机器学习的使用案例根据我们的需求和想象力而有所不同。
使用正确的数据,我们可以构建不同目的的算法,包括:
根据他们以前的购买数据推荐产品;
预测生产线上的机械何时异常;
预测电子邮件是否被误解;
估计信用卡交易是欺诈的概率等等。
★ Deep Learning 深度学习
一般的机器学习 写执行某些任务的程序是很困难的,比如理解语音和识别图像中的对象。
举个例子,如果我们想编写一个识别汽车图像的计算机程序,那么我们就不能指定一个算法来处理汽车的特征,以便在任何情况下都能进行正确的识别。汽车有各种各样的形状、大小和颜色.。他们的位置,方向和姿势可以不同。背景,照明和其他许多因素影响的对象的外观。变量太多,就算是我们硬头皮写了出来,这也不是一个好的可扩展的方案。如此一来,我们就需要为每一种我们要是别的对象单独的写程序。
但是,深度学习(DL),这彻底改变了人工智能的世界。深度学习是一个子集的机器学习。所有深度学习都是机器学习,但并非所有机器学习都是深度学习(图4,下)。
深度学习是很有用的,因为它避免了程序员必须按照特征规范(定义数据中所分析的特征)或优化(如何权衡数据以提供更准确的预测)的任务。(园长:简单说,深度学习让程序员不用看特质和优化)
深度学习是如何实现的?
深度学习模拟大脑,人类大脑会学习来克服困难 :包括理解言语和识别对象,不是通过处理穷举规则,而是通过实践和反馈。就像一个孩子,看到汽车会知道这是汽车,看到图片会知道上面表达的含义。孩子们没有一套详细的规则来学习,孩子们是通过训练而掌握这些的。
深度学习使用相同的方法。基于人工和软件的计算单元,其近似脑中的神经元的功能被连接在一起。
它们形成一个「神经网络」,它接收一个输入(继续我们的例子,一辆汽车的图片),分析;他做出判断并被告知自己的判断是否正确,以此来训练。如果输出是错误的,神经元之间的连接由算法调整,这将改变未来的预测。最初网络将错误多次。
在数百万的例子中,神经元之间的连接将被调整,实践使其逐渐完善,一步步接近完美。
通过深度学习 DL 我们现在可以:
识别图片中的元素;
实时翻译语言;
使用语音来控制设备(通过 Apple 的 Siri,Google Now; Amazon Alexa 和 Microsoft Cortana);
预测遗传变异如何影响 DNA 转录;
分析客户评论中的情绪;
检测医学图像中的肿瘤;其他更多可能性。。。深度学习将程序员从复杂的问题处理中解放出来,为一系列重要问题提供了成功的预测的工具。
原文:The fourth industrial revolution: a primer on Artificial Intelligence (AI)接下来我将会讲解:如何让深度学习 DL 工作?为什么 AI 如此重要?为什么 AI 在这个时间点爆发?接下来的世界又会怎样改变?
不想错过精彩内容?
欢迎关注知乎专栏:「极光日报」,每天导读三篇优质英文文章。