更新时间:2019-07-08 浏览量1976
如果你是一名企业主管(而不是数据科学家或机器学习专家),你可能已经从主流媒体的报道中接触过人工智能。你可能在《经济学人》和《名利场》读过相关文章,或读过有关Tesla自动驾驶的故事,或史蒂芬·霍金写AI对人类的威胁的文章,甚至还看过有关人工智能和人类智能的讽刺漫画。 所以,如果你是关心你的企业发展的高管,这些有关AI的媒体报道可能会引出两个恼人的问题: 第一,AI的商业潜力是真是假? 第二,AI如何应用于我的产品? 第一个问题的答案是肯定的,AI具有商业潜力。今天,企业已经能应用AI改变需要人类智能的自动作业流程。AI能让人力密集型企业处理的工作量增加100倍,同时把单位经济效益降低90%。 回答第二个问题需要多一点时间。首先,我们必须消除主流媒体宣传的AI神话。只有消除这些误解,你才能对怎样应用AI到你的业务中有一个框架。
神话1:AI是魔术
许多主流媒体把AI的描述得想魔术一般神奇,好像我们只需要对谷歌、Facebook、苹果、亚马逊和微软这些大公司的高级魔术师使劲鼓掌。这种描述是帮倒忙。如果我们希望企业采用AI,那么我们就需要让企业家们理解AI。AI并不是魔术。AI是数据、数学、模型以及迭代。要想让AI为企业接受,我们需要更加透明,以下是3个有关AI的关键概念的解释:
训练数据(TD):训练数据是机器学习的初始数据集。训练数据包括输入和预回答输出,所以机器学习模型能够为任何给定输出寻找模式。例如,输入可以是带有客户和企业支持代表(CSR)间的电子邮件线程的客户支持ticket,输出可以是基于企业特定分类定义的从1到5的分类标签。
机器学习(ML):机器学习是能从训练数据中学习模式,并让这些模式应用于新的输入数据的软件。例如,接收到带有客户和CSR间的电子邮件线程的一个新的客户支持ticket时,机器学习模型能预测它的分类,并告诉你它对这个预测的置信度。机器学习的主要特点是它学习新的、而非适用固有的规则。因此,它能通过消化新的数据调整自己的规则。
Human-in-the-Loop(HITL):Human-in-the-Loop是AI的第三个核心要素。我们不能指望机器学习模型绝对可靠。一个好的机器学习模型可能只有70%的准确率。因此,当模型的置信度较低时,就需要人使用Human-in-the-Loop作业流程。
所以,不要被AI是魔术的神话所迷惑。理解AI的基础公式是:AI=TD+ML+HITL。
神话2:AI只为技术精英专属
媒体报道很容易让人产生一种错觉,就是AI只属于技术精英——大公司例如Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber——只有它们能够组建大型机器学习专家团队,并获得亿美元级的投资。这种观念是错的。
今天,不用10万美元就能着手应用AI到你的业务中。所以,如果你是美国收益大于5000万美元的26000家企业之一,你就可以把收益的0.2%投资于AI应用了。
所以,AI不是技术精英专属。它属于每个企业。
神话3:AI只为解决十亿美元级别的问题
主流媒体的倾向于报道未来主义的事物,例如自动驾驶汽车或用于运送快递的无人飞机。像Google,Tesla,Uber这些公司由于“赢者通吃”的心态,为了抢占未来无人车市场的龙头老大地位,已经投资进去数百亿美元。这些给人的印象是AI只用于解决十亿美元级别的新问题。但这又是一个错误。
AI也应用于解决现存的较小的问题,例如百万美元级别的问题。让我解释一下:任何一个企业的核心需求都是理解客户。从古希腊的agora市集和古罗马的个人买卖广场就是如此。今天也是如此,哪怕生意买卖爆发性地转移到了互联网上。许多企业坐拥来自客户的非结构化数据宝藏,这些数据来自电子邮件线程或Twitter评论。AI能应用于这些分类支持ticket的挑战,或用于理解推文情绪。
所以,AI不仅能应用于十亿美元级别的令人兴奋的新问题,例如自动驾驶汽车。AI也用于现存的“无趣”的小问题,例如通过支持ticket分类或社交媒体情绪分析更好地理解客户。
神话4:算法比数据更重要
主流媒体中有关AI的报道倾向于认为机器学习算法是最重要的要素。它们似乎把算法等同于人类大脑。它们暗示正是算法让魔术发生作用,更精细复杂的算法能超越人类大脑。有关机器在国际围棋和象棋中战胜人类的报道就是例子。媒体关注的是“深度神经网络”、“深度学习”以及机器如何做决定。
这样的报道可能带给企业这样的印象:想要应用AI,他们得先聘请到机器学习专家来建一个完美的算法。但假如企业不考虑怎样获得更高质量、更大量的定制训练数据以让机器学习模型学习,就算有了完美的算法也可能得不到理想的效果(“我们有超棒的算法”和“我们的模型只有60%的准确率”间的落差)。
从Microsoft,Amazon和Google这些公司购买商用机器学习服务,却没有一个训练数据规划或预算,就好比买了一辆汽车,却没法到达加油站。你只是买了一大块很贵的金属而已。汽车和汽油的类比虽然不够恰当,因为如果你给机器学习模型补给越多的训练数据,模型就能变得越好。这就像汽车每用完一箱汽油,积累的里程数越大。所以训练数据甚至比汽油更重要。所以,训练数据的质量和数量至少是与算法同等重要的。
神话5:机器>人
过去30年来,媒体一直喜欢把AI描述为比人类强大的机器,例如《终结者》的施瓦辛格和《Ex Machina》的Alicia Vikander。媒体这样做也可以理解,因为媒体想建立起机器和人类之间谁会赢的简单叙述结构。但是,这和实际情况不符。
例如,最近Google的DeepMind/AlphaGo战胜李世石的新闻被媒体简单描述成机器战胜了人类。这是不准确的,真实情况不是这样简单。更准确的描述应该是“机器联合许多人战胜了一个人”。
消除这种误解的核心理由是机器和人类具有互补的能力。请看上图。机器的特长是处理结构化计算,他们会在“找出特征矢量”任务上表现良好。而人类的特长是理解意义和上下文,他们在“找出豹纹连衣裙”任务上表现良好,让人类做“找出特征矢量”的任务就不那么容易了。
因此,对企业来说正确的框架是实现机器和人的互补,AI是机器和人的共同工作。
神话6:AI就是机器取代人类
主流媒体喜欢描绘反乌托邦的未来,因为它们认为这能吸引眼球。这样或许确实能吸引读者眼球,但是,它对真正理解机器和人类如何共同工作没有一点帮助。
例如,让我们再回到企业分类支持ticket的业务上来。在现今的大多数企业,这还是100%人工的过程。所以,这个过程又慢成本又高,能做的数量受到限制。假设你在分类了10000个支持ticket之后得到了一个准确率为70%的模型。30%的时候结果错误,但这时Human-in-the-loop就可以介入了。你可以把可接受置信度设置为95%,只接受置信度是95%或高于95%的输出结果。那么机器学习模型最初就只能做一小部分工作,比如说5%-10%。但是当模型得到新的人工标记数据时,它就能学习、进步。因此,随着时间的推移,模型能处理更多的客户支持ticket分类工作,企业也能大大增加分类的ticket量。
所以,机器和人联合可以增加工作量,同时保持质量,降低重要业务的单位经济效益。这就消灭了机器取代人类的AI神话。真相是,AI是机器强化人类。
神话7:AI=ML
主流媒体有关AI的最后一个神话是把人工智能和机器学习当做一回事了。这可能让企业管理层以为只要买下Microsoft,Amazon或Google的某个商用机器学习服务就能把AI转变为产品。
实现一个AI解决方案,除了机器学习,你还需要训练数据,需要human-in-the-loop。缺了训练数据的机器学习就像没汽油的汽车,虽然很贵,但去不到任何地方。缺了human-in-the-loop的机器学习也会导致不良后果。你需要人去推翻机器学习模型低置信度的预测。
交通运输方面肯定会有很大的转变,从现在的人工驾驶逐步转换成以后的无人驾驶。现在在美国硅谷就时常可以见到那些无人驾驶的车投入使用了,不仅是无人驾驶的汽车,飞机也可以利用无人驾驶技术翱翔在天空中,饿了么商业用途的小型无人机已经开始送外卖了。所以在交通上,肯定会有着一大转变。 医疗方面也肯定会有着巨大的差距。人工智能通过自动浏览用户的病情将自动化进行诊断,同时,可穿戴医疗设备,移动应用,都能够让我们在未来的人工智能医疗方面更进一步。在轮椅、智能骨骼等方面也能能够进一步的提升。 安全方面人工智能在未来必定也是不可少的一份子。在未来人工智能在治安方面将会成为非常重要的一份子,无论是从监控上的人脸识别技术还是从未来的机器人警察法官等都会有着重要的地位。在目前人脸识别技术已经用在了大部分的摄像头上,对警察在寻找嫌疑人方面有着巨大的帮助,相信在未来人工智能对于警察会有更大的帮助。