服务机器人的爆发即将到来,没有情感的机器人终将被淘汰

竹间智能 | 2017-10-11

编者按:针对近来服务机器人的快速发展,竹间智能创始人、CEO简仁贤近日撰写署名文章指出,服务机器人必须同时发展“智商”与“情商”。只有使服务机器人“拟人化”后才能更好地融入人类的使用场景,服务于人。

人机交互对服务机器人的重要性

我们从什么开始讲起?就从我们做的两件事开始讲起,怎样让人类对机器人产生信任?其实不能产生信任就等于说是不能交互的,不能交互那么用户就不会再买你的机器,不再使用你的服务。那怎样才能让人信任机器人?最重要的是赋予机器情商和智商。情商为什么重要?如果没有产生情感连接,不能理解人的情感,这个机器人永远是冷冰冰的,这样的机器人是无法和人产生互动的。五十多年前就有人在研究聊天机器人,为什么到现在聊天机器人都产生不了商业上的效果,一直帮助不了服务机器人,因为它不具有情感。可能具有情感也不够,别人可能觉得你很逗,很逗能做什么?什么也做不了,所以一定要有用,一定要具备智商。智商是什么?智商是知识,是能够为人类完成任务,是能理解人类讲话的意思。

所以我们想重新定义的是,语音不是一个交互,当我喃喃自语时里面并没有语言,像一个小孩子发出很多声音,但没人听得懂他在讲什么。但是我学了语言之后,再向大家表达我的意思,大家可以理解。但是还不够,我为什么讲这句话?我讲这句话的意图是什么?对于你的反应 我的感觉是什么?这就是对情绪情感和意图的理解,这是很重要的。

不能理解,服务机器人就无法和人产生互动

为什么这么说?因为在历史上人类对服务机器人的理解是从助手到陪伴,最后到伙伴的一个过程。在过去的一段时间里面,机器人给人的感觉都是像工业机器人一样,冷冰冰的。是的,它可以帮你做东西,这是非常好的,因为机器人必须要可以做一些事情,但是让人能感觉到对生活上各个场景都有帮助,他必须学会和人互动。没有互动的机器人是没有用的,我经过虹桥机场乘坐航班,在办理登机时都会有一个东东(东航服务机器人),我在那边观察了很久,很多人就拍拍头就走了,没有人跟他对话。

理解人的情绪就要有情感,李飞飞教授也说:“下一步AI的发展需要加强对情感情绪的了解,要走进认知。”理解讲话的意思,理解你讲话的意图,可以达到沟通上双向的效果,这是非常重要的。其实早在2015年竹间就在对情感的理解上去发力,今年国务院也推出了人工智能的发展规划,我非常欣慰看到这句话:可以理解人的需求,实现情感交流和需求满足的良性循环。”

理想机器人

大家都认识哆啦A梦,他是一个善解人意可以和人一起成长的机器猫,他有一个百宝袋也可以帮助人类,这才是人类理想中的机器人。这种概念已经存在很久了,但是这个概念能不能实现呢?如何实现?坦白说开放式领域聊天是非常难的,目前是达不到的。以前我在微软工作十多年,最后领导团队做了微软小冰,所以我也得出一些经验。如何把人机交互、语义理解产生商业价值,如何在生活中产生价值,那就要从意图从情绪的理解去着手,从场景去着手,从特定的领域着手。无法从开放式领域着手,在开放领域达到聊天效果这是不切实际的。我们做的是把情感计算和人工智能结合,“无情感就没有智能”这也是我们一直追求的方向。我们常说人擅长的是什么,可能是模糊的问题,可能是多重意思的问题,推理能力、情绪的能力、意图的理解。机器擅长的是人脸识别、人脸验证、记忆和海量的知识、做搜索做整理,这只是一部分。

技术边界

我们可以看到,一般来讲技术边界,左边是属于认知的部分,只有人会做。右边是感知的部分,比较死板的部分机器会,但是竹间不这么认为,我们认为这条技术边界的线要往左边挪 ,让机器也可以擅长人擅长的事情,进而能够出现真正帮人服务的机器人,如果没有认知,包括李飞飞教授和国务院发展规划都有提到,认知和情绪理解是很重要的,做到这两点服务机器人才能达到全方位的服务。刚才讲了为什么需要情感情绪,为什么需要好的人机交互。如何做到?下面这几点会是非常大的挑战。

第一点在智商方面,强大的语义理解能力,竹间使用独创的一个算法,把深度学习、语言结构学、心理学、认知模型结合在一起,把整个语义理解做得深入,在这个基础之上去理解意图。去理解上下文,在这个基础之上能够记忆对话,能够理解人的情绪,对话理解是超越传统NLP,现在NLP不是人机交互,那叫自然语言处理,人机交互是自然语言理解+自然语言生成+自然语言控制等等,再加上一些认知学。 只有NLP无法达到交互的作用,这会是很大挑战。

另外怎么分辨用户情绪?一问一答或者被动问答是没有办法产生效应的,因为很多时候当一个人站在服务机器人面前能够说什么话,很多人其实是不知道的,所以就只能拍拍头。他不知道,或者问了一句话机器人不会回答就拍拍头,服务机器人就无法产生交互。重要的就是情绪理解,你可以主动对话,机器人能识别人类的情绪,会主动开始对话。“小朋友你好开心啊!”“美女你好漂亮!”这是主动对话交流,也更像人之间的交流。所以竹间做的是模拟人和人交流,不是说一定和人一模一样,但是要拟人化,如果没有办法识别情感情绪,从语音从图像从表情无法识别情绪,这个服务机器人就是不懂人的,所以它没有什么用处。你没有办法识别,最后变成冷冰冰的机器人而已。所以我们渴望的是能够人机交互的能够理解的机器人,当然这是很难的,所以我们要做的就是让机器人可以读懂、听懂、看懂,只有靠文字只有靠语音只有靠图像,没有集成是达不到多样的效果的。我们在做的事情是希望得到双向的效果,一个多模态的效果,跟人有更多的交互,做到这个很难。不是一个算法一个技术就可以解决,当然我们有很多算法有很多技术但这样还不够。这就是我们为什么除了技术人员还有产品经理、产品设计和大量工程人员。我们希望可以规模化,可以让它落地。

如果只有算法那是学术机构,那不是创业公司。创业公司最重要的是就是技术落地,把技术转化成商业价值,把商业价值转换成资金,再把资金投入技术,如果只会做算法那真的只能叫学术机构。创业公司就是要落地,要场景,场景就是需要产品经理,场景就是需要工程师,不是只有算法,需要全面需要场景化。我们做的部分其实是语言,所有理解都在语言里面而不是语音,语音已经很成熟了。代表的情绪,代表的意思,代表的意图,都是通过语言来处理。同时可以记忆人类的话,从而帮人类完成任务,是给人一些咨询还是给人一些生活辅助,还是给人一些提醒。这个就是机器人要做的。

我们能提供的是什么?

我们希望为服务机器人行业尽一份力,希望为服务机器人这个系统里提供一个大脑,一个可以交互的大脑,让机器人具有温度,让机器人跟人产生粘性,不论是主动对话也好,还是被动服务也好,都能够去达到希望得到的效果。怎么去拓展?第一个就是多模态认知,还有就是更有用。我们得到一些服务机器人需求都是场景化的,没有人说我要买一个机器人他要是多用途的,这个需求目前是不存在的。特定功能、特定场景、特定地区、特定项目,这样才能让服务机器人热起来,不是一次卖一台两台三台,而是一千台。如果机器人具有这种交互,它可以定制,而且可以跟人有双向交互。同时这也是可以达到的。

所以我相信在未来三到五年,服务机器人是可以蓬勃发展的,那我们愿意尽的一份力就是,让机器人拥有一个可以交互的大脑,具备真正的交互能力,今天我们讲我们处在曲线上这样一个地方,八万十万十几万一台的机器人,它的用户体验也是非常差的,很多都只是展示用,我们希望未来能够达到引爆点,以后交互越来越好,体验越来越好。以后机器人的价格会一直降低,但机器人的体验会一直升高,代表机器人的接受度也在提高,是可以达到千亿美元的市场。完成这些事情最重要的是用户体验,在特定场景的用户体验一定要做的深,因为每个场景都是不同的,需求也是不同的,不一定是说每一个场景机器人都要会移动。

竹间的愿景

每个人都可以有一个哆啦A梦,每个行业都可以有自己的机器人,超市的机器人、机场的机器人、卖家具的机器人、各行各业的机器人。我们在和金融、电商以及很多传统行业在合作,我们就是希望把各行各业连接起来,能够让机器服务于人,最后无论你做什么都有机器人帮你,这就是我们的愿景。希望我们能够帮助到服务机器人。也希望能为这项事业尽自己一份力。