导航菜单

未来的AI助手将语音技术提升到新水平的5种方式

自Siri于2011年在iPhone 4s上首次亮相以来,语音助手已从不可行的gi头转变为六分之一的美国家庭中发现的智能扬声器技术的基础。

“在Siri之前,当我谈论[我要做的事情]时,总是茫然无措。” Nuance Communications的创新主管Tom Hebner开发最先进的AI语音技术的告诉Digital Trends。人们会说,'您是否构建了那些可怕的电话系统?我恨你。' 那是人们与语音技术唯一的互动。”

今天已不再如此。 根据eMarketer的预测,到2020年,将有近1亿智能手机用户使用语音助手。但是,尽管AI助手不再是新奇事物,但我们仍处于其发展的起点。要完全实现语音助手作为产品类别的承诺,还有很长的路要走。

可以通过以下五种方式改进技术,使其变得更智能,更高效-从而帮助我们过上更有生产力的生活。将它们称为“预测”或“愿望清单”,这些都是需要解决的挑战。

莫的知识,更少的问题

Alexa可以告诉您马来西亚吉隆坡的天气;您将获得720南非兰特的总金额,以及如何拼写“反政府主义”。但从本质上讲,消费者AI助手是具有全套最新百科全书的人的数字等效物。您(希望)获得了正确的信息,但是那里没有专业级别的专业知识。

赫伯纳告诉《数字趋势》:“您家中的系统所面临的挑战是,他们正在尝试做各种各样的事情。”

这是一个很难解决的问题,但这样做将改变游戏规则。Nuance针对一个特定的用例开发了许多专业系统,例如帮助航空公司客户回答查询或医生做笔记。这样做不仅意味着这些系统可以深入挖掘以获取更多详细信息,而且还意味着可以吸收更多的情报。“人们对于能够理解单词的计算机感到非常兴奋,但是如果您不理解,这并不一定重要希伯纳说。

他举的一个例子是Nuance系统,该系统不仅可以理解医生何时读出患者的潜在药物清单,还可以指出潜在的冲突。这远远超出了大多数用户级AI助手的功能。

但是,更专业地了解不同领域(Alexa Skills暗示了这一点)可能会带来变革。询问智能扬声器的法律或医疗建议,听起来很疯狂。但是法律机器人等领域取得了非凡的进步,而最近发布的一份报告显示,苹果希望Siri能够在2021年之前与用户进行以健康为中心的对话。

尽管最近Voicebot.ai的报告显示,但AI助手的专业知识图目前仍是科幻梦stuff以求的东西显示了虚拟助手技能的发展速度。但是,当技能进入专业领域时,我们将大饱口福!

更多(更好)的个性化

当今智能扬声器的个性化仍处于起步阶段。您可以更改语音助手的口音和性别,添加或删除技能,并向其提供诸如您的姓名和工作地点之类的信息。在某些情况下,您可以设置多个语音配置文件,以便Google Home识别您的家庭成员。

亚马逊回声秀

但是还有很长的路要走-尽管榨汁应该值得。Mattersight公司已经开发了称为呼叫行为路由的 AI呼叫中心技术,该技术可以分析呼叫者的语音模式,并将其与具有兼容个性类型的人工人员匹配。据该公司称,匹配具有兼容个性的人将导致成功呼叫的时间仅持续一半,仅次于具有冲突性格类型的人。

使用类似的方法可能会导致AI助手以您喜欢的方式与您交流。这可能与匹配与之交谈的人的口音和语音音量一样简单。或者,它可能通过对某些用户使用更具情感色彩的单词,而不是对其他用户使用更密集的详细信息,来改变解决想法的方式。也许有些人希望语音助手进行长时间的聊天,而另一些人只是希望一个人以尽可能简洁的方式传达必要的信息。人工智能助手应具备两者的能力。

Google Duplex等技术展示了AI生成的合成语音和对话的准确程度令人信服。随着AI进入比发出歌曲请求和食物计时器更为复杂的领域,人们希望看到这项技术发挥重要作用。

可以通过语音识别用户的能力取得突破来帮助实现这一目标。Hebner指出,Nuance的技术可以仅一秒钟的音频来识别用户。他说:“过去通常需要10秒钟才能了解您的身份,并获得准确的信号。” “那的力量是巨大的。” 能够通过一小段语音识别用户即可解决密码问题,并为使用语音助手获取更精细的机密信息提供了机会。

积极主动

当您要求一个好的助手时,他们会做某事。一位出色的助手无需询问。目前,人工智能助手仍处于第一阶段。用户可以获取所需的歌曲或所需的提醒,但通常只有在明确要求时才能获取。随着人们对语音助手的适应程度提高,他们有很大的机会从纯粹的被动设备转变为主动设备。

人们是否愿意将某些工作移交给机器存在很大的疑问。

您对AI助手代表您做出决策的感觉如何?这些可能是任何事情,例如当有人说他们很冷时调高恒温器,或者因为您迟到而重新预订午餐会,或者勉强您做更多的运动或在节省薪水方面变得更好。随着越来越多的智能设备进入家庭,语音助手可以想象的命令数量将大大增加。

这部分是一个社会问题,即人们对机器做出决策的舒适程度如何。人们是否愿意将某些工作移交给机器存在很大的疑问。可以将其想象成将您的信用卡和房门钥匙交给有血有肉的助手-只需洒上更多的天网即可。不利的一面是放弃了一定程度的控制权。潜在的好处是增加了您的空闲时间。当然,存在很大的技术挑战……

都是关于反馈的

汤姆·赫布纳(Tom Hebner)指出了主动性问题的一大挑战:我们的机器如何正确地知道它们何时正确?回到好助手与好助手的想法,一位好助手可能会在大型会议之前将所有文件都删除,而无需询问。但是,如果它们是错误的文件怎么办?使家庭AI助手更加主动的一个大问题是,目前只有很少的方法来揭示我们是否获取信息是正确的信息。

AI是机器人的好辣椒

大umi智宏/盖蒂图片社

“如果我每天走进屋子时都要求同一首歌,然后又走进去并且刚开始播放,那他们怎么知道他们做对了呢?” 赫布纳说。“如果我不停止播放,那是不是对?如果我确实说“停止”,这是否意味着它做错了,并且永远不要再做一次?反馈机制是您无法获得更主动的系统的原因之一。”

对于工程师来说,这是一个挑战。曾经有实习生要求他们提供每项任务的指导和反馈的人都知道,有时候自己做一件工作比委派工作要容易得多。人工智能助手在那里使您的生活更加顺畅;不要每天给您进行数十次小型调查,以确认它是否做对了。这将需要以不损害这些设备的用户友好性的方式解决,并且不需要在系统学习您的喜好之前进行大量的培训。

答案是什么?我不确定。但是,正如史蒂夫·乔布斯(Steve Jobs)曾经说过的那样,弄清楚这不是客户的工作。

新的互动方式

2001年的一个场景是:太空漫游,其中令人发指的仍是历史上最著名的虚构AI助手的凶猛的HAL 9000揭示了它不仅使用麦克风来确定要对它说什么。当两名机组人员尝试选择他们知道HAL不会听到的讲话位置时,HAL会根据阅读他们的嘴唇动作来表明他仍然可以理解他们。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。