未来的AI助手将语音技术提升到新水平的5种方式

自Siri于2011年在iPhone 4s上首次亮相以来，语音助手已从不可行的gi头转变为六分之一的美国家庭中发现的智能扬声器技术的基础。

“在Siri之前，当我谈论[我要做的事情]时，总是茫然无措。” Nuance Communications的创新主管Tom Hebner开发最先进的AI语音技术的告诉Digital Trends。人们会说，'您是否构建了那些可怕的电话系统?我恨你。' 那是人们与语音技术唯一的互动。”

今天已不再如此。根据eMarketer的预测，到2020年，将有近1亿智能手机用户使用语音助手。但是，尽管AI助手不再是新奇事物，但我们仍处于其发展的起点。要完全实现语音助手作为产品类别的承诺，还有很长的路要走。

可以通过以下五种方式改进技术，使其变得更智能，更高效-从而帮助我们过上更有生产力的生活。将它们称为“预测”或“愿望清单”，这些都是需要解决的挑战。

莫的知识，更少的问题

Alexa可以告诉您马来西亚吉隆坡的天气;您将获得720南非兰特的总金额，以及如何拼写“反政府主义”。但从本质上讲，消费者AI助手是具有全套最新百科全书的人的数字等效物。您(希望)获得了正确的信息，但是那里没有专业级别的专业知识。

赫伯纳告诉《数字趋势》：“您家中的系统所面临的挑战是，他们正在尝试做各种各样的事情。”

这是一个很难解决的问题，但这样做将改变游戏规则。Nuance针对一个特定的用例开发了许多专业系统，例如帮助航空公司客户回答查询或医生做笔记。这样做不仅意味着这些系统可以深入挖掘以获取更多详细信息，而且还意味着可以吸收更多的情报。“人们对于能够理解单词的计算机感到非常兴奋，但是如果您不理解，这并不一定重要希伯纳说。

他举的一个例子是Nuance系统，该系统不仅可以理解医生何时读出患者的潜在药物清单，还可以指出潜在的冲突。这远远超出了大多数用户级AI助手的功能。

但是，更专业地了解不同领域(Alexa Skills暗示了这一点)可能会带来变革。询问智能扬声器的法律或医疗建议，听起来很疯狂。但是法律机器人等领域取得了非凡的进步，而最近发布的一份报告显示，苹果希望Siri能够在2021年之前与用户进行以健康为中心的对话。

尽管最近Voicebot.ai的报告显示，但AI助手的专业知识图目前仍是科幻梦stuff以求的东西显示了虚拟助手技能的发展速度。但是，当技能进入专业领域时，我们将大饱口福!

更多(更好)的个性化

当今智能扬声器的个性化仍处于起步阶段。您可以更改语音助手的口音和性别，添加或删除技能，并向其提供诸如您的姓名和工作地点之类的信息。在某些情况下，您可以设置多个语音配置文件，以便Google Home识别您的家庭成员。

亚马逊回声秀

但是还有很长的路要走-尽管榨汁应该值得。Mattersight公司已经开发了称为呼叫行为路由的 AI呼叫中心技术，该技术可以分析呼叫者的语音模式，并将其与具有兼容个性类型的人工人员匹配。据该公司称，匹配具有兼容个性的人将导致成功呼叫的时间仅持续一半，仅次于具有冲突性格类型的人。

使用类似的方法可能会导致AI助手以您喜欢的方式与您交流。这可能与匹配与之交谈的人的口音和语音音量一样简单。或者，它可能通过对某些用户使用更具情感色彩的单词，而不是对其他用户使用更密集的详细信息，来改变解决想法的方式。也许有些人希望语音助手进行长时间的聊天，而另一些人只是希望一个人以尽可能简洁的方式传达必要的信息。人工智能助手应具备两者的能力。

Google Duplex等技术展示了AI生成的合成语音和对话的准确程度令人信服。随着AI进入比发出歌曲请求和食物计时器更为复杂的领域，人们希望看到这项技术发挥重要作用。

可以通过语音识别用户的能力取得突破来帮助实现这一目标。Hebner指出，Nuance的技术可以仅一秒钟的音频来识别用户。他说：“过去通常需要10秒钟才能了解您的身份，并获得准确的信号。” “那的力量是巨大的。” 能够通过一小段语音识别用户即可解决密码问题，并为使用语音助手获取更精细的机密信息提供了机会。

积极主动

当您要求一个好的助手时，他们会做某事。一位出色的助手无需询问。目前，人工智能助手仍处于第一阶段。用户可以获取所需的歌曲或所需的提醒，但通常只有在明确要求时才能获取。随着人们对语音助手的适应程度提高，他们有很大的机会从纯粹的被动设备转变为主动设备。

人们是否愿意将某些工作移交给机器存在很大的疑问。

您对AI助手代表您做出决策的感觉如何?这些可能是任何事情，例如当有人说他们很冷时调高恒温器，或者因为您迟到而重新预订午餐会，或者勉强您做更多的运动或在节省薪水方面变得更好。随着越来越多的智能设备进入家庭，语音助手可以想象的命令数量将大大增加。

这部分是一个社会问题，即人们对机器做出决策的舒适程度如何。人们是否愿意将某些工作移交给机器存在很大的疑问。可以将其想象成将您的信用卡和房门钥匙交给有血有肉的助手-只需洒上更多的天网即可。不利的一面是放弃了一定程度的控制权。潜在的好处是增加了您的空闲时间。当然，存在很大的技术挑战……

都是关于反馈的

汤姆·赫布纳(Tom Hebner)指出了主动性问题的一大挑战：我们的机器如何正确地知道它们何时正确?回到好助手与好助手的想法，一位好助手可能会在大型会议之前将所有文件都删除，而无需询问。但是，如果它们是错误的文件怎么办?使家庭AI助手更加主动的一个大问题是，目前只有很少的方法来揭示我们是否获取信息是正确的信息。

AI是机器人的好辣椒

大umi智宏/盖蒂图片社

“如果我每天走进屋子时都要求同一首歌，然后又走进去并且刚开始播放，那他们怎么知道他们做对了呢?” 赫布纳说。“如果我不停止播放，那是不是对?如果我确实说“停止”，这是否意味着它做错了，并且永远不要再做一次?反馈机制是您无法获得更主动的系统的原因之一。”

对于工程师来说，这是一个挑战。曾经有实习生要求他们提供每项任务的指导和反馈的人都知道，有时候自己做一件工作比委派工作要容易得多。人工智能助手在那里使您的生活更加顺畅;不要每天给您进行数十次小型调查，以确认它是否做对了。这将需要以不损害这些设备的用户友好性的方式解决，并且不需要在系统学习您的喜好之前进行大量的培训。

答案是什么?我不确定。但是，正如史蒂夫·乔布斯(Steve Jobs)曾经说过的那样，弄清楚这不是客户的工作。

新的互动方式

2001年的一个场景是：太空漫游，其中令人发指的仍是历史上最著名的虚构AI助手的凶猛的HAL 9000揭示了它不仅使用麦克风来确定要对它说什么。当两名机组人员尝试选择他们知道HAL不会听到的讲话位置时，HAL会根据阅读他们的嘴唇动作来表明他仍然可以理解他们。

相关推荐：