百度中的语言对话产品设计针对用户表达的5个特点(干货)

语音交互已然成为当下多数软硬件的标配,虽然多数产品在语音场景使用起来逃脱不了“智障”的表现,但在垂直细分领域并且与场景有效匹配时,语音交互的“类模板式”对话仍能给用户带来一些新鲜的可满足需求的体验。那么,用户在使用语音对话类产品时,有哪些独特的行为习惯呢?

在实际的语音对话产品工作中,通过观察法、实验法发现、总结、提炼用户表现出来的行为,从而更好地指导产品体验设计。

特点1:五花八门的唤醒词

如果你的语音对话产品不是百度系、小米系、华为系,那么你会惊奇地发现,仍有部分用户在使用“小度 小度”“小爱 小爱”“小艺 小艺”,亦或是阿里系的“天猫精灵”……这些市面上常见大厂的智能软硬件唤醒词,耳濡目染,致使少数用户习惯性地使用它们而非你设定的独家特有的唤醒词。

关于唤醒词的设计,可以参照早期

科普文:智能音箱的唤醒词是怎样诞生的?

一、什么是“唤醒词”以及它为什么重要?

1.“唤醒”和“唤醒词”

在讨论名字之前,首先对语音交互过程中的一些定义做一个简单的介绍。

据笔者解,语音交互的过程与平时人与人之间交流的方式非常相似,有问有答。比如某个阴天,你对同事呼喊称:“小明”,小明听到了抬头看你表示在听,你接着问“今天会下雨么?”小明打开手机查了一下今天的天气预报,然后回答你说“天气预报说下午3-4点有雷阵雨”。

智能音箱亦如此,其语音交互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤醒是每一次用户与语音产品交互的第一个接触点,唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。

同时,尽管是“智能”语音交互产品,机器仍没有人类聪明。据笔者解,对于目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,即所谓的“唤醒词”。

同样是上文所提到的“问天气”案例。通过呼喊“小明”的名字,来引起他的注意,而对于智能语音交互产品,也需要通过叫出“名字”,也就是唤醒词来激活设备。以智能音箱产品为例,“小度小度”是唤醒渡鸦raven H的唤醒词,“Hey Google”是唤醒Google Home的唤醒词,“Alexa”是唤醒Echo的唤醒词。

科普文:智能音箱的唤醒词是怎样诞生的?

2. “唤醒词”对用户体验的影响

据笔者解,影响语音唤醒体验的因素包含两个维度——输入和输出。输入环节的影响因素包括唤醒词、唤醒方式,输出环节的影响因素包括唤醒响应速度、唤醒反馈方式、唤醒成功率和误唤醒率。

而对于用户来说,唤醒词是语音唤醒输入环节中较为重要的影响因素,且一个好的唤醒词,会直接影响唤醒率。

科普文:智能音箱的唤醒词是怎样诞生的?

二、怎样设计一个好的“唤醒词”?

针对唤醒词,主要通过以下两个实验进行了研究:

  • 实验一:现有唤醒词组合方式研究;
  • 实验二:唤醒词语音要素研究。

实验一:现有唤醒词组合方式研究

首先,对市场上各类语音交互设备唤醒词的组合方式进行拆解,发现唤醒词均是在一个简单“名字”的基础上加以变化而构成,此外,“名字”本身也具备不同的构成方式。在实验中,为用户提供不同组合方式的唤醒词,由用户根据其个人喜好程度在5点量表上进行评价(1-非常不喜欢、2-不喜欢、3-一般、4-喜欢、5-非常喜欢)。

科普文:智能音箱的唤醒词是怎样诞生的?

实验结果表明,不同组合方式下,用户的喜好程度不同:

1)在以“名字”为基础的不同组合方式中,“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢。

科普文:智能音箱的唤醒词是怎样诞生的?

2)另外,就“名字”本身而言,“小+字”的名字最受用户喜欢。这点也与汉语人名命名习惯相符,《汉语人名用字的统计分析(郑淑花,2010)》显示,“小”字在人名命名十大常用字之中。

科普文:智能音箱的唤醒词是怎样诞生的?

实验二:唤醒词语音要素研究

据笔者解,音节是听觉上最容易分辨出来的语音单位,也是最自然的语音单位,汉字中一个汉字读音就是一个音节,每个基本音节都是由声调、声母和韵母三个部分构成。

科普文:智能音箱的唤醒词是怎样诞生的?

理想条件下,对唤醒词每一音节的声调、声母、韵母进行研究,但是由于音节数的增加,研究变量数将大幅度增长,导致无法通过一次实验来完成。

另外,通过文献查阅,发现人们在起汉语人名时,会将尾音节的发音情况列入考量,同时,汉语人名/宠物名统计研究中也多见其对尾音节发音情况的统计。

因此,综合文献和前文实验的结论,本次实验中以唤醒词尾音节为研究对象,选取“小+字”的构词结构,变换尾音节,进行唤醒词的发音偏好实验。同时为避免用户受汉字本身字义的影响,实验中用户看到的唤醒词均为标有声调的拼音。在实验中,要求用户根据其个人喜好程度在5点量表上对唤醒词进行评价(1-非常不喜欢、2-不喜欢、3-一般、4-喜欢、5-非常喜欢)。

科普文:智能音箱的唤醒词是怎样诞生的?

实验结果表明:

科普文:智能音箱的唤醒词是怎样诞生的?

1)声调方面,用户最喜欢阴平(1声);另外相较“仄声”(3声上声、4声去声统称为“仄”),用户更加喜欢“平声”(1声阴平、2声阳平统称为“平”)。

科普文:智能音箱的唤醒词是怎样诞生的?

2)声母方面,用户更加喜欢尾音声母为零声母,而包含了z、c、s的舌尖前音最不被用户所喜欢。

科普文:智能音箱的唤醒词是怎样诞生的?

3)韵母方面,从韵母发音时的开口口型来看,用户更喜欢开口口型较大的齐齿呼和开口呼;另外从韵母结构来看,音节韵母为单韵母的词最受用户的喜欢。

科普文:智能音箱的唤醒词是怎样诞生的?

三、小结

本文主要围绕智能语音交互设备的唤醒词展开研究,从唤醒词组合方式和语音要素两个方面探讨了影响用户体验的因素,发现:

1)现有唤醒词组成方式方面:

在以“名字”为基础的不同组合方式中,“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢;

就“名字”本身而言,“小+字”的名字最受用户喜欢。

2)语音要素方面:

声调:用户最喜欢阴平,同时相较“仄声”,用户更加喜欢“平声”;

声母:用户更加喜欢尾音声母为零声母,而包含了z、c、s的舌尖前音最不被用户所喜欢;

韵母:按照韵母发音时的口型开口情况来看,用户更喜欢开口口型较大的齐口呼和开口呼;另外按照韵母结构来看,音节韵母为单韵母的词最受用户的喜欢。

基于本文的研究,笔者者们是否已经掌握如何构造一个好的唤醒词的方法了?以下是结合收集的用户自定义唤醒词及本文研究结论,为唤醒词作出的分类,供读者们应用参考。

科普文:智能音箱的唤醒词是怎样诞生的?

需要注意的是,本文是从用户视角出发,对唤醒词进行了科学的研究和探讨,但是实际在设计唤醒词时,需要考虑的因素还有很多,如:唤醒词是否过于常见导致语音设备容易被误唤醒,唤醒词与品牌之间是否具有关联。另外,受当前语音技术的限制,现有的唤醒词多以4音节词居多,但未来随着语音技术的进步,唤醒词的长度存在变短的趋势,在设计唤醒词时还应考虑其可优化的空间等等。

特别注明:由于实验设定的条件和样本数量等限制因素,本次实验研究结论或许不能代表所有智能产品用户在家居环境的全部感受。

特点2:更口语化的长句表达

语言本来就是人类进行自然流畅表达的天生的方式,学习成本最低。而语音交互给用户提供了一种看似更加开放表达的途径,让用户更随意的说出自己的需求,而这,也正成为自然语言处理中的难题之一。

如果用户打开网易云音乐搜索周杰伦新歌,会直接点击搜索框输入文字“mojito”或者“周杰伦的mojito”,而如果是使用语音搜索,则可能出现下面的表达:“周杰伦出新歌了,给我搜一下他的新歌”或者“给我搜一下周杰伦的新歌,m开头的那个”(毕竟mojito用户可能不知道怎么发音)

在用户自然表达中如何正确识别用户的真实需求,成为NLP技术领域发展至今的重要瓶颈,也是软硬件目前体验瓶颈所在。

特点3:重复的内容表达

因为语音对话产品的使用频率远低于其他的文本交互、触控交互,用户在使用过程中存在对于智能软硬件的担忧。如何降低忧虑?用户会在使用过程中重复表达自己的需求。比如:

  • 用户1:给我播放周杰伦的歌周杰伦的歌
  • 用户2:我要去北京北京,给我订张机票

看上去似乎很搞笑,你以为用户是有口吃的毛病才会如此么?其实不然,越是低线城市用户越有这样的使用习惯。怕你不理解,怕你没听清,而你要做的就是把产品体验做到可控范围的最好,让用户降低忧虑。

对于这一点,重点体现在话术设计上面,可参照丸子笔记之前的文章《话术设计之道》。

特点4:中途变更需求亦或是一句话里表达多个需求

什么?你以为用户在一个对话流里面就是要表达一种需求?Too young,too simple! 在技术瓶颈的限制下,非模版式的自然语言表达会让产品和技术疯掉!人脑能明白的东西,程序要怎么处理啊,流程要怎么设计啊……

你以为用户是想搜周杰伦的新歌mojito,但中途他可能又想看mv了:

  • “播放周杰伦最新单曲,不不不,给我放一下新歌的mv吧”

你以为用户是想订一张端午去厦门的机票,但中途他可能想看看厦门端午的天气如何:

  • “查一下端午去厦门的机票多少钱,顺便查一下厦门那几天的天气”

如何进行用户意图识别和对话管理必然是语音对话类产品的战略高地,征服了这片土地就征服了用户的心。

特点5:你的对话软硬件可能会成为用户的树洞(情绪宣泄口或情感寄托)

也许你不曾想过,即使只是一个普通的没那么有知名度的语音对话产品,用户也会在使用其提供的各类生活便利之余,将其视为一个倾听的对象。

人终究是孤独的。当然,现实科技还未发展到如科幻电影《她》里面一样,让男主爱上电脑操作系统里的虚拟女生,一个有着迷人嗓音、风趣幽默、善解人意叫“萨曼莎”的虚拟软件形象,但对话类产品天生承载了一种被人类主宰的角色。因此,人们会在无聊时“调戏”智能语音软硬件,在生气时激烈地表达自己的愤怒,又或者激发出性格里的阴暗面,表达诸多私人情绪。

以往,人们与对话软硬件交互时把对话类产品当作一种纯粹的工具使用,因而只有交互需求,没有交流的愿望。但随着用户需求的逐渐释放,用户对于对话场景的天然的沟通交流需求被激发,因此,你的产品在设计之时需要考虑到主流功能之外的用户情感诉求设计。

最后

总结一下,针对用户语音对话交互的行为习惯,在产品设计上需要做到以下几点:

核心:产品设计需要贴近人的自然对话习惯

  1. 唤醒词要简洁、特点明显、易表达;
  2. 利用NLP技术更好的理解用户口语化表达的核心诉求;
  3. 对话过程给予用户实时反馈,需要显性或隐性确认的关键点需在流程设计中重点关注;
  4. 向用户传达明确的服务范围,尽可能在业务范围内为用户提供垂直、交叉的对话体验;
  5. 对话类产品需要有虚拟的形象或给予用户虚拟形象的感知,在话术设计、流程设计时需关注到用户的情感诉求,让用户感受到温暖贴心而非冷冰冰的机器或程序。

文章由PM28网编辑,作者:海阁,如若转载,请注明出处:http://www.pm28.com/3848.html欢迎投稿

联系我们

在线咨询:点击这里给我发消息

邮件:403567334@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息