ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

重新定义车载语音交互:服务“全家人”的“自由对话”

2021-09-16 10:30:14  阅读:192  来源: 互联网

标签:同学 音区 理想 车载 全家人 对话 指令 语音 交互


车载智能语音已经成为了日常用车非常重要的高频功能之一,但当前绝大多数语音交互系统的使用感受,其实并不愉悦。

其中,大多数车载智能语音系统谈“听得清”、“听得懂”尚显得差强人意,更谈不上能够顺畅的自由“对话”和“互动”。

被诟病的较多的问题,主要在于:

一是需要一遍又一遍的唤醒系统,还往往需要等到语音系统完整复述完并且处理完上个指令后,驾驶员才能开口提其他需求,太考验人们的耐心;二是说出指令需要刻意记住关键词才能成功识别,太考验记忆力。

又或者是一个人开口,其他人都需要“闭嘴”,这是因为语音系统很容易受到其他语音干扰。如果一旦有“熊孩子”在一旁“捣乱”,往往会导致语音系统无法正常识别指令。

几天前,理想汽车正式发布了其智能语音系统“理想同学”2.2版本,重点针对上述痛点进行了改善。该公司相关负责人表示,新版本的核心目标是:服务“全家人”的“自由对话”。

重新定义车载语音交互:服务“全家人”的“自由对话”

一、“理想同学”2.2版本解决哪些痛点?

2.2版本的“理想同学”主要升级了四个方面的功能,包括连续对话、可见即可说、四音区锁定、跨音区上下文对话。

1、连续对话

理想同学2.2版本可以支持单次唤醒后的连续指令下达。在上一个指令成功执行后,智能语音系统有20秒的时间,来等待乘客发出下一个指令。

这样的好处就是,用户在需要连续操作时,不再需要一遍一遍的重复“理想同学”来再次唤醒系统。

除了以上,连续对话功能还有一个特点在于支持随时插话,而不需要耐心静待系统完成上一条指令之后再开口,系统会自动录入指令队列,然后按照顺序执行。

比如,你可以连续下达“空调调到20度”、“打开音乐”,“打开后排座椅通风”等等多个指令而无需间歇等待,让语音功能操作变得便捷而高效。

除了这些,理想同学令人印象深刻的还有一点在于“无效文本拒识”功能。在智能语音开启过程中,即便有其他人插话和交谈,理想同学能够“聪明”地识别到哪些是需要执行的指令,哪些是车内的交谈内容。

重新定义车载语音交互:服务“全家人”的“自由对话”

2、可见即可说

用户在使用理想同学控制某个APP时,乘客不用再刻意记住指令、关键词这类触发语,只要看到屏幕上所显示的菜单栏写着什么就说什么,系统可以自动识别并执行。

当然,这需要理想的智能语音系统与外部应用APP深度绑定和开发,目前首批支持的应用包括QQ音乐、喜马拉雅、蓝牙电话、车辆中心。

值得一提的是,考虑到安全因素,车辆中心里有关驾驶的设定并不支持非主驾区域的语音控制,也就是说这部分内容只能由驾驶员控制。

3、四音区锁定

在理想ONE已经实现了全车多音区均能进行智能语音对话外,理想同学2.2版本对全车多音区应用再次做了精细化的体验升级:支持除主驾之外任意一个音区的识别关闭。

作为一辆家庭用车尤其家有多个小朋友,往往会出现对语音控制的“话语权”争抢,尤其是有些“熊孩子”的故意捣乱,往往会影响家长的正常使用。

这个时候,主驾驶只要说“关闭后音区”、“不要听副驾驶”等指令,就可以关闭相应位置的语音识别,避免熊孩子捣乱。

重新定义车载语音交互:服务“全家人”的“自由对话”

4、跨音区上下文对话

当前,智能语音被诟病死板的场景之一在于同一个功能指令下的重复啰嗦,更在于不同驾驶位的人员明明是类似的需求,不仅需要主驾多次唤醒语音助手,还需要针对不同座位来重复同样的指令,来完成不同区域的调整。

而理想同学2.2针对这些场景有了升级,可以针对上条指令内容进行上下文关联对话,并对其他座位上的乘客需求进行调整。

比如,针对空调、座椅、车窗等调整,第一次如果不满意,就可以再次说再大点/冷点,温度调到XX度,风量调到XX档等;

主驾调好后,可以说“副驾也是”等一键同步到其他座椅位置;并且在相同的指令语境下,其他座椅位置的乘客,也可以唤醒理想同学后,说“我也要”。

发布会结束后,我们对理想同学2.2版本进行了体验。整体感受来看,理想同学的四音区应答能力非常好,连续对话、可见可说,以及跨音区的上下文对话能力都已经能做到,已经优于市面上大多数语音交互的体验,相信OTA升级后的理想同学将成为理想ONE的核心卖点之一。

重新定义车载语音交互:服务“全家人”的“自由对话”

二、自研能力是关键优势之一

本次智能语音系统“理想同学”2.2版本只是理想汽车2021年OTA升级计划的一部分。按照计划,这套智能语音系统在今年将陆续启动FOTA2.1、FOTA2.2、FOTA2.3三个阶段的产品升级。

随着2021款理想ONE上市,FOTA2.1正式推出,搭载了自研的理想同学引擎,底层能力替换为地平线 + 思必驰 + 微软,增加四音区锁定和唤醒打断功能,并可实现语音控制动力模式、驾驶模式;

如今FOTA2.2版本的升级也主要是早期规划部分,包括自由对话、连续对话、想说就说、无效文本拒识、可见即可说&可想即可说、跨音乐上下文对话、 HIFI 级情感化语音合成。

官方显示,OTA2.2版本更新将于9月15日前陆续开启推送。

接下来的FOTA2.3升级则包括四音区副驾屏语音系统、可见即可说 II 期、多应用控制及仲裁策略、视频应用接入、全车媒体应用接入。

在此之前,理想ONE采用的是第三方供应商提供的智能语音系统,随着自研理想同学语音引擎上线,底层能力也被替换,理想智能语音功能不仅体现出极大地个性化,针对当前语音交互的痛点来实现优化升级。

这背后,是车企对深度自研的需求与能力体现。

对车企来说,只有 “深度自研”才能拥有不受制于供应商的开放能力和主导权,有了更大的发挥空间,来更加灵活实现属于品牌自身特色的差异化与个性化,并能快速拓展引入功能和场景细化,实现跨垂类生态和语音控制场景全链条的逐步打通。

在供应商提供底层技术和基础框架的基础上,其他的大部分,如交互架构搭建、操作系统、上层的功能开发和应用等将由主机厂自我研发实现。当前来看,几家头部新势力企业都倾向于自研模式。

重新定义车载语音交互:服务“全家人”的“自由对话”

在本次发布会上,理想汽车还推出了基于车载应用生态的应用中心,对于接入的应用,理想汽车制定了一定的标准和要求。

首先,理想汽车和第三方公司共同定制专属理想汽车的车载App,接入的应用统一实现符合理想车机系统风格的UI设计。其次,接入的应用要与理想车机系统做深度融合,比如需要全方面支持语音控制,需要符合理想汽车的交互逻辑。

这样第三方应用可以更好地适配理想ONE的显示屏以及车机系统,界面效果、系统流畅性、使用感受都会大幅提升。目前这类第三方的应用程序增加到了9个。

理想汽车与其他新势力的显著区别有两点,一是走增程路线,另外是只卖一款车,一个配置,一种价格。

重新定义车载语音交互:服务“全家人”的“自由对话”

一直以来,理想汽车强调的都是用户体验,更舒适、更愉悦的空间, 而智能座舱、智能语音等均是理想汽车主打的核心技能之一。

2021款理想ONE标配全栈自研的理想AD高级辅助驾驶系统,在原有的 Level 2级别辅助驾驶基础上,升级NOA导航辅助驾驶的能力。

该系统计划在9月份升级,配合高精地图的覆盖,新增导航辅助驾驶、虚实线识别、锥筒识别、限速识别。在第四季度新增车辆朝向识别、停止线识别、斑马线识别、地面标识识别、城市路口增强、信号灯提醒、离车泊入、一键泊出。

此前,理想汽车设定的销量目标是单月突破一万台。5月25日新款(2021款) 理想ONE上市后,6-8月都保持了连续高增长的态势。

数据显示,8月份理想ONE交付量已经达到9433辆,同比增幅高达248%。目前来看,距离目标仅一步之遥。

标签:同学,音区,理想,车载,全家人,对话,指令,语音,交互
来源: https://blog.csdn.net/GGAI_AI/article/details/120323707

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有