首页 > 汽车 > 互联

专访谢信珍:从听觉到视觉看科大讯飞的汽车梦想

来源:互联网

  科大讯飞汽车业务部副总经理谢信珍

  依稀记得,科大讯飞在2016年年会上发布了一款“飞鱼助理”产品。这对科大讯飞的意义重大,意味着这家将业务聚焦在智能语音技术,间接向车企提供车机系统的企业,走向了汽车人工智能的升级之路。

  2017年,科大讯飞发布飞鱼2.0版本,并且还公布了其在汽车方面的产品架构体系。更让人眼前一亮的是,提供核心智能语音交互系统的科大讯飞开始做视觉系统了。

  这无疑是为汽车添加一双“耳朵”之后,还增加了一对“眼睛”。从语音到视觉,再进一步涉足智能汽车产业链,科大讯飞稳扎稳打,他们将其称之为“涟漪效应。”这一切,都是科大讯飞用人工智能赋能汽车的野心和志向。

  发布会结束之后,科大讯飞汽车业务部副总经理谢信珍接受了《中国汽车报》在内的多家媒体采访,讲述了科大讯飞从听觉到视觉技术升级背后的原因,以及未来的产品规划。

  小飞鱼车载硬件

  ■从听觉到视觉我们有技术实力

  在2017年的年会上,科大讯飞展示了飞鱼2.0版本的强大功能。相较于飞鱼1.0版本,2.0产品交互体验更加自然。据了解,2.0系统为汽车定制了上下文理解、多轮对话、主动交互、声纹识别、声源定位、窄波束技术等,这样使得在人和车对话的时候,车就可以记住上下文,准确理解每一句话的意思。

  “去年的时候,飞鱼1.0更多还是一种未来规划,但今年的2.0版本已经是可以落地的产品。”谢信珍告诉记者,飞鱼2.0系统知道该听谁的话,并且主动与车主或者乘客“交流”,系统和人之间的交互更加深入。据了解,目前科大讯飞在车载环境普通话的语音识别准确率为98%,未来除了要继续完善方言识别,还将进一步攻克车载环境中语音识别效果不好的场景。另外,基于前装的2.0版本还拥有语音控制天窗开关、调节空调温度这些和行车安全影响不大的功能。

  而对于科大讯飞来说,这些还不够,他们还要“把眼睛叫醒”。在谢信珍看来,人工智能重点在三个方面,一是深度学习,二是大数据,第三就是“涟漪效应”。科大讯飞从语音入手,依托于语音技术积累的算法,以及从医疗领域积累的图像识别技术,逐步延伸到汽车领域。这就是他们在汽车方面,从理解人、车理解环境两个维度入手,不断地规划产品,之后实现涟漪效应。

  “如果从技术的角度来讲,语音对于信号连贯性的要求比图像更高。”谢信珍指出,科大讯飞在在语音领域研究中发现,语音形成的是连续的信号,而图像则按“帧”来计算。“如果把语音的某一段截掉,信号的连贯性就被打乱,但是如果把图像割裂开,或许对信息的影响不会太大。”谢信珍说。

  谢信珍强调,科大讯飞在语音行业积累多年,现在转向视觉研究,从技术角度来看难度反而相对要小。“我们在医疗领域有两年多图像识别的技术积累,比如我们在拍摄学习CT进行深度阅读,对于CT片子精度的要求也是蛮高的。”

  ■首个视觉应用场景已出现

  2017年科大讯飞在国际自动驾驶领域权威评测集Cityscapes获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界记录,这样的技术将如何应用在汽车场景之中?

  科大讯飞曾就此做过规划,他们没有把语音作为唯一的交互方式,而是把它设想为结合了人脸、人体追踪、手势、红外等多种方式为一体的人机交互解决方案。

  “介入汽车视觉的研究,目的是让汽车的交互体验更上一层楼。”谢信珍指出,利用视觉识别技术,让汽车可以充分感知环境和驾驶者,为驾驶者提供更周到安全的保护和服务。“另外,把视觉的算法融入到车机系统中,一方面节省了独立模块的设计空间和成本,另一方面也会让车内的用户交互有更多想象空间和发挥。”

  根据科大讯飞的产品规划,视觉首个应用场景将会是泊车辅助。“我们其实是做一个增强ADAS。”谢信珍指出,泊车辅助系统,就是在有清晰车位线的情况下,可以借助泊车摄像头观察外部情况,找到合适车位时,用交互的方式提醒用户打方向盘,辅助车辆进入车库。没有车位线时,司机也可以在屏幕上划线选择停车位置,系统把车停到库中。

  谢信珍指出,视觉技术的研究将由科大讯飞研究院来负责,泊车应用也是一个相对简单的场景。但不可否认的是,科大讯飞在汽车智能化方面,已经将系统对人的理解,延伸到系统对车外环境的理解。

  ■人工智能赋能汽车的野心 

  科大讯飞汽车事业部总经理刘俊峰发布了飞鱼2.0系统,该系统包括飞鱼对话引擎、飞鱼AIUI、飞鱼智盒,飞鱼数据工场等面向车端应用的产品。

  刘俊峰强调,科大讯飞未来会把理解人、理解环境两部分完整做到一起。即以飞鱼AIUI作为信息处理的核心,飞鱼对话式引擎、飞鱼智盒分别充当耳朵和眼睛,实现多维信息输入,最后由飞鱼数据工场进行数据的分析处理。

  而在智能汽车人才的储备方面,科大讯飞也不遗余力。据谢信珍介绍,科大讯飞汽车事业部今年已经达到了400人的规模,主要包括对话引擎、大数据分析和软硬件一体化内容,其中负责软硬一体化的员工最多,将近占总人数的一半。

  据统计,科大讯飞的车载产品已经覆盖了200个型号的车型,每年的出货量突破200万套,装车量累计1000万辆。根据谢信珍介绍,科大讯飞陆续与包括北汽、广汽、长安、奇瑞在内的多家主机厂签署了合作框架,涉及智能语音技术、车载智能化和智能车联网平台等多个领域。“新升级的飞鱼2.0系统,科大讯飞和主机厂的合作已经进行了3-4个月,其中视觉方面会把360环视先做起来。”谢信珍说。

  受限于前装产品的出货周期和更新频率,科大讯飞也发布小飞鱼产品。“小飞鱼最大的优势是迭代速度快,每两星期会有个新的功能。”谢信珍强调,科大讯飞会把更多资源和精力放在前装市场,把飞鱼系统和车机更深地结合,在未来延伸出更多功能。

  随着诸多IT技术的融合,汽车已经不再是一个简单的机械+电子的设备,而是物联网的一个连接端,从而成为服务的载体。科大讯飞就这样步步为营,布局着人工智能汽车的宏图大业。

  编辑:王琨

相关阅读

Copyright© 中华消费在线