1.png

  浙江在线12月6日讯(浙江在线记者 祝梅)在跟记者们聊了聊羽绒服、饭局、公益等问题后,5日下午,马不停蹄的马云又从乌镇赶到了上海。去干什么?除了去阿里和星巴克合作的咖啡烘焙工坊喝一杯,下午,他还去体验了一把未来的地铁黑科技。

  12月5日,阿里巴巴、蚂蚁金服和申通地铁集团联合推出新一代售票机。据悉,这其中有三项技术,是今年10月上海地铁牵手阿里云以来的最新阶段成果。目前,这些技术已经完成实验室测试,进入样机研制阶段,未来都将应用于上海地铁。

  简单来说,这三项技术主要实现以下功能:第一,语音购票。上海地铁目前有17条线路、367个站点,每次买票都要选线路再选站点,而未来,你可以直接跟售票机说“我要去虹桥火车站”,就能买到地铁票,你也可以跟它说自己的目的地,售票机也会自动调用云端的高德地图服务,为你推荐目的地周边的地铁站;第二,刷脸进站。新款售票机配有摄像头,运用机器视觉和智能语音多融合技术,摄像头会看到你,收集你的声音,主动跟你打招呼;第三,人流监测。这个功能更多是确保安全的考虑。

  这也是全球首个强嘈杂环境下的语音交互产品,它的出品人,正是阿里巴巴的iDST。在上周声学专家、原宝利通(Polycom)声学设计与信号处理首席工程师冯津伟加入阿里巴巴iDST语音团队之后,这是该语音团队又完成的一件大事。

  据公众号机器之能的报道,项目主要负责人、iDST语音团队负责人鄢志杰认为,地铁智能购票系统所用的多模态交互就是阿里巴巴iDST团队对下一代人机交互可能性的一种尝试——你只要走近机器,不需要唤醒,它就会自动与你发生交互。

  在语音交互方向上,强噪声、强干扰下的人机交互问题一直都是iDST的研究重点。鄢志杰解释说,这些视觉、听觉结合的技术被称为“多模态融合技术”,是人机交互发展的新方向。今年云栖大会上,阿里巴巴宣布成立达摩院,而达摩院的成立初衷之一便是实现下一代人机交互。

  在地铁站的嘈杂环境中,准确识别语音命令是个挑战。这也是下一代人机交互走向更复杂的应用场景的一次试水。鄢志杰透露,地铁项目给团队带来的挑战是系统稳定性以及快速学习能力。在地铁这样的公共服务设施中,系统需要全天候工作。并且不像互联网云端项目方便修改,地铁项目的修改灵活性要稍差一些。

  另外,项目正式上线运营后,大规模的用户涌入,如何识别用户千奇百怪的交互方式也是团队需要面对的难点之一。