Microsoft BuildTour 2017 摘要

10 2017-06-09 03:13:04

前言

在2017年6月5日参加了微软在上海举行的BuildTour,我的关注点主要在微软AI上面的发展,比如,一些开发工具,bot的设计等。当然,比较有兴趣的是微软的增强现实Hololens。相关的演讲Keynote在buildtour keynote

BuildTour现场

1.进场领取的胸牌
胸牌
2.会场概况
会场概况 3.会中的餐点 餐点

Hololens体验

Hololens体验在进场的时候就可以预约,早上八点半到了以后,预约到了一点,想着中午吃了饭正好可以过来试戴,并且还不会错过会议内容。
Hololens可以用手势进行超控,比如食指和大拇指的捏合动作被视为点击,五指由收紧到张开是放置。当然,也支持语音操控,但是效果并不是多理想,根据提示说了好几遍都没有被识别。
戴上以后开机会有一个菜单,菜单是不会动的,通过转动头(其实应该是自己的视线的中点,打过cs的就知道,就是光标一直在中间,而视线的移动其实就是wasd),中间有个光标,当光标移动到对应选项上的时候,可以捏合手指进行选择。我选择的是一个3D建筑场景。选中了以后,在现场找个适当的位置,把建筑物放到地面上(我的世界既视感)。这个时候,那个虚拟的3D建筑物就真的在地上了,你可以把他当成一个真的建筑近距离观看,看庭院中的一些植物,建筑物里面的楼梯,视线也会被墙壁遮挡,甚至可以走进这个建筑物里面,在建筑物里走来走去。总之,相当的震撼。

语音识别现状以及前景

现在语音识别,识别率已经不在是限制语音的瓶颈了,现在的瓶颈是语音对话机器人的AI水平。语音识别的前景是毋庸置疑的,主要的场景有,车载(封闭式环境,手被占用),家居(封闭式环境,手被占用), AR/VR(封闭式环境,手被占用),可以看到,这些场景都有两个共同点,环境比较封闭,应用场景上就会比较固定。比如车载,主要的就是导航,车身控制等。家居,主要场景是智能家居,娱乐媒体的控制。AR/VR,就是虚拟道具的使用。如何在这些固定场景中更加人性话的对话,以更短的路径通过语音对话识别用户的目的,这才是语音识别最终的目的。

比如车载中,
user:今天的天气
bot:请问查询哪里的天气
user:定个机票
bot:请问定哪里的机票
user:北京

这时候,以现在的AI水平的话,都会问,那你定哪天的机票。其实,期待的回答应该是,您是要定机票还是查询天气呢?

通过对上下文的识别,赋予bot逻辑,生成对话,才是现在语音对话的关键。