编者按:本文来自微信公众号“大数据文摘”(ID:BigDataDigest),作者:牛婉杨,36氪经授权发布。
你也向往科幻片里的语音助手吗?比如托尼家的Jarvis、Friday,引得众多漫威迷的羡慕,它们不止是语音助手,简直可以说是智能管家!从生活起居到组装钢铁战衣再到研究敌人装备,可以说是无所不能。
再看看自己手机里的语音助手,只能通过它调用一些基本功能,更不可能跳出手机跟主人在现实中互动。
然而,近期卡内基梅隆大学人机交互研究所的研究人员设计了一款名叫“WorldGaze”的IOS程序,似乎可以将手机中的AI语音助手带到现实中来,进一步融入我们的生活。
这个AI系统可以同时调用智能手机的前后摄像头,通过前置摄像头在现实空间中定位用户的头部,而后置摄像头可以实时观察用户周围的场景,并利用计算机视觉技术解析识别附近的物体。
当你走在路上时,AI可以将你的头部和眼睛作为指针,当你将视线转向路上的任何建筑或物体时,AI也可以随之检测到。
不仅如此,AI还能掌握这些建筑或物体的信息,甚至当你看到路边的星巴克时可以问它,“星巴克什么时候关门?”
又或者当你走进一家零售店,问它“那款沙发还有其他颜色可以选择吗?”,“这把椅子和那把椅子哪个更便宜?”它都可以解答你的疑问,随时与你互动。
回到家中,AI语音助手还可以与你的智能家居网络进行互联,你可以远程控制各种设备,例如你看向电视并对语音助手说“打开它”,电视就能打开,而无需说出家具名称。这款语音助手可以结合你的视线和语音,简化操作语音指令。
该AI语音助手的研究人员Chris Harrison称,希望这项技术能够有助于“社交化移动AR体验”,让人们变成“抬头族”,而不再是走在路上低头刷手机。
愿望是美好的,然而现在的技术还存在一定的局限性。比如,AI需要通过手机后置摄像头拍摄来检测物体,然而用户一直举着手机并不方便,也难免会有些尴尬。
或许像智能眼镜之类的设备才是更适合这种AI语音助手的载体。Harrison也证实,该软件可以轻松地应用在AR眼镜上。
Harrison还称,“两种可能性都有,”他们目前选择专注于智能手机,只是因为现阶段手机已经成为了每个人的必需品,而目前几乎没有人戴AR眼镜。
他补充道,“AR眼镜越来越多地加入了追踪注视位置的传感器(比如Magic Leap,它用于对焦),所以在这种情况下,人们只需要一个向外的摄像头就可以了。”
如果这项黑科技再向前迈进一步又可以做到什么?
会不会就越来越像科幻片中的场景,当我们走在路上,戴着眼镜,看向一位路人,问“那是谁?”,语音助手在短短几秒内调取了这个人的资料读给你。
当然,这还只是开发人员一个大胆的猜想,因为要想系统与面部识别技术相结合,那么必须要得到人脸信息相关数据库的合法授权。
随着科技的进步,科技所面临的社会争议也愈发强烈,当开发人员被问及这种可能性时,Harrison表示,“必须要得到许可,还需要具备一定程度的安全性,这不是我们目前正在考虑的事情,但这是一个有趣的,也可能是一个可怕的想法。”
相关报道:
https://techcrunch.com/2020/04/15/worldgaze-uses-smartphone-cameras-to-help-voice-assistants-cut-to-the-chase/
相关论文:
https://chrisharrison.net/projects/worldgaze/WorldGaze.pdf
网址: Siri不够聪明,再给它一双眼吧,CMU与苹果合作,摄像头让AI助手更精确 http://m.xishuta.com/newsview21368.html