科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 4962 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2015-09-18
高兴
高兴
发短消息
相关词条
CES汽车科技看点
CES汽车科技看点
对话式界面40年
对话式界面40年
鼠标发展史
鼠标发展史
三大科技巨头十年进化史
三大科技巨头十年进化史
日本人最引以为傲企业TOP10
日本人最引以为傲企业TOP10
IT行业2013年度大事件盘点
IT行业2013年度大事件盘点
2013年最酷科技产品回顾
2013年最酷科技产品回顾
2013全球最具影响力的大数据企业
2013全球最具影响力的大数据企业
2013年全球十大科技新闻
2013年全球十大科技新闻
科技领域9大性丑闻
科技领域9大性丑闻
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

对话式界面40年 发表评论(0) 编辑词条

目录

对话式界面40年编辑本段回目录

你可能听说过这样一个故事:1979年,当年轻的乔布斯拜访施乐公司位于Palo Alto的PARC研究中心时,他看到了施乐新发明的的图形用户界面(GUI)。相比起传统的文本界面,程序图标、窗口化、下拉菜单和绚丽的图像效果把乔布斯狠狠震撼了一把。“仿佛蒙在我眼睛上的纱布被掲开了一样。”《乔布斯传》中如此描述乔布斯当时的感受,“我看到了计算机产业的未来。”

乔布斯回到苹果后,他立刻下令研究人员开始着手模仿他刚看到的一切。这一技术在随后上市的Macintosh上首次被应用,并取得了轰动效果,PC历史上的一个新时代也从此展开:图形用户界面开始成为主流的交互方式,无论是第一台Macintosh,还是最近上市的iPhone 6s,都无一例外地采用了图形用户界面。

其实,这个故事还有一个很少有人知道的分支:就在乔布斯拜访PARC的同时,有另一支团队也在研究另外一种完全不同的人机交互方式,这种方式今天被称为“对话式界面”。该团队设想了这样一个世界:在数十年后,当计算机的功能足够强大,用户可以用通用的人类语言与计算机进行交互,帮助解决问题。

在PARC领导自然语言研究团队的科学家叫Ronald Kaplan。Ronald的团队在上世纪70年代就设计了一个系统, 能让用户以自然语言与计算机交换信息和订购机票。但对Ronald的团队来说,首当其冲的就是成本问题。“服务每个客户的成本...嗯,我猜大概要上百万美元吧。”Ronald如是说。不仅如此,他们还需要更快、可以更好进行分布式计算、更聪明和更高效的电脑。Ronald认为,按摩尔定律,这或许需要15年的时间才能达到他们的要求。

事实上,他们等了将近40年。

今天的Ronald Kaplan是一家叫做Nuance Communication公司的副总裁。Nuance不仅是苹果Siri和福特专为手机配备的SYNC车载多功能通讯娱乐系统和的技术提供方,其合作伙伴更是涉及几乎每个科技细分领域,但Nuance逐步发现,近几年有越来越多的人开始进入这一领域,无论是Amazon、Google还是微软这样的巨头或是其他创业公司,都在试图改进Ronald和其团队近40年的研究成果:他们相信,总有一天你可以像和你的朋友对话一样和各种设备对话,而这些设备会正确理解和执行你所说的一切。这些新工具将会幕布那些图形化用户界面无法满足用户的安全和愉悦需求,反过来,这些日渐增长的对话式界面交互也使得你与设备之间更加亲密和个人化。

但事实是:语音接口的效果仍然不尽如人意。例如,不少公司已经使用这一技术来做简单的客户服务,但在在实际使用中,我仍然经常需要放下电话用虚拟键盘输入生日信息等内容(可能和我的广东腔英语有关),至于Siri,如果是一些诸如问路之类的简单问题倒是可以对付,但如果你的问题逻辑太复杂把Siri逼急了,Siri也会无耻的给告诉你,外事不决问Google然后丢一个页面给你让你自己看去。像Tony Stark一样和人工智能JAVIS那样对话的场景,也只能出现在电影里。

不过,这一切总在朝好的方向发展。今年6月初,SoundHound的首席执行官Keyvan Mohajer对外展示了一个从其2005年初创之时就一直在打磨作品。在此之前,我们对SoundHound的理解是一个流行音乐识别应用,如果你对着手机哼上几句歌,SoundHound就会识别这首歌曲的名称。但这款叫“猎犬”(Hound)的原型则更进一步:一开始,Keyvan问的是一些简单的问题,例如现在在柏林的时间、日本的人口等。突然Keyvan冒出一句:“它们之间相距多远?”根据之前的问题,“猎犬”对此作出了正确的回答:“大约5536英里”。

在接下来的测试中,“猎犬”成功回答了诸如计算按揭贷款的数额以及“告诉我首都有Space Neddle这个建筑物的那个国家有多少人口?”之类的问题,对于Keyvan一口气连珠炮发问的多个问题,一般人或许都需要想一阵才能反映过来,但对于“猎犬”来说同样不在话下。就其表现而言,仍然处于内侧阶段的“猎犬”或许是迄今为止速度最快、功能最全的语音识别系统。猎犬的牛逼之处在于可以同时进行语音识别和自然语言处理,但对其他类似系统而言,要迎头赶上或许只是时间问题。

对于上个世纪七十年代的Ronald来说,他们所头疼的“门槛技术”现在已经是任何一家语音识别公司都能轻易掌握的东西。今天的对话式界面技术是一个经典的跨界融合:技术计算能力的增长、语音识别、移动通信、云计算和神经网络都在同一阶段达到一个临界点,最终使得这一领域的研究者开发出足够好、足够便宜和无处不在的实时对话界面。而这种交互方式的发展,也进一步推进了那些没有屏幕的联网设备(例如路由器或者烟雾报警器之类),毕竟对于这些设备,我们需要的是一种不需要按钮、菜单和图标的自然交互方式。

而在另一方面,由乔布斯发扬光大的GUI世界正处于一个令人尴尬的瓶颈期。图形用户界面要求每一个动作和功能都有一个图标或者菜单选项,但即便像我们每天都要使用的Photoshop或者Excel,你所熟悉的可能也就只有最常用的几个操作,真要完全掌握所有功能足以把大多数人逼疯。Ronald也承认,现在的图文用户界面已经几乎达到了天花板。

如果想要再进一步,你可能不得不让虚拟助理来帮你解决问题——不管是iOS 9、Android 6、Windows 10还是Siri、Google Now和Cortana,巨头们都在通过虚拟助理的方式帮助用户提高效率。哦对了,另外一家不做操作系统但具有十亿级用户的巨头Facebook也有智能助手Ask M。

对于这些虚拟助理而言,他们的出现并不是要替代触摸屏或者图形用户界面,但技术的进步会在很大程度上绕开GUI,例如不少00后已经懒得打字而直接用麦克风输入文本,而对于像老年人或者部分残障人士(例如视力障碍)来说至关重要。

这是另一个创业故事:2010年,24岁的有志青年Maury被医生告知,他的视力在衰减并最终会失明。Maury意识到,他不得不考虑如何在看不到东西的情况下使用电脑,而这也是美国2000多万视力障碍人士会遇到的问题。现有的解决方案是一种叫做“Screen Reader”(屏幕阅读器)的技术,已经有30年的历史,但随着数字化环境越来越复杂(很大程度是Android的错),这一技术已经跟不上时代。

发现了这一需求,Maury开始创办了一家叫做Conversant Labs的公司,针对视力障碍人士开发能够用语音来操作的应用和服务。Conversant的第一款产品叫做SayShopping,可以帮助视力障碍人士通过语音在Target上买东西,在下一步,Maury还计划在今年年底前完成一个能为iOS应用添加对话互动的框架,便于开发者开发针对视力障碍人士的产品。

另一个例子是Amazon的Echo。在刚面世时,有人这么评价Echo:这款产品希望同时扮演无线音乐播放器和虚拟助手两种角色,但不管哪个角色都表现一般。但随着使用时间的增加,Echo的自动学习能力开始显现出效果,逐步适应使用者的说话速度、模式和偏好,更符合用户的需求。

这也是对话式界面和图形用户界面的不同:你的使用时间越多,它就会和你更亲近。毫无疑问,开发虚拟助手的巨头们也注意到了这一点,例如微软就给其虚拟助手Cortana(中国官方名称“小娜”)一个邻家女孩般的个性形象。

不管是苹果、Google、微软、Nuance或者其他这一领域的创业公司,他们的结论都是一致的:基于语音接口的个人代理的出现可以了解你的喜好、你的日常行为、你的表达方式、你的习惯和进展程度,从而帮助你更高效地去使用各种App和设备。这就好比我们生活中的水和空气,不引人注意又无处不在,同时又是你生活中不可或缺的东西,一旦你已经习惯,它就会成为你生活中不可或缺的一部分,再也无法分开。


→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 对话式界面40年

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。