科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 7277 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2013-04-07
高兴
高兴
发短消息
相关词条
链接侵权责任问题
链接侵权责任问题
搜狗360中秋大战
搜狗360中秋大战
网站用户搜索行为研究
网站用户搜索行为研究
百度PK谷歌
百度PK谷歌
反向图片搜索
反向图片搜索
三巨头争夺搜狗
三巨头争夺搜狗
智能搜索机器人
智能搜索机器人
视觉搜索
视觉搜索
搜索圣战与百度救赎
搜索圣战与百度救赎
移动应用搜索王者之争
移动应用搜索王者之争
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

目录

视觉搜索编辑本段回目录


愚人节当天发布消息很容易会让人产生联想。但这仍然没有抵挡住企业的“假日营销”,比如苹果的道歉,再比关于百度的两则消息:一是百度宣布与知名娱乐商达成合作,通过“机器评委系统”进行海选,以机器方式替代人工面试筛选,网友只需拍摄或上传照片就能参与。在选秀节目和评委满天飞的情况下,机器也来凑热闹?昨晚笔者还得到一个劲爆消息:百度眼镜来了:百度宣布内测成功 Baidu Eye ,这是类似于 Google Glass 的设备,据称将配备超小液晶显示、语音操控、图像识别、骨传导技术,并且和百度语音,百度云、百度地图等深度整合。这是百度工作人员透露的照片。


选择在这样的日子发布消息,也许百度希望给人以虚虚实实的感觉。在人脸识别方面,百度有这个技术实力。但百度EYE的发布仍然让我觉得诧异——这不像百度的风格。笔者更关心而且确信的是:可以认定百度移动搜索的又一个重点技术方向——视觉搜索。这两则消息齐齐指向了这一点。

在《展望 3B 大战之后的搜索变数》一文中,我曾分析过移动搜索与传统搜索的不同。搜索诉求从获取信息变为更加本地化、生活化的实体搜索;搜索方式从WEB网页变为APP;输入方式也因为使用场景的移动性、移动设备的特征和网络环境而发生了巨大变化,从文字输入变为文字、图像、声音、体感、位置的综合输入;输出结果因为移动设备的特征而变得更自然、智能和互动,如语音和图片。另外,广告模式则从“展示广告+超链接”向基于位置的精准营销、O2O 和电话拨打广告等方式转变。


上面提到的各种移动搜索技术现在还在探索中。地图、语音搜索相对成熟,而下一个正在爆发的则是视觉搜索。人类既然可以通过声音驱动设备的 Siri、Google Now、百度语音助手,又怎会忽略另一个人类与外部环境的核心交互能力——视觉呢?相关科学统计显示,人类有近80%的信息获取来自于双眼。移动设备的摄像头已是标配,视觉搜索极具想象空间,Google Glass 就被认为是一个基于视觉搜索的可穿戴设备。

什么是视觉搜索呢?最简单的说法就是“以图搜图”。

图像识别技术已经发展有近30年历史。从最初的指纹识别,到现在随处可见的人脸识别。它们都是将指纹图谱或者人脸图片转换提取出特征,与设备中存储的已有特征照片进行比对。如果相似度达到某个阈值,则匹配成功,这被广泛应用于日常考勤、安保、电脑解锁中。网易近期还推出了“人脸邮箱”就是这样的旧技术搭上新应用。

不过,上面说的图像识别技术还只是一种一对一匹配技术,远远还没发展到搜索的程度,如同雅虎时代的“网址索引”阶段,而视觉搜索则到了Google和百度为代表的第二代搜索的阶段。与简单的匹配不同,视觉搜索是基于算法和数据的。首先需要搜索引擎拥有大量图片库,然后提取特征值,聚类建索引。在用户搜索时,将搜索照片进行解析,去繁存真,检索并根据相关性排序,返回结果。这个结果可能是一堆图片,也可能是与图片相关,结合用户特征和搜索场景的相关信息。这个过程与现在的主流搜索引擎的过程比较接近。

这个技术的应用场景在哪里?如果够智能,它可以成为一双帮你变得更聪明的眼睛。思维过程也是到大脑的记忆存储区域去匹配相似场景,最后与一些信息概念映射,并作出行动反馈。如果你看到一个人,似曾相识但就想不起来名字,这个思维过程就可以被比作整个视觉搜索的慢动作了。这时候或许视觉搜索可以帮你。不过,这得你大脑存储的记忆全部数字化,能传递到电脑才行。

从全球范围看,在视觉搜索技术的探索方面,走在前面的当然是两家搜索公司。Google 在 2009 年分别推出网页版 Google 相似图片搜索和 Google Goggles ,后者是一款安卓版 APP ,可以拍照并搜索相似照片。2010 年,Google 特意收购英国视觉搜索公司 Plink ,以加强 Goggles 。Google 这套东西除了相似图片搜索技术应用于其购物搜索外,其他的并未带来商业价值。直到 Google Glass 的出现才让其积累多年的视觉搜索技术有了爆发的空间。

百度的发力也并不算晚,它在 10 年推出百度识图搜索开始涉水视觉搜索的。不过当时因为使用场景有限,这款产品并未被大众熟知。更多是满足了一种新鲜感。

即便如此,百度仍然投入了大量资源来研究视觉搜索。这样的判断应该与技术出身的李彦宏喜欢研究技术趋势有关。两年前李彦宏就宣称互联网“读图时代”到来,在去年的 KDD(知识发现世界年会)上,他提出的待解9大技术问题中,“基于内容的的视觉搜索”排在第三位。

李彦宏在去年底的百度年会上宣布了百度 2012 年的压轴之作:全世界首个“全网人脸搜索”。这是一款通过用户上传照片,就能在互联网上找到相似照片的产品。图像识别技术应用于全网搜索后,以图搜图的准确率一下子从 20% 提升到 80% 。正是应了那句话,技术积累的先发投入,往往会体现在产品的后来居上。

这款产品的识别准确率依赖于被搜索的人脸在网上的照片数量:百度的大规模并行计算机器群会将爬取的照片(不会抓取未开放的私人相册)进行特征提取和聚类。在这个过程中,会用机器学习算法对人的面部表情喜怒哀乐进行识别学习。照片越多,机器学的材料越多,进而识别率也就越高。据说普通照片识别率已达 90% 。明星甚至高达 99% ,百度在大数据时代的优势得到体现。


百度愿意为这个目前尚处研究阶段的视觉搜索技术倾注资源,可以解释为一切都是为了移动互联网布局。去年在其移动互联网策略和成果不明朗的情况下,外界甚至猜测百度在移动互联网时代是不是已经失去了昔日位置。不过今年又逐渐明朗起来,地图、语音、APP 及 APP 内搜索,后发而至。尤其是现在百度在视觉搜索方面的成果,更让我确信百度的下一个移动互联网发力点将是移动视觉搜索。

在移动互联网上视觉搜索的空间甚至比语音搜索还要大。语音搜索的瓶颈除了识别率赶不上图片识别外,对使用者的说话语气、语速、口音等要求颇高。最大的问题是使用场景的局限性:跟手机说话会干扰周围的人;容易会被周围的环境干扰。也就是说,语音搜索适合相对独立和安静的空间使用。

而对于移动场景下对“线下实体”的搜索,比如商铺、商品、餐厅、菜品、图书、环境、招牌、景点甚至地铁对面的美女。这些场景显然不是“安静”和“独立”的,视觉搜索可以避开上述问题。

视觉搜索除了能与移动设备的摄录能力天然结合外,它也很好地满足线下的搜索场景和诉求。条形码和二维码在这方面开了个先河,除了商品,你可以对着海报、朋友的名片、甚至芒果台节目上的二维码“扫一扫”,然后匹配信息并建立联系。

不过条形码、二维码也只是在某些特定类型的物品上。我们的世界不可能会充满二维码,它天生是给机器读的。而视觉搜索呢?人眼所见即所得。只要人类能看到的,它都可以帮你进行抓取并搜索。

视觉搜索未来很丰满,但是现实仍有些残酷。如同李彦宏在去年 KDD 大会提出来的,视觉搜索仍然是待解的技术难题。百度人脸搜索之所以能取得成功,除了百度有海量的人脸照片外,还与人脸是常规图像有关系。技术上,业界包括谷歌和百度在探索方面既有进展也有挑战:在对平面或刚体(书籍、CD、建筑物、油画、明星照片等)的搜索方面,召回率已超过90%;但对“非刚体”图像的识别,就对机器算法有更高的要求(比如动物)。

在常规图像上,视觉搜索的识别率肯定会低于二维码和条形码扫描。不过,如果视觉搜索可以实现百度人脸搜索那样的精度甚至更高,以及随着 4G 到来 WIFI 覆盖加强,网络环境变得更好,当李彦宏说的 2.9 秒搜索时长变为 0.1 秒后,视觉搜索就将迎来大规模应用。

未来的视觉搜索是什么样呢?类 Google Glass 的智能眼镜的普及会成为一个里程碑。在这之后,无论是物体、图片、二维码,对视觉搜索引擎来说,都是将真实的物理世界信息映射为互联网信息的方式。摄像头是移动互联网时代的入口,就像 PC 时代的搜索框一样。这是 Google 和百度等搜索巨头都对视觉搜索投入大量资源的原因—流量入口是搜索引擎的生命之源。

视觉搜索被诟病的还有交互的自然性。Siri 是在和我们对话,而现在的视觉搜索仍然是“我们使用这款设备拍照并进行搜索,来完成任务”的过程。Google Glass 的出现让我们的眼睛多了一个视觉搜索功能,以前我们看到环境搜索大脑,现在我们看到环境搜索大脑+云端信息。这种交互方式开始变得自然,虽然也有戴着 Google Glass 去酒店被打的,扎克伯克也说带着它很囧。

视觉搜索仍然存在很多瓶颈以及风险。隐私问题,以及人类自我的问题。笔者《今天不矫情,明天成贱人》曾经提出过“科技越进步,人类越暴露”的观点。你无法判断你对面的人是否在用他的第三只眼睛拍摄记录你,以及搜索你。除了隐私外,越来越聪明的技术和设备,与人类自身的位置如何协调?我们是不是终有一天会被设备奴役?当这“第三只眼”真正进化成隐形眼镜,就是我们的身体开始被设备奴役的开端了。你不用担心对别人造成干扰了,或者说是你永远不用担心别人知道你的干扰。

当然,技术都是双面性的。有总比没好。既然我们能发明他们,也就能驾驭他们。

文/罗超(微博 博客 微信:SuperSofter) 编辑/Chaos

参考文献编辑本段回目录

http://tech2ipo.com/58883

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 视觉搜索

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。