文本挖掘集体智慧 编辑本段回目录
从一种视角观察,社交网站是人们表达与合作的喧嚣之所。但以另一个角度来看,这是一个巨大的且可自由获取的目标群体。该目标群揭示了顾客所想及所需等颇具价值的洞见。逐渐地,企业将转向从嘈杂中提取有效信息的技术。
总部位于科罗拉多州波尔德市的集体智慧(Collective Intellect)公司用文本挖掘软件(Text mining software)审查了Twitter、Facebook、MySpace及诸多博客和留言板上的帖子,以此来帮助企业了解用户对其产品的评论。该公司的软件运用一套算法来浏览文本,并总结出人们以何种语气在讨论什么。
重要的是,它的功能并不仅限于像谷歌关键词检索一般,同时它也可解释其含义。公司技术总裁格雷格·格林斯特里特(Greg Greenstreet)说:“‘苹果’一词便是个好例证。它可以指代一家科技公司,也可以指水果。”集体智慧的软件通过观察在相似语境中一个词语的其他用法来对这些含义加以区分。因此,它可以和人一样做出判断与联想。格林斯特里特说:“如果我说‘史蒂芬·乔布斯’,我们的软件便和您一样,知道我说的是哪家公司。”
集体智慧软件的一个用户从为兴趣关键词下定义开始。该工具返回了若干结果群,用户可接受或拒绝这些结果,这样便教会了系统用户的兴趣点是什么。例如,某人要搜索卡洛驰(Crocs)的用户体验,那么他便会拒绝关于鳄鱼(crocodiles)的检索结果,而只接受该鞋类品牌的信息。在此之后,集体智慧将会搜索有关目标话题的网上讨论并定期返回详细报告。一个在线仪表板可随着时间显示发布活动以及正面、中立及负面内容。
MTV音乐电视网就是这种工具可能实现一种新策略的一个例子。“对它们而言,传统市场调研太慢了。真人实景秀泽西海岸(Jersey Shore)中,当那个女孩儿被打时,他们需要立刻知道人们是否喜欢这一情节。”格林斯特里特说。关于电视节目的在线讨论也揭示了新的广告商机,他补充道:“比如,我可以向高乐氏(Clorox)证明,观看某一电视节目的人群会留心某一种商品。”
最近,集体智慧正致力于更加私人的数据——例如,处理客户服务热线的电话记录或医患咨询的电话记录。格林斯特里特说:“药品公司希望得知当医生开出一种药物时,对话的主题是什么。”他预测,这类工具将被越来越多地运用于处理内部数据。“企业中有许多他们没有处理的数据。”他解释道。
大卫·斯戴尔(David Steier)是位于加州帕列奥图德勤会计师事务所(Deloitte)咨询部的信息管理总裁。他认同上述观点,即许多公司根本没有意识到自己坐拥大量珍贵数据。他的团队使从大量文件中自动提取商业洞见成为现实,没有他们的技术,这些文件就必须逐个阅读。
他说:“汽车保险表单含有事故的文本描述,一般是由工作人员阅读并阐释的。我们可让软件阅读这些表格,其中包括表格中的其他信息,这样就可以为保险申诉自动建立起一个风险指数。”德勤的系统是在人工处理过的表格基础上调适过的,因此它可以分析描述中的那些词语意味着高赔偿事故。“摩托车”和“逃逸”(及到医院)是该表单赔偿价格高的重要提示。
“你可以使用我们生成的数据将复杂的表单自动归类,效果和最熟练的调试员一样。”斯戴尔说。还有一个相似的方法可运用寻求支持的请求以及电话记录预测出,哪些顾客有可能会转而使用更具竞争力的产品,这在顾客改变主意之前,给了公司为目标客户研发创新策略的机会。斯戴尔说:“松散的数据隐藏着巨大的价值,但却常被忽略,公司需要注意到这一事实。”