大数据爆炸推动商业和科学变革的三大趋势编辑本段回目录
我们所认识的数据科学与商业智能正在发生深刻变化,不仅仅是技术和能力上,而且消费这些技术的用户的预期也在变化。这些变化如此剧烈和深刻,以至于我们不得不承认,人类科学研究本身都因之而进入了一个全新的时代。随着新的商业模式、行业应用的兴起,数据科学对企业经营和科学研究的影响堪比web。
图灵奖得主Jim Gray和Jnan Dash在“科学的第四个范型”中,将人类科学研究的历史划分为四个阶段,这有助于我们理解为什么数据科学正在成为一种全新的科学研究方式:
- 几千年前——实验科学,描述自然现象
- 过去几百年——理论科学,牛顿定律,麦克斯维尔方程式之类
- 过去几十年——计算科学,模拟复杂现象
- 今天——数据密集型科学(理论、实验和模拟的统一)
Mike Loukides在他的博客写道:“未来属于能将数据转化成产品的人或公司。”
今天,分析、大数据或数据科学,虽然定义各有不同,正在改变我们运作企业、制定决策、创新商业模式、管理风险的方式,迫使企业IT部门“重新发明”企业IT神经系统,同时也推动人类科学研究进入“第四范型”。
那么,哪些趋势正在驱动商业智能和科学研究的变革呢?
预测未来
市场的变幻无常和商业全球互联的趋势使得直觉决策不再有效。今天,企业业务决策涉及的数据和参数如此复杂,企业决策者们都在想数据科学家们求助:“帮我们预测一下未来。“在今天这个断层式的技术和商业革命中,经验已经不足以帮我们赢下未来。
例如,一个汽车挡风玻璃的制造商期望能预测中国汽车行业的增长,以便制定更为精确的销售和运营计划。一家电影院需要预测一部影片的票房收入,以及最佳的电影票定价策略,一家医院需要预测未来两年病人住院周期的变化,以此来制定新的建设规划。所有这些分析预测结果都无法基于传统的数据源获得。
可视化
如果你随便做个抽查,企业中应该使用BI用户中,也许至多有5-8%的真的在用。仅仅依靠培训和改变业务流程并不能BI工具使用率低下的问题,数据可视化在这里才是良方。所谓数据可视化,就是”用数据讲故事“。万幸的是,今天数据可视化已经有了实质性的进展,举一个最生动的例子,你可以点击这个链接查看沃尔玛在北美市场扩张的可视化数据。数据可视化后,将非常有利企业管理层发现问题,制定决策。例如,IBM的Many Eyes工具为决策者提供多种可视化模式,管理者可以选择最合适的模式来”用数据讲故事。“
大数据
大数据到底是什么呢?今天对大数据的定义繁多,一个比较经典的说法是:大数据就是当数据规模本身成为问题的一部分。“但是大数据的“大问题”还不仅仅是规模,数据产生的速度和数据的多样化是大数据的另外两个特性,人类过去两年制造的数据是此前的总和,而数据的格式也在飞速增长,这些都远远超出传统数据库和分析工具的能力,但随着Hadoop等新工具的产生,大数据意味着更多的机会。例如汽车远程技术(Telematics)能收集用户驾驶习惯的海量信息,保险业利用这些信息可以制定有针对性的保费和条款,这在几年前还不可想象。
BI科学也正在发生变革,应用潜力巨大,例如预测传染病的爆发。
科学家们将能发现克制流行感冒爆发的方法。——Google
约翰霍普金斯大学的研究者已经开发出“Google流感趋势”,为应急部门提供了一种强大的早期预警系统。通过观测互联网上关于流感的搜索流量,医院急诊部门能提前做好迎接流感病人高峰的准备,而无需等待政府发布的严重滞后的流感报告。
来源:IT经理网
数据爆炸的核心价值编辑本段回目录
曾经有位科学幻想家这样说过:“给我全部的数据,配备足够性能的计算机。那么我可以从现在推演出当初宇宙大爆炸的所有参数。”也许,这只能停留在幻想。但如果放在今天数据大爆炸的通信领域,这句话或许并非空谈。
Teradata天睿公司首席技术官宝立明(Stephen Brobst)介绍:“IT行业最大的表现就是数据大爆炸,海量的数据让每个公司头疼:该如何处理这些数据?但人们没有发现,这些数据让人头疼的同时,却也带来了更多的机会,但前提是企业能分析这些数据。”
近日,Teradata全球数据仓库峰会在苏州召开,今年,Teradata在数据大爆炸的中心开发了一块淘金地:商业智能。
数据爆炸最激烈的领域自然是电信市场。正如同我们所经常听到的那样,运营商所做的宽带提速、骨干网提速、核心节点提速等等工程都是为了应对海量数据,但这些数据到底有什么价值?
“运营商的现有数据管理模式已经不能满足需求,他们的各个信息模块都是独立的,也就是我们常说的‘信息孤岛’”,Teradata电信解决方案总监Jose Marques向记者介绍,“这种状况导致运营商管理信息的模式越来越繁琐,因为信息种类越来越多;其次,疲于奔波的运营商也没有来分析数据的概念,自然浪费了数据的价值。”
据悉,在数据仓库领域,Teradata已经连续13年被Gartner评为行业第一,目前全球前21家电信运营商都在采用Teradata的数据服务,并且全球95%的电信运营商都是Teradata的客户。
“首先,我们能提供数据集成的能力,把所有的数据孤岛集成在一起,并且把计费、运营、分配等所有的管理项目也集中在一起,大大提升了运营商管理数据的效率。”Jose表示,“仅此一点能力就足以让Teradata在这个行业具备支配地位。”
此外,Teradata还提供更为诱人的数据分析:你想了解用户的每次点击都出于哪种动机么?你想知道用户访问商品的原因么?为什么有投诉?客户出于何种原因流失?Jose介绍:“这些我们都能提供答案。”
Jose举例:三大运营商都有庞大的用户群体,每天都能接到海量的投诉。我们曾对一位运营商提供了投诉分析,并指出他们最新推出的几款套餐中可能引发大量投诉的潜在因素,并对此作出修改,效果十分理想。