科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 14120 次
  • 编辑次数: 2 次 历史版本
  • 更新时间: 2012-05-01
高兴
高兴
发短消息
高兴
高兴
发短消息
相关词条
大数据副作用
大数据副作用
大数据时代的业务转型
大数据时代的业务转型
大数据挑战谷歌
大数据挑战谷歌
社会化商业新数据时代
社会化商业新数据时代
大数据的兴起
大数据的兴起
大数据邂逅网络交友
大数据邂逅网络交友
竞争优势与大数据
竞争优势与大数据
大数据的未来是App
大数据的未来是App
大数据常见误解
大数据常见误解
大数据改变美国大选
大数据改变美国大选
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

大数据4V理论 发表评论(0) 编辑词条

目录

大数据4V理论 编辑本段回目录

  根据国外媒体报道,在Computerworld Australia和存储网络行业协会A/NZ共同举办的信息基础设施推进研讨会(Implementing Information Infrastructure Symposium,IIIS)上,IDC美国存储方案副总裁Benjamin Woo表示,每位存储管理者都应该关注Big Data大数据的4V,也就是容量、类型、速度和价值(volume、variety、velocity和value )。

  著名机构IDC对大数据技术的定位为:通过高速捕捉、发现和/或分析,从大容量数据中获取价值的一种新的技术架构。

  “从价值的角度来看,如何为用户获取价值以实现领先于他人的优势?”Woo说道,“大数据是多维的,而且极具复杂性……”

  大数据带来的价值包括但不限于:数据的组织和管理,基础架构,决策支持和自动化界面和分析。

  Woo警告说,存储管理者并不能将大数据交由CFO来打理,“我愿意为此投入300万美元,而你需要付出的将是1亿美元。”

  “你对此毫无知情,而这就是大数据为何成为一种挑战的原因,因为你正在投资的是一个未知领域。”

  不过,如果IT人士关注数据分析的话,他们可以将这些应用带入到组织机构中,并且将其成为IT任务处理的一个流程。

  “大数据主要关系到决策支持。因此,当你制定涉及数百万美元经费的决策的时候,会非常渴望获取足够多的信息。”Woo表示。

大数据的4V理论编辑本段回目录

按照国外媒体报道,在Computerworld Australia和存储收集行业协会A/NZ共同举办的信息根蒂根基举措措施推动研究会(Implementing  Information Infrastructure Symposium,IIIS)上,IDC美国存储规划副总裁Benjamin Woo默示,每位存储经管者都应当存眷Big  Data大数据的4V,也就是容量、类型、速度和价值(volume、variety、velocity和value )。 

有名机构IDC对大数据技巧的定位为:经由过程高速捕获、发明和/或解析,从大容量数据中获取价值的一种新的技巧架构。

“从价值的角度来看,如何为用户获取价值以实现领先于他人的上风?”Woo说道,“大数据是多维的,并且极具错杂性……” 

大数据带来的价值包含但不限于:数据的组织和经管,根蒂根基架构,决定计划支撑和主动化界面和解析。 

Woo警告说,存储经管者并不克不及将大数据交由CFO来打理,“我愿意为此投入300万美元,而你须要付出的将是1亿美元。” “你对此毫蒙昧情,而这就是大数据为何成为一种挑衅的原因,因为你正在投资的是一个未知范畴。” 

不过,若是IT人士存眷数据解析的话,他们可以将这些应用带入到组织机构中,并且将其成为IT任务处理惩罚的一个流程。 

“大数据首要关系到决定计划支撑。是以,当你制订涉及数百万美元经费的决定计划的时辰,会很是渴望获取足够多的信息。”Woo默示。

大数据有大智慧编辑本段回目录

  除了“物联网”和“云计算”,IT业又出现了一个新名词——大数据。如今,大数据甚至引起了工商界和金融界的高度关注,人们认为大数据将为数据应用和决策支持提供有效帮助,成为物联网和云计算内在的灵魂和必然的发展趋势。

  大数据目前尚没有统一的定义,通常被认为是一种数据量很大、数据形式多样化的非结构化数据。

  这里我们先弄清楚几个概念,结构化数据、半结构化数据和非结构化数据。结构化数据可以在关系数据库中找到,多年来一直主导着IT应用;半结构化数据包括电子邮件、文字处理文件以及大量发布在网络上的新闻等,以内容为基础,这也是谷歌和百度存在的理由;而非结构化数据广泛存在于社交网络、物联网、电子商务之中。伴随着社交网络、移动计算和传感器等新技术不断产生,有报告称,超过85%的数据属于非结构化数据。

  很多人相信这些庞大的异构数据中蕴含着巨大财富——企业如果能在这些非结构化数据中挖掘知识并与业务融合,决策的依据将会更加全面和准确;在科学、体育、广告和公共卫生等其他领域中,也有着向数据驱动型的发现和决策方式转变的趋势。

  大数据的推动因素主要来自于一些大型IT公司,如谷歌、亚马逊、中国移动、阿里巴巴等,他们需要以更加优化的方式存储和分析数据。此外,还有一些来自健康医疗、地理空间遥感和数字媒体等行业的大数据需求。据市场研究公司统计,未来10年里预计数字信息总量将在2009年到2020年增长44倍,全球数据使用量将达到大约35.2ZB(1ZB=10亿TB)。

  大数据呈现出“4V+1C”的特点:(1)Variety,大数据种类繁多,在编码方式、数据格式、应用特征等多个方面存在差异性,多信息源并发形成大量的异构数据;(2)Volume,通过各种设备产生的海量数据,其数据规模极为庞大,远大于目前互联网上的信息流量,PB级别将是常态;(3)Velocity,涉及到感知、传输、决策、控制开放式循环的大数据,对数据实时处理有着极高的要求,通过传统数据库查询方式得到的“当前结果”很可能已经没有价值;(4)Vitality,数据持续到达,并且只有在特定时间和空间中才有意义;(5)Complexity,通过数据库处理持久存储的数据不再适用于大数据处理,需要有新的方法来满足异构数据统一接入和实时数据处理的需求。

  Apache的Hadoop已成为大数据行业发展背后的技术推动力,Hive和Pig等技术也经常被提到。同时,旨在从非结构化数据的庞大宝藏中获得知识和洞察力的计算机工具也正在迅速发展中。这些工具的发展依赖于不断进步的人工智能技术,比如自然语言处理、模式识别和机器学习等。

  可以预见,未来一两年内,将会涌现大量能够处理大型非结构化数据的工具和平台。除了Hadoop的批量化处理方式之外,基于流数据处理的方式也将在实时数据分析应用中发挥作用。此外,大数据热潮还将对可视化的理解和需求提出新的挑战。可视化在数据工作流中将同时起到解释和探索的作用,数据科学家会将可视化作为寻求问题以及探索数据集新特性的一种方式。

  由于大数据的技术门槛较高,因此目前在该领域展开竞争的大都是在数据存储、分析等领域有着传统优势的厂商。2012年1月,Oracle正式发布Oracle大数据机。IBM在大数据领域的优势则在于全面,而机器人“沃森”在人机大战中获胜,更成为IBM为其大数据分析解决方案加分的例证。

  中国市场在这个新兴领域非常重要。中国有庞大的人口基数,IT基础设施也比较成熟,数据量是不可想象的。乐观的人已经看到了其中的机会,不论是出于应对海量数据的需要进行系统升级,还是试图从数据中挖掘价值的冲动,都有可能迎来一个充满智慧的“数据创新”时代。

  结构化数据。结构化数据可以在关系数据库中找到,多年来一直主导着IT应用;半结构化数据包括电子邮件、文字处理文件以及大量发布在网络上的新闻等,以内容为基础,这也是谷歌和百度存在的理由;而非结构化数据广泛存在于社交网络、物联网、电子商务之中。伴随着社交网络、移动计算和传感器等新技术不断产生,有报告称,超过85%的数据属于非结构化数据。

  很多人相信这些庞大的异构数据中蕴含着巨大财富——企业如果能在这些非结构化数据中挖掘知识并与业务融合,决策的依据将会更加全面和准确;在科学、体育、广告和公共卫生等其他领域中,也有着向数据驱动型的发现和决策方式转变的趋势。

  大数据的推动因素主要来自于一些大型IT公司,如谷歌、亚马逊、中国移动、阿里巴巴等,他们需要以更加优化的方式存储和分析数据。此外,还有一些来自健康医疗、地理空间遥感和数字媒体等行业的大数据需求。据市场研究公司统计,未来10年里预计数字信息总量将在2009年到2020年增长44倍,全球数据使用量将达到大约35.2ZB(1ZB=10亿TB)。

  大数据呈现出“4V+1C”的特点:(1)Variety,大数据种类繁多,在编码方式、数据格式、应用特征等多个方面存在差异性,多信息源并发形成大量的异构数据;(2)Volume,通过各种设备产生的海量数据,其数据规模极为庞大,远大于目前互联网上的信息流量,PB级别将是常态;(3)Velocity,涉及到感知、传输、决策、控制开放式循环的大数据,对数据实时处理有着极高的要求,通过传统数据库查询方式得到的“当前结果”很可能已经没有价值;(4)Vitality,数据持续到达,并且只有在特定时间和空间中才有意义;(5)Complexity,通过数据库处理持久存储的数据不再适用于大数据处理,需要有新的方法来满足异构数据统一接入和实时数据处理的需求。

  Apache的Hadoop已成为大数据行业发展背后的技术推动力,Hive和Pig等技术也经常被提到。同时,旨在从非结构化数据的庞大宝藏中获得知识和洞察力的计算机工具也正在迅速发展中。这些工具的发展依赖于不断进步的人工智能技术,比如自然语言处理、模式识别和机器学习等。

  可以预见,未来一两年内,将会涌现大量能够处理大型非结构化数据的工具和平台。除了Hadoop的批量化处理方式之外,基于流数据处理的方式也将在实时数据分析应用中发挥作用。此外,大数据热潮还将对可视化的理解和需求提出新的挑战。可视化在数据工作流中将同时起到解释和探索的作用,数据科学家会将可视化作为寻求问题以及探索数据集新特性的一种方式。

  由于大数据的技术门槛较高,因此目前在该领域展开竞争的大都是在数据存储、分析等领域有着传统优势的厂商。2012年1月,Oracle正式发布Oracle大数据机。IBM在大数据领域的优势则在于全面,而机器人“沃森”在人机大战中获胜,更成为IBM为其大数据分析解决方案加分的例证。

  中国市场在这个新兴领域非常重要。中国有庞大的人口基数,IT基础设施也比较成熟,数据量是不可想象的。乐观的人已经看到了其中的机会,不论是出于应对海量数据的需要进行系统升级,还是试图从数据中挖掘价值的冲动,都有可能迎来一个充满智慧的“数据创新”时代。

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 大数据4V理论 大数据的4V理论

收藏到: Favorites  

同义词: 大数据的4V,大数据的4V理论,4V理论

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。