科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 3015 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2009-03-18
admin
admin
发短消息
相关词条
bat
bat
Processing语言
Processing语言
固件
固件
SSID
SSID
LAMP
LAMP
Flash和HTML5
Flash和HTML5
沙盒
沙盒
六种主要计算机语言优缺点
六种主要计算机语言优缺点
系统集成
系统集成
间谍软件
间谍软件
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

目录

数据分析编辑本段回目录

 

正文编辑本段回目录

  分析数据的技术和理论。
  数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作判断,以便采取适当行动。例如J.开普勒通过分析行星角位置的观测数据,找出了行星运动规律。又如,一个企业的领导人要通过市场调查,分析所得数据以判定市场动向,从而制定合适的生产及销售计划。因此数据分析有着极广泛的应用范围。
  数理统计学也是一门以收集和分析数据为内容的学科,它与数据分析不同之处在于数理统计学中所涉及的数据是受到随机性的影响,分析的目的是对数据所来自的总体作出推断,总体有一定的概率模型,推断的结论也往往以概率的形式表达。但在一般的数据分析中,则不包含这些要求。例如,分析20世纪以来北半球年平均气温的数据,以确定是否有变冷或变暖的趋势。从数理统计的观点,年平均温度数据应看成是从一个总体抽取的样本,这种看法在本问题中显得牵强;而数据分析则不受这些约束,它的出发点就只是数据本身,即所谓“让数据本身说话”。所以,广义地说,可以把数理统计学看成是数据分析的一部分;但一般只把那种数学模型不明显,或模型需要借助于分析已有的数据而提出,或者根本不需要模型等情况,列入数据分析的范围。
  典型的数据分析工作可能包含以下几个步骤。首先,当数据刚取得时,可能只是一大堆杂乱无章的数字,不仅看不出其规律性,甚至也不知道如何着手寻找其中可能隐含的规律性,于是就通过作图、造表、用各种形式的方程拟合、计算某些特征量等手段探索规律性的可能形式,即往什么方向和用何种方式去寻找和揭示隐含在数据中的规律性。这一步工作叫探索性数据分析。J.W.图基在其著作《探索性数据分析》中对此进行了详细的论述。第二步是模型选定分析,在探索性分析的基础上提出了一类或几类可能的模型,然后通过进一步的分析从中挑选一定的模型。例如研究两变量xY的关系,初步分析可以用不超过三次的多项式去拟合,还要进一步确定其次数,并且估计出多项式各项的系数。又如,在一个包含多个自变量的回归问题(见回归分析)中,经判定认为具有线性关系,则进一步需要确定使用哪些自变量,如何估计方程中的系数。如果数据是来自一个统计总体,则这一步实际上是数理统计学的研究对象。最后一步是推断分析,通常使用数理统计方法对所定模型或估计的可靠程度和精确程度作出推断。例如,检验由上面所定出的模型是否可用。这一步工作完全属于数理统计学的范围,若不假定数据有一定的统计结构,则无法进行,只能将第二步所得模型付诸实用,以对所研究的现象提出一种假说或作出某种采取行动的方案,再由以后收集到的数据去检验和修正。
  因此,狭义的数据分析主要是指探索性数据分析。有时根据问题的需要和现实的可能只能做到第一步,有时则必须进到模型选定分析。探索性数据分析是在尽量少的先验假定下处理数据,以表格、摘要、图示等直观的手段,探索数据的结构,及检测对于某种指定模型是否有重大偏离。它可以作为进一步分析的基础,也可据以对数据作出非正式的解释。实验者常常据此扩充或修改其实验方案,重作实验。图形由于其形象性,容易为人所理解,故作图法是探索分析的重要方法。图基在上述著作中把探索分析放在模型选定分析与推断分析之前,提高了人们对于“让数据说话”和“探索”的重要性的认识。对一、两个变量和为数不多的数据,用笔和坐标纸就可以进行探索分析。计算机及其作图设备的人机对话功能提供了充分探索的可能性,例如用不同方法看数据,进行数据变换,图示,考察残差等等。至于怎样对多变量、大批量、复杂结构的数据作合适而有效的探索分析,已引起广泛注意。
  数据分析离不开外部的知识和判断,形式化的数据分析方法只是一种辅助性手段,以帮助人们进行判断或推理。在有些问题中,上述三个步骤的某一步骤可以跳过或简略地进行,而在进行过程中又可能返回前面的某一步骤。在作数据分析时,必须注意所得结果是近似的,对它的解释可能不完全正确。例如,开普勒曾发现太阳系中当时已发现的6个行星轨道的某种数据,与5种正多面体有微妙的关联,由此他解释为什么行星恰好是 6个。这一点现在知道并不正确。所以数据分析所发现的事实及其解释,最终要接受以后数据的检验。
  数据及其结构、数据分析的问题及目的,都是多种多样的,来自不同的领域,具有不同的特性,从而数据分析可划分成许多课题。它尚未定型,与数学、统计学、计算机科学等学科和技术都有密切关系,正在蓬勃发展,对促进科学技术的进展有重要作用。
  参考书目
 J.W. Tukey,Exploratory data Analysis,Addison-Wesley, Reading, Mass., 1977.

 

配图编辑本段回目录

 

相关连接编辑本段回目录

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 数据分析

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。