科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条
科技百科
  • 人气指数: 7345 次
  • 编辑次数: 1 次 历史版本
  • 更新时间: 2009-04-17
admin
admin
发短消息
相关词条
Z检验
Z检验
加权几何平均数
加权几何平均数
简单几何平均数
简单几何平均数
简单算术平均数
简单算术平均数
贝叶斯推理
贝叶斯推理
统计方法
统计方法
逐级汇总
逐级汇总
相关分析
相关分析
统计推断
统计推断
T检验
T检验
推荐词条
希拉里二度竞选
希拉里二度竞选
《互联网百科系列》
《互联网百科系列》
《黑客百科》
《黑客百科》
《网络舆情百科》
《网络舆情百科》
《网络治理百科》
《网络治理百科》
《硅谷百科》
《硅谷百科》
2017年特斯拉
2017年特斯拉
MIT黑客全纪录
MIT黑客全纪录
桑达尔·皮查伊
桑达尔·皮查伊
阿里双十一成交额
阿里双十一成交额
最新词条

热门标签

微博侠 数字营销2011年度总结 政务微博元年 2011微博十大事件 美国十大创业孵化器 盘点美国导师型创业孵化器 盘点导师型创业孵化器 TechStars 智能电视大战前夜 竞争型国企 公益型国企 2011央视经济年度人物 Rhianna Pratchett 莱恩娜·普莱契 Zynga与Facebook关系 Zynga盈利危机 2010年手机社交游戏行业分析报告 游戏奖励 主流手机游戏公司运营表现 主流手机游戏公司运营对比数据 创建游戏原型 正反馈现象 易用性设计增强游戏体验 易用性设计 《The Sims Social》社交亮 心理生理学与游戏 Kixeye Storm8 Storm8公司 女性玩家营销策略 休闲游戏的创新性 游戏运营的数据分析 社交游戏分析学常见术语 游戏运营数据解析 iPad风行美国校园 iPad终结传统教科书 游戏平衡性 成长类型及情感元素 鸿蒙国际 云骗钱 2011年政务微博报告 《2011年政务微博报告》 方正产业图谱 方正改制考 通信企业属公益型国企 善用玩家作弊行为 手机游戏传播 每用户平均收入 ARPU值 ARPU 游戏授权三面观 游戏设计所运用的化学原理 iOS应用人性化界面设计原则 硬核游戏 硬核社交游戏 生物测量法研究玩家 全球移动用户 用户研究三部曲 Tagged转型故事 Tagged Instagram火爆的3大原因 全球第四大社交网络Badoo Badoo 2011年最迅猛的20大创业公司 病毒式传播功能支持的游戏设计 病毒式传播功能 美国社交游戏虚拟商品收益 Flipboard改变阅读 盘点10大最难iPhone游戏 移动应用设计7大主流趋势 成功的设计文件十个要点 游戏设计文件 应用内置付费功能 内置付费功能 IAP功能 IAP IAP模式 游戏易用性测试 生理心理游戏评估 游戏化游戏 全美社交游戏规模 美国社交游戏市场 全球平板电脑出货量 Facebook虚拟商品收益 Facebook全球广告营收 Facebook广告营收 失败游戏设计的数宗罪名 休闲游戏设计要点 玩游戏可提高认知能力 玩游戏与认知能力 全球游戏广告 独立开发者提高工作效率的100个要点 Facebook亚洲用户 免费游戏的10种创收模式 人类大脑可下载 2012年最值得期待的20位硅谷企业家 做空中概股的幕后黑手 做空中概股幕后黑手 苹果2013营收 Playfish社交游戏架构

贝叶斯推理 发表评论(0) 编辑词条

什么是贝叶斯推理1

  贝叶斯推理是由英国牧师贝叶斯发现的一种归纳推理方法,后来的许多研究者对贝叶斯方法在观点、方法和理论上不断的进行完善,最终形成了一种有影响的统计学派,打破了经典统计学一统天下的局面。贝叶斯推理是在经典的统计归纳推理——估计和假设检验的基础上发展起来的一种新的推理方法。与经典的统计归纳推理方法相比,贝叶斯推理在得出结论时不仅要根据当前所观察到的样本信息,而且还要根据推理者过去有关的经验和知识。

  作为一种推理方法,贝叶斯推理是从概率论中的贝叶斯定理扩充而来。贝叶斯定理断定:已知一个事件集Bi(i=1,2,...k)中每一Bi的概率P(Bi),又知在Bi已发生的条件下事件A的条件概率P(A/Bi),就可得出在给定A已发生的条件下任何Bi的条件概率(逆概率)P(Bi/A)。即P(Bi/A)=P(Bi)P(A/Bi)/(P(B1)P(A/B1)+P(B2)P(A/B2)+...+P(Bn)P(A/Bn))

  贝叶斯定理有很广的应用范围,但作为研究贝叶斯推理的起点,我们必须扩充这个定理的意义。不考虑事件集Bi,而考虑构成实际情况的一个合适模型的假说集Hi(i=l,2,...k),其中一个而且仅仅一个假说必定是真的。事件A则被重新解释为由实际情况得到的观察结果E:样本数据。在观察之前,对所有的i=l,2,...k,已知P(Hi),它们是不同假说的先验概率,构成次要的信息来源。又知P(E/Hi)即在Hi真时E被观察到的概率,它们是样本数据的似然值,也叫E相对于Hi的后验概率。经过这样的解释,贝叶斯定理仅由适用给事件测定概率变成也能给假说测定概率(可信度)的工具。

贝叶斯推理的案例

  例1参加常规x光透视检查的40岁妇女中,患乳腺癌的概率是1%。如果一个妇女患了乳腺癌,她的胸透片呈阳性的概率是80%。如果一个妇女她没有患乳腺癌,她的胸透片呈阳性的概率是9.6%。现有一个该年龄段的妇女她的胸透片呈阳性,那么她实际患乳腺癌的概率有多少?如果把患乳腺癌和不患乳腺癌作为两个互斥事件H和一H,他们的概率分别为P(H)和P(一H);把胸透片呈阳性作为在H和一H中都能观察到某一共同特征D,它在两个事件中出现的概率分别为P(D/H)和P(D/-H);那么,当D出现时,根据以上概率信息就可以计算出事件H发生的概率P(H/D)。一般将P(H)和P(一H)称为基础概率(base rate),将P(D/H)称为击中率(hit rate),将P(D/-H)称为误报率(false-alarm rate),将P(H/D)称为后验概率,其计算方法为:

  P(H/D)=P(H)P(D/H)/(P(H)P(D/H)+P(D/-H)

  这就是贝叶斯公式,利用贝叶斯公式进行推断的过程则称之为贝叶斯推理。根据公式,P(H/D)=(1%X8o%)/(1% ×80%+99% ×10%)=o.078。也就是说,阳性的检查结果表明该妇女有7.8%的可能性患病。但是Eddy用该问题让内科医生判断,结果95%的答案介于70%~80%,远高于7.8%。尽管贝叶斯公式只是一些简单的乘法、加法以及除法过程的结合,一个并没有学过该公式的人也有可能在推断中不自觉的应用这种方法,但是在包括上述乳腺癌问题在内的许多研究均发现,人们常常会犯类似的推理错误,称之为基础概率忽略(base-rate neglect)现象.Kahneman等(1982)提出启发—偏差理论(heuristics and biases approach)来解释这一现象,并由此引发了关于贝叶斯推理问题的大量研究和争论国内外关于贝叶斯推理问题的研究方法主要是实验法,将不同类型贝叶斯问题呈现给被试并要求他们解答,采用一定的指标对被试的解题过程和结果进行评价,据此来考察贝叶斯推理的认知过程和影响因素。本文以贝叶斯推理的影响因素为线索回顾了以往的研究,并对其中的一些问题进行了初步的分析和探讨。2

  例2某地区居民的肝癌发病率为O.0004,现用甲胎蛋白法进行普查。医学研究表明,化验结果是存有错误的。已知患有肝癌的人其化验结果99%呈阳性(有病),而没患肝癌的人其化验结果99.9%呈阴性(无病)。试问:在化验结果呈阳性的人中可能有多少人患有肝癌?

  如果我们用A表示样本的观察证据“化验结果呈阳性”,用H表示假说命题“被检查者患有肝癌”,那么由上面可知:

  P(H)(即某地区居民的肝癌发病率)=O.0004

  P(‘H)(即某地区居民没患肝癌的比率)=1-0.0004=0.9996

  P(E/H)(即患有肝癌者其化验结果呈阳性的比率)=O.99

  P(E/‘H)(即没患肝癌者其化验结果呈阳性的比率)=1-0.999=0.001

  现在需要我们推断的是P(H/E),即在化验结果呈阳性的条件下,假说“被检查者患有肝癌”的比率。显然,根据重新解释过的贝叶斯定理,我们可以很容易地得出P(H/E)的值。

  P(H/E)=O.0004x0.99/((0.0004x0.99)+(0.9996x0.001))=O.284

  这表明,在化验结果呈阳性的人中,真患肝癌的人不到30%。这个结果可能会使人吃惊,但仔细分析一下就可以理解了。因为肝癌发病率很低,在10000个人中约有4人患肝癌,而9996个人不患肝癌。对10000个人用甲胎蛋白法进行检查,按其错检的概率可知,9996个不患肝癌者中约有9996X0.001≌9.994个呈阳性,另外4个真患肝癌者的检查报告中约有4x0.99≌3.96个呈阳性。仅从13.954(9.994+3.96)个呈阳性者中看,真患肝癌的3.96个人约占28.4%。

  从上例可以看出,贝叶斯推理实际是借助于新的信息修正先验概率的推理方法。显然,这样的方法如果运用得当,可以使我们在依据概率作出决断时,不必一次收集一个长期过程的大量资料,而可以根据事物发展的情况,不断利用新的信息来修正前面的概率,作出正确决策。下面的例子很好地说明了这一点。1

  例3有甲、乙、丙三家工厂生产同一种零件,市场占有率分别为10% 、25%和65%。已知甲、乙、丙三家工厂生产零件的不合格率分别是30% 、20%和10%。现从市场上某批零件中随机抽取一件,经检验该零件不合格,则这个零件由甲厂、乙厂、丙厂生产的可能性各是多少?

  在没有抽取零件之前,我们知道,来自甲厂的产品其可能性是10% ,来自乙厂的可能性是25% ,来自丙厂的可能性是65%,这些就是先验概率。相比来说,丙厂生产产品的概率最高。现在我们在市场上随机抽出的是不合格品,这是一个新的信息,可以利用这个信息修正先验概率。如果我们用E表示“抽出的零件是不合格品”,用H1、H2和H3分别表示假说命题“这个零件是由甲厂生产的”、“这个零件是由乙厂生产的”、“这个零件是由丙厂生产的”,那么由上面可知:

  P(H1)=O.1 P(H2)=O.25 P(H3)=0.65

  P(E/H1)=O.3 P(E/H2)=O.2 P(E/H3)=O.1

  根据贝叶斯推理我们可以很容易地得出P(H /E)、P(H )和P(H/E)。其中

  P(H1/E)=O.1×O.3/((0.1xO.3)+(O.25x0.2)+(O.65x0.1))=0.207

  P(H2/E)=O.25x0.2/((0.1×O.3)+(O.25x0.2)+(O.65x0.1))=O.345

  P(H3/E)=O.65x0.1/((0.1×O.3)+(O.25x0.2)+(O.65x0.1))=O.448

  显然,根据上面的结果,我们判断该零件是丙厂生产的可能性已从65%下降到44.8%,而该零件是乙厂生产的可能性已从25%上升到34.5% ,是甲厂生产的可能性也已从1O%上升到2O.7%。

  在上面的例子中,如果随机抽取一件产品还不能提供充足的信息,可以再随机抽取一件产品以获取更多的信息。现在我们假定连续抽取两件产品都是不合格品,那么这批产品来自各厂的可能性又是多少呢?为了说明这个问题,首先要分别计算甲厂、乙厂、丙厂产品连续抽取两个都是不合格品的概率各是多少。这里假设产品是无限的,则有

  P(E/H1)=O.3xO.3=0.09

  P(E/H2)-0.2xO.2=0.04

  P(E/H3)=O.1xO.1=0.O1

  然后仍然根据贝叶斯推理依次地得出P(H1/E)、P(H2/E)和P(H3/E)。其中

  P(H1/E)_0.1 xO.09/((0.1xO.09)+(O.25 xO.04)+(O.65 XO.O1))=O.353

  P(H2/E)=O.25x0.04/((0.1xO.09)+(O.25xO.04)+(O.65XO.O1))=O.392

  P(H3/E)=O.65x0.01/((0.1×O.O9)+(O.25xO.04)+(O.65XO.O1))=O.255

  根据上面的结果,我们可看到,如果连续两次抽取的都是不合格品,则这批产品来自甲、乙、丙三厂的可能性为35.3%、39.2%和25.5%。这种情况下,这批产品来自乙厂的可能性变为最大。

  我们还可以再进一步,假定从一批产品中随机抽取三件产品,抽样结果是:不合格、不合格、合格。此时甲厂、乙厂、丙厂产品抽取结果为不合格、不合格、合格的概率分别为(此时A表示“抽出的零件是不合格、不合格、合格”)

  P(E/H1)=O.3xO.3x(1-O.3)=O.063

  P(E/H2)=O.2xO.2x(1-0.2)=O.032

  P(E/H3)=O.1xO.1x(1-0.1)_0.009

  根据贝叶斯推理依次地可得出这批产品来自甲、乙、丙三厂的可能性分别为

  P(H1/E)=O.1xO.063/((0.1xO.063)+(O.25xO.032)+(0.65x0.O09))=0.313

  P(H2/E)-0.25xO.032/((0.1xO.063)+(O.25xO.032)+(0.65x0.OO9))=0.397

  P(H3/E)=O.65xO.O09/((0.1xO.063)+(O.25xO.032)+(0.65x0.009))=0.290

  显然,根据新的抽样信息,我们修正了先验概率,使来自甲、乙、丙三厂的概率分别修正为31.3% 39.7%和29.O%。

  我们再来看一个用贝叶斯推理分析伊索寓言“孩子与狼”的例子。

  伊索寓言“孩子与狼”讲的是一个小孩每天到山上放羊,山里有狼出没。第一天,他在山上喊:“狼来了!狼来了!”,山下的村民闻声便去打狼,可到山上发现狼没有来。第二天仍是如此。第三天狼真的来了,可无论小孩怎么喊叫,也没有人来救他,因为前二次他说了谎,人们不再相信他了。现在用贝叶斯推理来分析此寓言中村民对这个小孩的可信程度是如何下降的。

  我们用E表示“小孩说谎 用H表示“小孩可信”。不妨设村民过去对这个小孩的印象为P(H)=0.8,则P('H)=0.2

  我们现在用贝叶斯推理来推断P(H/E),也即这个小孩说了一次谎后,村民对他可信程度的改变。

  在贝叶斯推断中我们要用到概率P(E/H)和P(E/'H),前者为可信的孩子说谎的可能性,后者为不可信的孩子说谎的可能性。在此不妨设P(E/H)=0.1,P(E/'H)=0.5

  第一次村民上山打狼,发现狼没有来,即小孩说了谎。村民根据这个信息,对这个小孩的可信程度改变为P(H/E)=0.8x0.1/((0.8x0.1)+(O.2x0.5))=0.444这表明村民上了一次当后,对这个小孩的可信程度由原来的O.8下降到了O.444。

  在此基础上,我们再一次用贝叶斯推理来推断P(H/E),也即这个小孩第二次说谎后,村民对他的可信程度改变为P(H/E)=0.444x0.1/((0.444x0.1)+(O.556x0.5))=0.138这表明村民们经过两次上当,对这个小孩的可信程度已经从O.8下降到了0.138,如此低的可信度,村民听到第三次呼叫时怎么再会上山打狼呢?1

  例4通过观察知道,牵牛花是在黎明4时左右开放,野蔷薇是在黎明5时左右开放, 龙葵花是在清晨6时左右开放,芍药花是在清晨7时左右开放。它们开放的时间虽然不同,但都有确定的开放时间,由此可见所有的花都有确定的开花时间。

  显然,这是一个简单枚举归纳推理,相对于观察前提,结论“所有的花都有确定的开花时间”可靠吗?结论为真的可信程度有多大?是否可以用量来刻划?这些问题用贝叶斯推理的方法是可以解决的。

  我们用E1、E2、E3、E4分别表示牵牛花有确定的开放时间、野蔷薇有确定的开放时间、龙葵花有确定的开放时间、芍药花有确定的开放时间,它们的合取用字母E来表示。结论“所有的花都有确定的开花时间”用H表示。这样,我们现在需要确定的就是P(H/E)。

  根据贝叶斯推理的形式,我们有

  (1)P(H/E)=P(H)xP(E/H)/P(H)xP(E/H)+P('H)xP(E/'H)由于枚举归纳的前提可从结论中必然推出,即P(E/H)=1。因此,由(1)可得:

  (2)P(H/E)=P(H)/P(H)+P('H)xP(E/'H)根据逻辑否定规则,由(2)可得出:

  (3)P(H/E)=P(H)/(H)+(1-P(H))xP(E/'H)

  在(3)中,P(E/'H)表示,假定归纳结论H不真,E(即E1、E2、E3、E4等)为肯定事例的概率。

  现在上面的问题可以解决了。相对于背景知识,已知归纳结论H 的先验概率P(H)=0.5,在H不真时“牵牛花有确定的开放时间”、“野蔷薇有确定的开放时间” 等肯定事例出现的先验概率P(E /‘H)=0.8。把以上数据代入(3)得:

  P(H/E)=0.5/0.5+(1-0.5)x0.84

  = 0.5/0.70

  = 0.71

  这说明,相对于观察证据E1、E2、E3、E4而言,归纳结论H(所有的花都有确定的开花时间)的可信程度为百分之七十一。1

贝叶斯推理的影响因素2

  1.问题内容

  贝叶斯推理问题总是通过某种具体事例来进行表述的。KahnemanAmos Tversky认为,被试在概率推理中使用了代表性启发式(representativeness heuristics),他们进行推断所依据的是问题内容中特征对事件的代表性程度而不是贝叶斯规则删。按照他们的理论,在前述的乳腺癌问题中,由于阳性的检查结果很大程度上代表了有病的信息,所以被试在判断中忽略了问题的基础概率,而主要根据击中率信息进行推理。Gavanski等同所提出的自然抽样空间(natural sample spaces)理论认为,被试的判断错误不在于忽略了基础概率,而是把后验概率P(H/D)表征为了击中率P(D/H),因为从事件H (患有乳腺癌)中抽取特征D (检查呈阳性)的取样方式更为自然。或者说,事件是原因,特征是结果,从原因到结果的取样方向才更符合人类的思维习惯。事件与特征之间的因果关系或代表性程度都是由问题的内容所决定,因此可以认为这两种理论都是从问题内容角度来解释贝叶斯推理中的认知错觉的。后来的一些研究者虽然也使用了不同内容的贝叶斯问题,但主要是考察它们的平均效应,很少考虑到问题内容对贝叶斯推理的影响。

  Girotto和Gonzalez(2001)在他们的研究中使用了疾病问题、入学问题等贝叶斯推理任务,他们发现被试在这两类问题上的推理成绩并没有表现出显著差异,即贝叶斯推理问题不存在内容效应(efect of content)。但有研究者认为,人们对入学考试和医学检查的结果都比较信赖,因此,以考试结果预测录取率和以检查结果预测患病率一样具有权威性,仍然可以用代表性启发法进行推断。研究者自行编制了“作家问题”,将贝叶斯问题中的事件与特征换成了作家和影迷。影迷与作家之问并不像阳性与疾病之间那样存在着关联,因此不能用代表性启发法进行推断。他们将作家问题与疾病问题进行对比研究,发现在同样的基础概率、击中率和误报率条件下,人们对作家问题的概率估计值显著低于疾病问题,并由此得出结论:贝叶斯推理中存在着内容效应。

  近年来,随着社会认知研究的兴起,越来越多的研究开始关注“热”认知的过程。张向阳等(2006)设计不同内容的问题研究了情绪、动机等因素对贝叶斯推理的影响。他们采用2(事件性质:积极事件/消极事件) ×2(事件与主体的关系:与主体有关/与主体无关)的混合设计进行实验,其中事件性质为被试内因素,事件与主体关系为被试间因素。研究发现被试对于消极事件的概率估计值显著低于积极事件,对与己有关的消极事件的概率估计值显著低于与己无关的消极事件 。

  由此可见,问题内容会导致被试在认知、情绪和动机等方面产生一定的倾向性,从而在不同程度上影响贝叶斯推理的结果。这与主观概率的支持理论是一致的,该理论认为:人类在不确定条件下的概率判断不符合外延性原则(extensionality principle)而是表现出描述依赖性,即对同一外延事件的不同描述所做出的主观概率不同。

  2.信息格式

  信息格式(information format)指的是贝叶斯推理问题中概率数据的形式,包括数据的类型及其相互关系。早期研究中采用的数据大都是百分数形式,Gigerenzer和Hoffrage(1995)指出,从进化论角度来说,人类祖先在其进化环境中所遇到的信息形式是自然频数(natural irequencies)格式而不是近代才出现的概率和百分数形式,被试在某些问题中犯推理错误并不说明人类不能按照贝叶斯规则进行推理,而是由于问题的信息格式与人类的认知算法规则不一致造成的。他们用自然频数的信息格式,对乳腺癌问题中的概率信息进行如下表述:每1000名妇女中有10名患有乳腺癌(对应于1%的基础概率)。在患有乳腺癌的10名妇女中,有8名妇女胸透片呈阳性(对应于80%的击中率)。未患乳腺癌的990妇女中,有95名胸透片呈阳性(对应于9.6%的误报率)。研究发现:在自然频率形式条件下,46%的判断符合贝叶斯定理,而概率条件下只有16%的判断符合贝叶斯定理。因此他们认为,采用自然频数的信息格式可以帮助人们在无需刻意指导的情况下按照贝叶斯规则进行推断 。Cosmides和Tooby(1996)同意Gigerenzer和Hoffrage的生态与进化观点,并通过进一步的研究支持了他们的理论{“1。Sedlmeier等(2001)也认为自然频数格式更符合人类的信息表征方式,他们采用相应的“频数树”(Frequency Tree)方法对人们的贝叶斯推理能力进行训练,并认为该方法可以使人们更快的学会使用贝叶斯推理规则,其效果优于“概率树”(Probability Tree)训练法 。

  Lewis和Keren(1999)认为,自然频数格式下的乳腺癌问题改变了两个因素:一是,数据形式由概率变为频数;二是,信息取样方式由条件式(conditiona1)变为结合式(joint)。他们提出了条件式频数的信息表征方式:每1000名妇女中有10名患有乳腺癌(对应于1%的基础概率)。在患有乳腺癌的妇女中,每1000人中有800名妇女胸透片呈阳性(对应于80%的击中率)。未患乳腺癌的妇女中,每1000人有96人胸透片呈阳性(对应于9.6%的误报率)。研究发现,被试在该条件下的正确率为4%,显著低于结合式频率(即自然频率)条件下的30%。因此他们认为被试成绩的提高不是因为数据形式由概率变为了频数,而是信息由条件式变为了结合式。Mellers和McGraw (1999)则认为,频数和结合式都可以改进贝叶斯推理,哪种条件占优势取决于事件的性质。频数格式比概率格式更有利于人们对稀有事件的理解,此类问题中,频数格式更容易提高被试的成绩;结合式有助于人们建立适宜的心理模型(mental models),一般性事件中,他的优势会更加明显 。

  Fiedler等(2000)也对Gigerenzer和Hoffrage的研究提出质疑,他们认为自然频数格式一方面将数据形式由概率变为频数,另一方面也将参照尺度(reference scale)由不一致变为了一致。自然频数格式中,所有信息都是来自同一个1000人的样本,有着一致的参照尺度,数据之间可以进行直接的比较和计算,因此推理显得容易。他们通过实验研究发现,无论哪一种数据形式,只要参照尺度一致,被试进行推理的成绩都比较好。由此同样证明了频数并不是成绩提高的关键。

  Girotto和Gonzalez(2001)认为是提问形式和信息结构共同影响了推理成绩。自然频数的表述中,不仅是将概率数据变成了频率数据,而且还将提问形式由一步变成了两步(...人中有...人),将信息结构由未分割数据变为了分割数据(partitioned data)。所谓分割结构数据就是将1000分割为了10和990两部分,又从10中分割出8,从990中分割出95。他们通过实验考察了提问形式、信息结构以及数据类型等因素,结果发现,无论在概率还是频数格式下,两步提问的贝叶斯推理的成绩优于单步提问的成绩,具有分割的信息结构的问题成绩优于不具有分割信 结构的问题。

  以上关于贝叶斯推理的信息格式的研究和争议最初是源于Gigerenzer和Hofrage提出的自然频数理论。但后来的研究者似乎误解了他们的原意,主要是在“频数”上作争论,而忽视了“自然”的意义。Gigerenzer和Hofrage强调,他们所说的频数并非任意形式下的频数,而是通过自然取样获得的自然频数。因为自然频数携带了有关基础比率的信息,所以简化了贝叶斯计算。很显然,他们所说的“自然频数”就是Lewis和Kere所说的“结合式频数”、Fiedler等所说的“一致性参照尺度下的频数” 以及Girotto和Gonzalez所说的“分割结构的频数”。这些研究者都同意,该方式下推理会变得简单。但频数是否能起到作用呢?Gigerenzer和Hofrage不同意其他研究者的观点,他们通过考察“结合式频数”和“结合式概率”两种条件,发现前者的成绩明显好于后者。但Fiedler等(2000)的研究表明,这两种条件下,被试成绩的差异是不显著的 ,这可能与两种研究使用了不同的表述方式有关。总的来说,信息格式中所包括的数据类型和结构都会对贝叶斯推理的成绩产生影响,其中后者的作用更为明显。

  3.信息呈现方式

  大多数有关贝叶斯推理的研究中,概率信息都是以整理好的百分数或自然数的形式直接呈现给被试的,但也有的研究中采用另一种信息呈现方式, 得到了一些不同的结果。Fiedler等(2000)将乳腺癌问题中的患病信息和诊断信息分别在卡片的正反两面先后呈现给被试,让他们根据其中一种信息搜索另一种信息。例如,先在电脑上呈现患病信息,被试点击后反馈诊断信息。研究发现,被试根据诊断信息搜索患病信息时,判断的准确性更高,且与相反条件下差异显著 。李晓明等(2004)模拟人们平时获得信息的情景对贝叶斯推理问题进行了研究,他们将患病信息和诊断信息以样例的方式逐个呈现给被试,例如,其中一个样例为“体检者1号,化验结果:阴性;诊断结果:没有甲病”,依此类推。测试阶段为“体检者11号,化验结果:阳性;诊断结果:请你判断该人实际患有甲病的概率有多大?” 研究发现被试在该条件下的成绩优于概率信息集中呈现条件下的成绩,但是比频率集中呈现条件下的成绩差。一般将这种让被试在实验中通过经历事件过程主动收集信息的研究范式叫做经验范式,而将直接在实验中向被试提供概率信息的方式称为文本范式。不同的信息呈现方式会影响信息的获取与加工方式,从而影响推理的过程与结果。

  4.个体因素

  除了问题本身的内容、信息格式和呈现方式等因素之外,推理者的知识、经验以及思维方式等因素也会影响贝叶斯推理问题的解决。张向阳等(2006)认为,医务人员之所以对人患病的概率作出高估,可能正是他们的医学经验在起作用。另一方面,如果被试具备相关的概率知识,则可能会促进贝叶斯推理问题的解决。研究者以被试的知识背景为自变量,用专家(有概率知识的数学系大学生)和新手(无概率知识的其他系大学生)进行对比实验。研究表明:在贝叶斯推理中,专家的概率知识背景有助于他们运用贝叶斯规则进行推理,概率估计准确性明显好于新手。这一结论与史滋福等(2006)的研究结果有所不同,他们以数学系和中文系的大学生为被试进行实验,发现两者之问概率估计的准确性没有显著差异。研究者认为,文理科被试之间并不存在所谓的思维类型不同而导致复杂概率推理成绩差异的现象。傅小兰等(2005)在考察不同信息表征方式对贝叶斯推理的影响时发现,中外被试在某些条件下的表现不同甚至相反。在Girott0和GonZalez的研究中,被试解决两步问题的成绩总是优于解决一步问题的成绩。而傅小兰等的研究却表明:对于中国被试而言,两步问题形式并不能改进他们解决贝叶斯推理问题的成绩,甚至在某些情况下还会干扰他们做出正确的回答。研究者认为,这可能在一定程度上反映了东西方人的不同思维风格和特点:对西方人而言,分析性的思维操作有助于他们顺利解决贝叶斯推理问题,而中国被试面对贝叶斯推理问题时则更倾向于整体性解决,因此,他们解决两步问题与解决一步问题的成绩之间没有出现显著差别,甚至解决一步问题的表现可能还会更好一些。另外,问题提问信息格式对中国被试解决贝叶斯推理问题也有影响,与概率格式相比,频数格式可以显著改善两步问题的贝叶斯推理成绩。这也与Girotto和Gonzalez的研究结果也不一致。后者的研究结果表明,问题提问的信息格式不影响被试解决贝叶斯推理问题的成绩。研究者认为,这可能也是由于东西方人思维方式的差异造成的。

参考文献

  1. 1.0 1.1 1.2 1.3 贝叶斯推理方法探讨,苑成存.统计与决策,2007年23期,页码:166-168
  2. 2.0 2.1 姚双雁,钟毅平.贝叶斯推理的影响因素研究述评.社会心理科学.2007年22卷5期,页码:38-42,48

相关条目

→如果您认为本词条还有待完善,请 编辑词条

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

标签: 贝叶斯推理

收藏到: Favorites  

同义词: 暂无同义词

关于本词条的评论 (共0条)发表评论>>

对词条发表评论

评论长度最大为200个字符。