科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条

最新历史版本 :数字化末日 返回词条

  • 编辑时间: 历史版本编辑者:高兴
  • 内容长度:图片数:目录数:
  • 修改原因:
目录

数字化末日回目录

再过一个世纪左右,人类会面临一场数字化时代的灾难。除了记录在书面上的文字外,那时将只有很少一部分数字化信息会保留下来。人类将采取什么措施来加以应对?

图1:信息能够以多种格式储存起来,但在未来人类有办法阅读它们吗?

“11月15日,金星在西方消失,三天后,即11月18日,金星又在东方出现。”

这一段对金星的精确描述由3500年前的巴比伦天文学家所记录。我们之所以知晓这些事情是因为在古巴比伦人的泥板文书上都有相关的记载。这一块被后人称为阿米萨杜卡金星泥板(Venus Tablet of Ammisaduqa)上的记录,是在上述文字出现1000年之后刻上去的,大部分都完好地保存了下来。如今,人们可以在伦敦的大英博物馆看到这件文物。

当然,现在的人类拥有许多古巴比伦人无法想象得到的知识。我们不仅能仔细观察金星,还可以向那里派出宇航飞船。如今的天文学者可以穿越时空,观测到太阳系外的星球,能够追溯到宇宙的起源。工业家正在将沙和石油转化为更为小巧、更为复杂的机器,这是一种连历史中的炼金术士做梦都无法想到的魔法。生物学家正在重新组合构成生命的配方,获得了一度被认为只有神才拥有的权力。

然而,在人类获得了前所未有的的海量知识时,我们储存知识的方式却变得更加脆弱和短暂了。如果人类的文明陷入困境之中,首先面临到的问题是,人类可以生存下去吗?

当然,万一遭到一次足以毁灭全人类的灾难,例如行星撞地球,这个问题将会无关紧要。即使有另外一种智能生物入侵地球,在那之前所有的人类踪迹也都已经无影无踪。

但是,让我们来假设一下,如果地球发生了较为轻微的灾难,在灾难过后人类的众多建筑物都完整地保存了下来,有小部分人类生存了下来,之后人类要经过几十年或几个世纪需要重建人类文明。例如说,全球金融系统崩溃,或者一种新的病毒杀死了世界上的大部分人口,或者太阳风暴摧毁了北美洲的电网。又或者说不断上升的能源成本和恶化的环境灾难让人类付出了惨重代价。人类社会的复杂性和相互依赖性不断增加,使得人类文明在遇到上述灾难时都脆弱得不堪一击。

不管何种原因,如果储存了大量信息的银行电脑突然断电,人们再也不能顾及自身,工厂停止了生产新的芯片和驱动器,那时人类的知识能够保存多久?经过一场如此惨烈的灾难,在几十年或数个世纪后,人类的知识还能有多少能够保存下来?

国家机密信息丢失的后果

即便不发生任何大的灾难,知识的流失仍然不可避免。人类正在产生比以往时代更大的信息量,而储存这些信息的媒介却不大可靠。大部分丢失的信息都不太重要,你的硬盘坏死之后,没有了全家福照片和视频,你的后代仍然会过得很好。但有些信息却并非如此。例如,在2008年,有消息称美国已经“遗忘”了一种制造核弹头的秘密成分的制作方法,该成分被称之“雾堤”(Fogbank)。没有保留下充足的信息,当时的关键工作人员也已经退休或离职。这一失误导致美国在核弹头整修计划中增加了6900万美元的开支。

如果出现持续断电的情况,人类的文化遗产将主要依赖于硬盘驱动器的保存。这一技术成为了如今人类社会的工作存储器。包括最新的基因组扫描、政府和银行的数据记录,再到我们个人的信息,这些信息都保留在硬盘之中。这些信息大部分都存储在一个充满服务器的机房中。

硬盘从来不是为了长期储存数据而使用的媒介,这一工具从未接受过类似CD光盘之类的测试以估计其使用寿命。没人能确定硬盘的储存时间。凯文·穆瑞尔(KevinMurrell)是英国国家计算博物馆的董事,最近启用了一块456兆字节的硬盘,这块硬盘自1980年代初其断电之后就从未使用过。他说:“从硬盘中获取数据根本没有问题。”

现代的硬盘还没有到退出历史舞台的时候。硬盘的存储密度为每英寸200千兆字节,而且仍然在不断增加。如今的硬盘具有复杂的系统,这可以弥补小部分扇区发生故障的缺陷。通常情况下,你往硬盘里存储的数据越多,如果有部分扇区损坏或退化,你丢掉的数据就会越多。更重要的一点是,大面积数据的退化过程可能会毁掉小部分扇区的内容。穆瑞尔说:“对于现代硬盘的看法,人们还莫衷一是。我们还要再等二十年再来定夺。”

位于安大略省渥太华的加拿大保存技术研究院(Canadian Conservation Institute)的乔·艾拉斯(Joe Iraci)专门研究数字媒介的可靠性,他说:“最为重要的数据会以磁带或光盘的格式备份起来。不幸的是,这些格式的文件不都可信,甚至有的只能维持五年时间。”

艾拉斯进行的“加速老化”测试,通常会将媒介曝露在高温和高湿度的条件下,表明最为稳定的光盘是具有金制反射层和酞菁染料层的可记录CD光盘。他说:“我认为如果人们使用这种光盘,用它来记录数据的话,数据将会储存一百年。如果使用其他光盘的话,一般储存的时间会在五到十年左右。”

数据瞬间消失

目前使用越发普遍的闪存驱动器比硬盘驱动器更缺少恢复能力。它们储存数据的时间还不太清楚,因为目前没有进行过相关的独立测试,但有一家生产厂商警告用户使用时间最好不要超过十年。同时有些新出现的存储技术或许比闪存更加稳定,但人们的关注点在于提升其速度和容量,而不是其稳定性。

当然,媒介储存的条件远比它们的固有稳定性更加重要。保持在干燥、凉爽环境下的驱动器通常要比曝露在湿热条件下的驱动器能够维持更长的时间。有一些机房专门是用来长期维持这样的条件,以防止电源断电的情况。但是大多数驱动器都旋置在普通建筑物内,有些场所极易受到地震或洪水的侵袭。如果有一天人类文明真的瓦解,天知道那些对资源求之若渴的幸存者们该会多么疯狂地寻找那些古老的硬盘驱动器。

然而,狂热的太空迷丹尼斯·温格(Dennis Wingo)和凯思·柯文(Keith Cowing)认为,储存数据的物理条件只是恢复数据难题的起点而已。他们两人在加利福尼亚州莫菲特基地负责美国宇航局艾姆斯研究中心(Ames Research Center)的一个项目,该项目的目的是为了从一些旧磁带中获取高分辨率的图片。这些旧磁带包含着1960年代五次月球探测器任务中发回的原始数据。在当时,只获取到了低分辨率的图片。这些磁带用塑料包裹着,放置在一个防磁的金属罐中,仍然处于原来的状态。温格说:“我曾遇到过相似年代的商业磁带项目,在我的经历中可说是一个奇迹了。”

最大的挑战

但是要从磁带中取出数据,这个团队首先必须让之前的美国宇航局员工将旧有的磁带驱动器修复好,这是该项工作中所面临的最大挑战。柯文说:“在这些磁带里,其中一个里面生活着一条蜥蜴。”一旦他们开始取出原始数据,只能在三个月调查中利用“解调”方程式打开这个文档之后,才能将其转换为可用格式。

现今有大批的热心人士会提供大笔资金,从这些保养得很好的磁带中提取出数据,那我们可以想象一下如果人类面临灾难之后的情况会怎样呢?即便有大量的计算机可以读取硬盘驱动器,恢复这些数据也不是轻而易举之事。英国萨里郡埃普索姆的“克罗尔在轨数据恢复”(Kroll Ontrack Data Recovery)机构的高级工程师罗伯特·温特(Robert Winter)说:“如今的许多数据都利用特殊软件进行了编码处理或设置为了只读模式,这些数据可能储存在机房有二十或三十年之久并且没有被人动过,并且有些数据的提取还需要对驱动器进行解体。”罗伯特·温特曾在2003年成功恢复了失事后的“哥伦比亚”号航天飞船中硬盘驱动器里的数据。

确实,如果有些事情从起点就是错误的,那么即便我们现在的这个世界充满了充足的电力,恢复数据也会变得非常棘手。例如在去年,由于部分服务器出现了故障,这让微软公司花费了数周时间为Sidekick手机用户来恢复他们的大部分个人数据。

在发生灾难之后,由于人力、专业技术以及设备等资源的匮乏,或许会造成比数据丢失更大的障碍。并且资源本身很可能就是稀缺的。重新创建一次工业文明要困难得多,因为我们已经用尽了大部分的可用资源,不论是石油还是高级矿石,那时都已经所剩不多。

可那些储存在硬盘驱动器中大部分丢失的数据真得有那么重要吗?毕竟,人类从过去的文明中所继承下来的都是些缺少实用价值的知识,例如阿米萨杜卡金星文书中大部分都由一些占星术组成的。与此相似,大量的垃圾信息都储存在世界各个角落的服务器中,包括网上商店和最新名人视频等等,似乎这些数据也都可有可无。

即便是一些具有价值的科学数据也是可质疑的。例如,如果没有了探索基因序列的技术和专家,那人类知道自己和其他有机体的基因序列还有什么用处呢?一些科学实验现在也在产生数拍字节(petabytes)的数据,将其保存起来也会成为一项重大的挑战。大量材料也成为了问题,人们在试图确定这些材料中哪些重要、哪些不重要。在图书馆中确定一本书的重要性相对而言是很容易的,但面对快速增长的硬盘数据通常都毫无办法了。

流行之巅,大众痴迷

更为重要的是,自数字化时代开始保存下来的那些最久远数据不一定是最重要的。有些数据的复制(备份)数量越多,这些数据的保存、发现和恢复的机会就会越大。有些数据之所以复制的数量如此之多,是因为它们对人们非常有用,就像操作系统一样,但大多数的数据会逐渐从人们的记忆中消失。

这就意味着,一些数字化版本的流行音乐和电影可能会保存达到数十年之久,流行组合阿巴(ABBA)的音乐在22世纪可能还会爬上音乐排行榜的第一名。但是有些文本、手册和草图的数据,其复制的数量相对而言就要少得多,但这些数据包含了某种专业知识的精华部分,它们关系到未来人类如何重建文明这件大事,比如说熔炼钢铁和制造抗生素的方法。

或许在半个世纪之后,人类将会面临最为重要的数据损失,因为目前依然健在的工程师、科学家和医生都会开始迈向老年阶段。到了那个时候,当他们开始发现重要的信息并打算再次操作一些重要的机器时,他们的技术和专业知识就会产生巨大的差异。例如,正是在已经退休的工程师的帮助之下,人们才恢复了美国宇航局磁带驱动器的旧有数据。柯文说,如果没有类似专家的帮助,从磁带中提取数据就会花费漫长的时间。

再过一个世纪左右,人类会面临一场数字化时代的灾难。除了记录在书面上的文字外,那时将只有很少一部分数字化信息会保留下来。加拿大保存技术研究院的谢西晨(音译,Season Tse)专门研究纸制保存技术,他说:“即便是最糟糕的纸张,上面的信息也能保存一百多年。”他说,世界现存最为古老的印刷书籍可追溯至公元868年,1907年在中国西北部的一个洞穴中发现。

如果纸张不是用作燃料或者厕纸的话,它们将会保留几个世纪之久。纸张虽然易碎、也会褪色,但是上面的文字依然清晰可见。所以需要再一次重申,那些最受欢迎的书籍是最有可能保存下来的。不妨想象一下,你拼了命一样地想要在床下寻找一些蕴含古老智慧的书籍,却找到了深藏已久的一堆《花花公子》杂志时,会是一种什么样的感觉。

并不是最终保留下来的数据就是最重要的,重要的是人类最终可以选择确定保存何种知识作为人类文明的遗产。作出选择的这些人更有可能选择那些有用的知识,而不是琐碎细微的知识。英国剑桥大学的古典主义学者保罗·卡特里奇(Paul Cartledge)说,公元前六世纪在一个弹丸之地,也就是古希腊帝国,由那里的人类开创了一种理性的、经验的、探寻精神的文化。从那时到现在,这种文化一直都保留了下来,尽管它并不能代表当时主流文化的全部内容。

因此,只要掌握这种探寻文化的子孙后代能够生存下去,我们的大多数科学知识和技术或早或晚都能被重新发现或重新发明出来。如果没有了这类人的存在,那么人类社会长久保存的文化遗产就将永远会是那些市场上的畅销作品,例如《毛泽东语录》、《童子警探》或者《指环王》。

让知识千年不死!

目前保存重要数据的策略是同时几个复制版本储存在不同的场所,有时也会储存为不同的数字格式。这可以防止类似于飓风、地震等这样的突发事件,但长久而言这也是于事无补。“今日永存基金会”(Long Now Foundation)是一个专门致力于长期保存人类文化的机构,它位于美国加利福尼亚。该机构负责人亚历山大·罗斯(Alexander Rose)表示:“在极为长远的时间内,是不可能指望使用数字化标准来保存数据的。在这一点上,我们已经犯了错误。”

其中产生的一个麻烦便是“永恒”本身是没有销路的,不会产生商业价值。有人提议将数字化信息使用类似条形码的格式制作成纸制版,但由于缺少商业利润,该计划一直没有进展。

也许唯一可以和持久稳定的纸张和高容量的数字化媒介相抗衡的数据格式只有“现代罗塞塔石碑”(Rosetta Disk)了。它的创造者将首个这样的罗塞塔镍盘命名为02008,其内容包括了1000种语言的文本信息。

这种方式便是在镍盘雕刻上文字信息,起初上面的文字都是通常大小,然后会迅速缩小到只有用显微镜才能看得到的程度。这是为了让数个世纪以后的人类可以用肉眼看到的文字信息。罗斯说,这种显微镜文本使用17世纪技术水平的透镜技术,只有放大1000倍以后才能看到,一个镍盘包含了30000页容量的文本或图片。该机构正在考虑制造一种使用条形码格式的数字化版本。

如果我们找到了长期储存数字化信息的方法,那么接下来要解决的问题便是我们应该保存哪些重要的数据,以及如何保证信息的安全,并且使人类方便地辨认出这些信息。

作者介绍:汤姆·索姆奈特是《新科学家》的技术新闻编辑,迈克尔·勒·佩奇是《新科学家》的特辑版面编辑。

图2:各种储存媒介的估计寿命比较。

储存介质寿命

译者:quicker

译文链接:http://select.yeeyan.org/view/18767/77045

原文来源:《新科学家》
原文发表时间:2010年2月2日

→如果您认为本词条还有待完善,请 编辑词条

标签: 数字化末日