科技: 人物 企业 技术 IT业 TMT
科普: 自然 科学 科幻 宇宙 科学家
通信: 历史 技术 手机 词典 3G馆
索引: 分类 推荐 专题 热点 排行榜
互联网: 广告 营销 政务 游戏 google
新媒体: 社交 博客 学者 人物 传播学
新思想: 网站 新书 新知 新词 思想家
图书馆: 文化 商业 管理 经济 期刊
网络文化: 社会 红人 黑客 治理 亚文化
创业百科: VC 词典 指南 案例 创业史
前沿科技: 清洁 绿色 纳米 生物 环保
知识产权: 盗版 共享 学人 法规 著作
用户名: 密码: 注册 忘记密码?
    创建新词条

历史版本1:互联网档案馆 返回词条

目录

互联网档案馆(The Internet Archive)回目录

(图)互联网档案馆

  自1996年成立起,The Internet Archive定期收录并永久保存全球网站上可以抓取的信息。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。
  目前,“互联网档案计划”分为六大部分:
  一、电子书
  网址:http://www.archive.org/details/texts
  这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。
  它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。
  二、网页
  网址:http://www.archive.org/web/web.php
  这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。
  要将全世界的网页都保存下来,这需要多大的存储容量啊?根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。
  三、视频
  网址:http://www.archive.org/details/movies
  这个部分收集视频材料,你在其中可以找到动画片和电影。
  四、音频
  网址:http://www.archive.org/details/audio
  音频材料主要是有声书籍和音乐。
  五、软件
  网址:http://www.archive.org/details/software
  六、教育材料
  网址:http://www.archive.org/details/arsdigita
  这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。

→如果您认为本词条还有待完善,请 编辑词条

标签: 互联网 档案 互联网档案 The Internet Archive wayback machine Internet档案馆