不要以为在数字时代记录历史会变得易如反掌。N多年后,历史学家会为如何破解和读取今天留下的“古董级”数码资料而大伤脑筋。
这个世界正在失去重构历史的能力。
假定你身处2035年,是一名历史学家,正在想办法了解2012年的美国大选。那些充斥着各种新闻和评论的网站和博客早已消亡不见。电子格式存储的数据也“腐烂”了——从早年的数字时代流传下来的很多软盘都已不能读取。如果你足够幸运,也许可以在公共图书馆找到大选资料、电子邮件和其他文件(包括解密的官方档案)的副本。
但是你能读取它们吗?就在现在,美国宇航局就已丢失了它的许多早期登月数据,而究其原因,不过是那些用来读取磁带的机器报废后再也造不出来了。有着先见之明的图书管理员也许会保留几台还能使用的古董计算机,以便读取CD和USB存储器一类的古老技术。但这显然还远远不够。没有了借以打开它们的软件,计算机文件不过是一堆废品。
解决方法之一是把所有资料都打印出来。如果使用耐用的无酸纸,它们的寿命至少可以与中世纪的牛皮纸手稿相媲美。但是打印版的数字资料算不得上优之选。元数据随之丢失,文件也就此变得索然无味了:电子邮件总要串放在一起才会有趣味,没有人会想读厚厚的一沓纸。只有当数据是以数字形式存在时,才能对它们进行筛选和计算。
一些有良知的机构已着手开展了部分网页、电子书和其他数字资料的备份工作,并且每隔5年就会把这些数据转移到新的硬件中。当软件变得过时后,图书馆和企业还可以造出模拟机——在新的硬件中运行地旧版操作系统。
但是这一努力却受到了法规的制约,让本就困难重重的数字制品归档工作变得愈发艰难。比如在美国,规避出版商所依附的反盗版数字版权管理软件(DRM)是一种刑事犯罪。一旦这种软件不复存在了,就永远打不开这些资料了。在2010年,美国版权局作出规定,除非特别要求,只从事在线业务的出版商可以不再向国会图书馆提交产品副本。国家图书馆有权取得任何在美国领土上出版的印刷书籍的副本(并且它们还得到了数量巨大的其他文件)。但是他们却不能强行收集软件或智能手机应用,而一旦离开了这些软件和应用,海量的电子数据不过是一堆经过加密的乱码。
监管机构已经认识到这一问题。美国版权局将在5月初举行听证会,讨论解除对于规避DRM的禁令。在英国,政府则希望强行要求包括软件提供商在内的出版商,在发布所有产品的最终版本后一个月内,向大英图书馆提交一份产品副本。这项提议中的法案将允许图书馆获取隐藏在付费壁垒和登录要求之后的网页和资料。只提供视频和音乐的社交网络和网站则不在此列。
然而,出版商抱怨这样的做法成本高昂,特别是在当今这个全行业都在挣扎求存的时代。他们担心图书馆的访问量会对产品的销售带来冲击,并且提供产品的可复制版本也将鼓励盗版。
这些抱怨看似有些言过其实。图书馆不会把数字资料提供给所有人,只有那些身处图书馆内的用户才能获得访问权。拟议中的英国法律甚至允许出版商提出请求,为他们的产品设置长达3年的保密期——这样的让步极少出现在印刷资料上。几个世纪以来,图书馆一直都在向公众开放那些最昂贵的书籍和期刊的访问权。这一原则即使在数字时代也值得保留。
赌注是高昂的。30年前的错误意味着数字时代早期的许多资料对于历史学家而言,已经变成了一本合上的书(甚至连书都没有)。如果图书馆不能获得更广泛的授权,取得数字资料以及读取它们的软件,身处未来的历史学家就将无法重构我们的时代。他们甚至可能不知道自己丢失了什么。
英国《经济学家》杂志网站