国家网络信息存档的行动框架及其启示

时间:2023-09-24 19:30:03 来源:网友投稿

加小双 林妍歆 何露彤 王春蕾

摘  要:网络信息存档已经成为世界各国保存数字遗产的重要内容,如何有效制定国家网络信息存档战略已经成为时代要题与难题。剖析比利时PROMISE网络信息存档行动框架,为我国网络存档战略提供启示。采用网络调查法、案例研究法和内容分析法,在系统数据搜集的基础上对比利时PROMISE项目进行分析总结,拆解其研究过程,重点解析其所提出的国家网络信息存档行动框架。提出实施我国国家网络信息存档战略的三点现实启示:实施国家网络信息存档战略迫在眉睫,高度重视国家网络信息存档的法律保障,建立国家网络信息存档的协同治理体系。

关键词:网络信息存档;
行动框架;
治理;
比利时

Abstract:
 Web archiving has become an important part of digital heritage preservation in the world, and how to effectively formulate the national web archiving strategy has become a key issue and problem of the times. The analysis of Belgium PROMISE web archiving action framework provides inspiration for our web strategy. Using online investigation, case studies and content analysis, the PROMISE project was analyzed and summarized on the basis of systematic data collection, and its research process was disassembled, focusing on the analysis of its proposed national web archiving framework for action. This study puts forward three practical enlightenments for implementing the national web archiving strategy of our country:
it is urgent to implement the national web archiving strategy, attach great importance to the legal guarantee of the national web archiving, and establish a national web archiving collaborative governance system.

Keywords:
Web archiving; Action framework; Governance; Belgium

1 引言

互联网的发展使得线上虚拟生活与线下现实生活共同构成了现代社会生活的整体。根据最新数据,2021年底,全球上网人口达到49亿,大约占全球人口的63%。[1]网络空间中的信息作为数字时代的原生性信息资源,从记录的基数广度到细颗粒的深度,为人类留存与构筑更加丰富生动的记忆提供了更多可能性,[2]也因此具有作为社会证据、记忆和资产的价值,需要进行存档保存。网络信息存档(Web Archive),即对万维网的部分内容进行收集,以档案格式保存集合,然后提供访问和使用的过程。[3]对于档案部门来说,网络信息存档是传统档案工作在数字时代的合理也是必要的拓展,能够优化档案馆的馆藏资源结构,同时为用户提供更加高效便捷的信息服务。

比利时的“比利时多元网络信息存档国家战略”(Preserving Online Multiple Information:
towards a Belgian strategy,以下簡称PROMISE)项目是由比利时皇家图书馆和比利时国家档案馆联合主导推进的国家级协同性研究项目,旨在通过对其他国家网络信息存档实践进行深入研究,进而制定比利时网络信息存档国家战略,推进比利时国家网络信息存档实践行动。[4]该项目的核心研究成果便是提出了比利时网络信息存档行动框架,并进行了一定实践。该项目是在对其他国家网络信息存档经验进行充分研究基础上,进而提出的国家行动框架,具有较强的借鉴意义。本文在对PROMISE项目的研究背景和研究过程进行分析的基础上,重点解析其所提出的国家网络信息存档行动框架,并以此总结该项目对于我国实施国家网络信息存档战略的启示。

2 比利时PROMISE网络信息存档项目概览

2.1 项目背景。比利时王国,简称比利时(Belgium),是位于欧洲西部沿海的联邦国家,拥有复杂的政治和语言地理环境,被誉为“西欧的十字路口”。从20世纪80年代开始,比利时建立本国的网络域名系统(DNS),至今已经形成较为发达的国家网络体系,并且形成了丰富独特的网络信息资源。[5]但与之不相匹配的是,比利时网络信息一直未能得到系统性的存档处理,这意味着比利时的数字资源始终处在无序的状态中,随时面临着消失的风险。

虽然比利时已有少数机构开展过网络信息存档活动,如AMSAB社会历史研究所(Instituut voor Sociale Geschiedenis)与自由主义档案馆(Liberaal Archief)联合实施的“捕获数字遗产”(Catching the Digital Heritage)项目[6],佛兰德语社区开展的“大卫存档系统—网络存档”(DAVID—Archiving websites)项目[7]等,但这些项目的实施范围有限,未成规模与气候,并且存档后的网络信息分散存储于不同网络空间,不利于网络信息资源的长期保存和统一利用。对此,许多比利时档案工作者意识到,如果没有在国家层面开展网络信息存档行动,那么比利时的数字遗产将会面临永远消失的危机。甚至有学者称,“在大多数情况下,历史学家除非使用网络档案,否则他们很难书写20世纪90年代的历史”。[8]同时,在国际层面,比利时的网络信息存档也处于较为滞后的状态。从1996年起,许多国家和地区的图书馆和档案馆相继开展网络信息存档行动,如澳大利亚、英国、瑞典和新西兰,等等。目前在欧洲,比利时是少数几个没有开展过系统性网络信息存档的国家之一,这种相对滞后的存档现状将会给比利时数字遗产的保护和留存带来巨大挑战。

基于上述背景,2016年夏,比利时国家档案馆和比利时皇家图书馆组成的研究团队,联合根特和纳慕尔大学、布鲁塞尔布拉班特大学的信息和文献学院,共同合作完成了一项关于实施比利时多元网络信息存档国家战略的提案,并提交给比利时科学政策办公室(以下简称BELSPO)。很快,该提案得到高度重视。2017年,在BELSPO的资助下,比利时皇家图书馆和比利时国家档案馆作为主导机构,正式启动了PROMISE项目。

2.2 研究阶段与主要成果。PROMISE项目从2017年正式开始建设,按照其实施目标和内容可以划分为四个阶段,具体如下。

第一阶段:研究国家网络信息存档领域的最佳实践。首先,PROMISE项目组采用案头调研(Desk Research)方法,对各个国家现有网络信息存档项目的二手资料进行搜集、整理和分析,深入了解目前国际上网络信息存档的最新技术水平,重点从法律、技术和流程的角度研究归纳网络信息存档的法律框架、技术要素和基本流程。其次,项目组选取代表性国家项目开展深度访谈调查,进一步收集相关信息,梳理项目经验与教训,其访谈对象包括档案管理员、图书管理员、IT专家、经理、数字展览负责人和研究人员等。最后,梳理和整合全部调研信息,形成一份关于网络信息存档领域最佳实践的研究性成果,即《网络档案作为数字学者的数据资源》(Web Archives as a data resource for digital scholars)。[9]

第二阶段:制定比利时网络信息存档的行动战略方案。首先,识别比利时网络信息的定义与内容。项目组以比利时两部皇家法令(《关于建立比利时国家档案馆的皇家法令》和《关于执行<档案法>的皇家法令》)为法律框架,从法律文本中提取出“比利时网络信息”的操作型定义,并以此为基础建立出一个详尽的信息内容选择标准列表。[10]其次,确定存档机构的法律权责。项目组对每个机构的法律权限、法定职责等内容进行分析,并将结果以图表的形式转化为机构业务准则,以明确各个机构在法律层面的权利要求。再次,拟定网络信息存档的内容选择标准。项目组参考在第一阶段研究中所得到的各国网络信息存档的内容选择标准,结合本国的网络信息定义以及存档机构的法律权责,拟定了比利时网络信息存档的内容选择标准。最后,制定网络信息存档的行动战略方案,主要内容包括上述的比利时网络信息定义与内容、存档机构的法律权责、内容选择标准,以及对比利时网络档案的未来用户需求的预测分析结果等。这一阶段的研究成果为一份关于比利时网络信息存档的整体行动战略方案,即《在联邦一级建立比利时网络档案馆的路线图》(A Roadmap for Establishing A Belgian Web Archive At the Federal Level)。[11]

第三阶段:比利时网络信息存档系统的试点应用与测试评价。首先,试点网站与信息内容的选取。项目组从比利时全域的网址列表中随机选取了一万多个网站作为试点网站,网站类别包括联邦机构的网站、内阁的网站、部长/国务秘书的网站、与联邦层面有联系的其他公共组织的网站,如贸易协会、工会、联合会、政党以及公共利益组织的网站等。这些试点网站仅用于系统的此次测试评价过程,并不对其网页信息进行长期的归档保存。其次,描述性元数据集的制定和应用。项目组根据联机计算机图书馆中心(OCLC)网络存档元数据工作组的报告,创建出包含14个元素的描述性元数据集,这些元数据都可以在爬取网页时自动获取,并直接录入到机构目录当中。再次,项目组利用Heritrix工具捕获网页当中的信息,被捕获的信息以WARC文件格式進行保存。最后,项目组对所保存的比利时网络信息进行访问和评价,评价内容包括捕获工具的速度、效果和捕获内容的质量。

第四阶段:实施可持续的网络信息存档服务。本阶段的主要目标是从法律要求、业务模式、技术、功能、组织要求等多个层面分析网络信息存档服务存在的主要障碍,并提出针对性的解决方案建议。在法律要求方面,项目组主要分析了与网络信息存档服务有关的个人数据保护规定、规则和原则,并基于此编制了一份关键数据保护术语的词汇表,作为机构业务工作的参考。在业务模式方面,项目组提出了服务主导型的业务模式,该模式包含的四大要素分别是服务、管理、参与者和成本效益。在该模式下,根据服务和管理主体的不同又可以细分为三个具体场景,项目组利用BPMN(业务流程建模标记法)分别映射出对应的雷达图,以用于指导不同场景下的网络信息存档服务工作。在技术、功能、组织要求方面,项目组编制了比利时网络信息存档系统(URF-SID)的技术和功能要求文件,用于指导项目进行期间所有工具(包括选择、爬取、再现、搜索等工具)的开发的具体部署工作。

3 比利时PROMISE网络信息存档行动框架

PROMISE项目的核心研究成果便是提出了比利时网络信息存档整体行动框架(见图1),据此确定了网络信息存档行动的流程环节(主要包括网络信息的选择、捕获与质量控制、保存和利用)和保障要素(主要包括法律规范、用户需求和数字技术)。

图1 比利时网络信息存档行动框架

3.1 流程环节

3.1.1 内容选择。内容选择是PROMISE存档行动中的首要环节,目的在于从网络信息中选择出适合进行存档的“比利时国家网络信息”,具体包括选择依据、选择对象以及选择策略。比利时存档网络信息的选择依据主要来自于法律标准。根据对本国法律框架的梳理,以及在第一阶段从法国、丹麦等国家立法规定中得出的参考,PROMISE项目组确定了“比利时网络信息”的操作型定义。根据该定义,比利时存档网络信息具体指向三类:一是与比利时领土有关的域名的内容,包括国家域名、地区域名和城市域名的内容;
二是由比利时国人注册的或在历史、政治或文化上与比利时有关的,以及比利时社会感兴趣的或与之相关的,包括但不限于国家文化遗产的网络内容;
三是与在比利时境内创建、制作或出版的网页内容相关的部分活动的网站。[12]

这三种选择对象适用于绝大多数机构的网络信息存档情况,但不同的存档机构所选择的内容也存在一些差别。比如比利时国家档案馆侧重于对来自政府组织网站的公共记录的采集,而比利时皇家图书馆将非政府组织的网站也纳入到存档范围中,其内容选择范围更为广泛。在此阶段,PROMISE项目一方面广泛爬取所有符合存档要求的网站,得到包含大约650个网站的种子目录;
另一方面在此基础上不断扩大选择范围,纳入如城市、市政当局和联邦地区其他公共机构的网站以及与国家档案馆获得的私人档案相关联的网站。目前,PROMISE为比利时网络信息存档专门制定出的完整种子列表由920个网站和1400个网页组成。此外,PROMISE还纳入了许多基于主题或事件的专题性的比利时网络信息,涵盖音乐、版画、手稿、裁定书等多个特定主题内容,以及少数民族在网络上的表现等多个对社会产生重要影响的特定事件内容。[13]

3.1.2 内容捕获与质量控制。内容捕获是PROMISE存档行动中的中间环节,目的在于利用网络爬取工具和其他工具从所选取的网站中获取网页内容及其元数据。PROMISE项目利用Heritrix软件作为网络爬取工具,对网页上的超链接进行识别、跟踪、捕捉并保存URL上的信息。在爬取过程中,Heritrix程序随机从上一阶段所制定的种子列表中选取某一网页,从它开始不断获取网站页面中的所有内部链接并捕获该链接页面的内容,然后将其存储到一个文件当中。[14]而元数据的捕获则是参考OCLC制定的元数据集,在网页文件爬取的过程中自动捕获元数据并录入到PROMISE项目的参与机构目录当中。此外,研究人员还可以自行设置多个爬取参数,如爬虫最开始爬取的网页、爬取的深度频率等,从而对内容捕获的效率和质量进行间接控制。需要注意的是,因网络信息的类型不同,相应的爬取结果之间存在很大差异。一般情况下,动态内容较难被完整捕获,因此Heritrix捕获到的内容可能与原始内容有所区别。

为了判定所捕获的网络信息的真实性与完整性,还需要进行质量控制,对此,PROMISE项目组采用半自动化的质量控制方式,即在内容捕获之后对其进行防病毒检查、格式验证和完整性检查等必要的审查。具体来说,审查内容包括与存档网络信息质量有关的三个方面:一是存档版本与原始实时版本之间的视觉对应程度;
二是存档版本与原始实时版本之间的互动对应程度;
三是存档版本与原始实时版本之间的完整性对应程度。[15]视觉对应程度的检测采用的是结构相似性和视觉质量指标这两个参数,旨在确定存档网页相对于原始网页的视觉质量效果。互动对应程度检测的是服务器收到的请求在存档网页中是否也能被实时记录和保存。完整性对应程度衡量的是存档网络信息包含的原始网站上所有可用资源的程度。

3.1.3 信息保存。信息保存是PROMISE存档行动的第三环节,目的在于确保各类信息对象存档保存的可持续性和长期性。具体内容包括信息保存的对象及其存储格式、长期保存问题等内容。在PROMISE项目中,信息保存的对象需要考虑文件本身及其对应的元数据。针对不同的保存对象需要采用不同的存储格式标准。就文件而言,PROMISE项目采用的是WARC格式对其进行存档保存。这种存储格式的优势在于软硬件环境完善、存储容量大且易于扩展、支持保存实时环境、支持打包和压缩。[16]但WARC格式是一种容器型的文件格式,能够封装网站中包含的所有内容,因此其所对应的文件也是一个复杂的数字对象。对于这种复杂的数字对象,PROMISE项目使用BELSPO管理的LTP平台对其进行安全存储,并在保存之前使用jhove19、droid20等工具来确保WARC文件符合WARC ISO标准。

就元数据而言,元数据通常情况下可以被自动存储在WARC文件中。比如对于描述性元数据,PROMISE项目组利用OCLC模型创建存档网络信息的元数据集,然后通过CSV文件将其映射到MARC 21,并最后保存于比利时皇家图书馆的目录Syracuse之中。[17]基于OCLC模型所创建的元数据集共包含十四个元数据元素,分别是URL、标题、创建者、贡献者、语言、收藏者、日期、主题、类型/形式、关系、描述、范围、权限和来源。[18]最后,关于网络信息的长期保存,PROMISE项目则是建立一个组织框架,在框架内对存档活动中的存储格式与元数据模型等选择过程加以整合和审核,从而确保每份文件的存储格式或存储介质在过期之后可以得到及时、恰当 地处置。

3.1.4 信息利用。信息利用是PROMISE存档行动的最终环节,目的在于提供存档网络信息的利用服务。网络信息提供利用服务的最大挑战来自于版权立法的约束。在此之前,比利时国家档案馆和皇家图书馆主要通过馆内目录提供检索服务。PROMISE项目基于对不同类型网络信息所涉及的法律权限要求的深入分析,灵活使用多种访问利用方法为用户提供利用服务。具体来说,PROMISE项目提供的访问方法分为四种:第一种方法是基于WARCLight发现工具,它是既有发现工具Blacklight的扩展,除了支持全文搜索和语义搜索的丰富界面之外,WARCLight还能显示所需网页的相关元数据,用于已存档网页的再现。第二种方法是利用Python中Wayback Machine(即PyWB)工具重现在特定时间捕捉到的网站。该方法是基于对URL和时间戳的检索实现的,PyWB的优势在于能使用户与存档网站进行互动,就像与实时网站进行互动一样。[19]第三种方法是将存档后的网络信息及衍生数据集集中到一个专门网站上并对外发布,提供HTML页面中的文本、技术元数据、超链接等内容,方便用户直接浏览。第四种方法是为学术领域的相关研究人员直接提供部分WARC文件的访问权限,在合规条件下放宽网络存档信息的部分利用范围。

PROMISE项目在法律框架下提供了多样的利用途径,并为不同学历层次和知识水平的用户类型设计了针对性的存档网络信息利用方案。這样一方面能够有力拓宽网络信息的利用人群范围,帮助实现比利时存档网络信息价值的最大化;
另一方面能够有效提高网络信息的利用效率和效果,切实推进存档网络信息的开放利用工作。

3.2 保障要素

3.2.1 法律规范。网络信息存档是一项复杂性工程,法律规范的制定有助于科学有据地解决网络信息存档的责任主体、内容范围、存档要求和利用权限等问题,确保存档项目的高效开展和顺利推进。PROMISE项目是在比利时特定的法律框架下开展和实施的,法律规范为其存档内容的选择范围划分、存档信息利用方式设置等方面提供了依据和保障。具体来说,比利时的两项皇家法令对合法存档对象做出了授权规定,分别是《关于建立比利时国家档案馆的皇家法令》以及《关于执行<档案法>的皇家法令》。在后一份法令中,档案被界定为由公共当局、私人、公司或受私法管辖的协会保存的一切文件,无论其日期、材料形式、状态或媒介,都理应得到存档保存。[20]这一法律规定为PROMISE确定存档内容对象提供了根本依据。此外,项目组还利用与网络信息存档服务有关的个人数据保护规定、规则和原则等内容,对其进行分析并以此为基础编制了一份关键数据保护术语的词汇表,作为机构业务工作的参考,确保存档网络信息利用服务的合法合规。综上,法律规范这一要素深深地渗透于整个行动框架中,为网络存档行动的实施提供制度层面的支持和保障力量。

3.2.2 用户需求。网络信息存档是一项面向未来的国家数字遗产构建工程,同样也是一项面向现在的数字研究及多种形式的信息利用的重点工作,因此用户需求是网络信息存档过程中始终需要考虑的关键要素。PROMISE项目充分重视对于网络空间中用户需求信息的调查收集与分析工作。在行动初期,项目组曾开展过一项为期两个多月的网络用户需求信息的问卷调查。他们面向研究人员、档案馆或其他信息机构的工作人员以及一般公众,结合现有文献文本的分析以及与资讯专业人士的非正式谈话所得出的见解设计出针对性的在线问卷,收集问卷结果并进行统计分析,最终将调查所得的数据资料运用于内容选择、信息利用等多个环节。[21]此外,在行动后期,PROMISE项目同样充分考虑用户的知识结构和信息需求特点,追求以用户需求为导向的用户体验,专门设计面向不同用户的存档网络信息利用方案。综上,PROMISE项目通过对用户需求的全面把握保证了网络信息存档总体方向的科学性和合理性,为存档网络信息流程环节的设计和实施提供指导方向。

3.2.3 数字技术。技术要素贯通于网络信息存档全流程中,为各个环节提供工具和平台。PROMISE项目组对于技术的管控和利用主要体现在两个方面。一方面,项目组基于自身网络存档目标,在内容捕获环节利用外部供应商提供的Heritrix软件作为网络爬取工具,在信息保存环节利用BELSPO管理的LTP平台作为存储平台,在信息利用环节利用WARC Light发现工具、Wayback Machine再现工具,不仅确保了信息捕获与保存的质量和效率,而且为用户提供了多样化的利用方式。另一方面,项目组专门为比利时网络信息存档系统(URF-SID)编制出相应的技术和功能要求文件,便于系统功能的设计与利用,不仅能够指导项目开展过程中各种工具的开发部署工作,而且能够有效提高项目流程的效率与质量。可见,数字技术是网络存档项目实施的重要保障要素之一,PROMISE项目借助技术工具确保存档网络信息捕获的完整性、管理上的高效性、技术上的可访问性和利用的便捷开放性。

4 对我国实施网络信息存档战略的现实启示

4.1 实施国家网络信息存档战略迫在眉睫。作为信息生态链的重要构成,网络信息承载着时代记忆,具有可获取、能更改、易消失等特点,亟待得到有效存档,以此确保数字环境下的网络记忆留存,从而实现国家珍贵数字遗产的真正保护与构建。事实上,许多国家已经意识到系统性保存国家网络信息的重要性,并且相继采取各种行动。比利时PROMISE项目也是基于保护国家数字遗产的目的而提出,并且该项目是一种自下而上的推动,是由比利时国家档案馆和皇家图书馆充分意识到国家网络信息存档战略的紧迫性和必要性,联合相应的高校共同向国家“建策”,体现了该国的文化记忆保存机构在履行保存国家记忆职责层面的积极作为。事实上,既有实践经验也表明,世界各国所开展的国家网络信息存档行动项目主要由图书馆、档案馆等文化记忆机构所展开。就中国而言,第50次《中国互联网络发展状况统计报告》显示,我国网民规模为10.51亿,互联网普及率达74.4%,在网络基础资源方面,截至2022年6月,我国域名总数为3380万个,“.CN”域名数为1786万个,IPv6地址数量为63079块/32。[22]可见,我国已经成为国际上的网络基础资源大国,但遗憾的是,我国的网络信息的有效存档工作仍然处于相当滞后的状态。虽然自2002年起,我国已经陆续推进政府网络存档项目,比较具代表性的有由北京大学网络实验室开发的“中国网页信息博物馆”项目,实现了历史网页浏览和专题回放;
国家图书馆负责的“网络信息资源采集与保存项目”,主要针对的是政府网站和电子报刊的镜像存档以及我国重大事件的专题存档等等,这些项目都积累了建设经验并取得一定实效,但是这些项目同比利时零散性网络信息存档项目一样,面临着实施范围有限,实施规模较小、存档能力薄弱、后续开展维护工作难度较高等问题。当下,我国仍未在国家层面建立国家网络信息存档的整体战略,对此,建议我国档案馆、图书馆以及相关高校积极行动,不断呼吁国家网络信息存档的战略意义,推动建立国家网络信息存档的整体战略和行动框架,让我国数字遗产能得到系统保存和有效利用。

4.2 高度重视国家网络信息存档的法律保障。网络信息由于在网络平台出版,对其进行存档往往需要考虑到信息的归属权、管理权、处置权以及利用权等法律问题。因此,重视网络信息存档全流程的法律保障作用,能够为存档行动扫清障碍因素,推进存档行动高质量发展。PROMISE项目在研究过程中充分重视法律规范的保障作用,以法规遵循贯穿项目的整个行动框架,为其国家网络信息存档提供了坚实的法律保障。这启示我国在开展网络信息存档工作时,首先,要依法明确责任主体,清晰地划定司法机构、行政机构和信息机构等各主体在网络信息存档中的法律边界,保证各主体管理不越位,服务不缺位;
其次,要注重网络信息存档工作中在各个环节对于法律规范文本的解析,尤其在内容选择与信息利用环节需要全面充分地梳理、归纳与存档主体、客体和过程等要素相关的内容,确保其中的每项行动要素都在法律框架下依法展開,保障网络信息存档工作的合法化和高质化;
最后,要注重宏观法律体系构建,结合我国的网络信息存档工作实践,优化信息安全、隐私保护等法规体系,为国家网络信息存档提供更具科学性和体系化的法律保障环境。

4.3 建立國家网络信息存档的协同治理体系。由于网络信息存档所指向的信息内容较为复杂,信息量较大,涉及利益相关者较多,行动任务责任重大,并且需要长期运维,因此需要强化多方机构、组织力量的协同参与,在多个实施流程环节中发挥多元主体协作力量。PROMISE项目在系统性规划和实践性试点过程中,便已然充分发挥多元主体协同力量,尤其得到了其他行业企业的大力支持与配合,如负责管理某些域名的机构提供了与比利时域名有关的详尽的域名目录;
负责托管比利时政府网站的机构提供了那些现在正在使用的网站的详细信息;
提供外部服务的提供商辅助抓取种子目录当中的网页信息,然后将内容的副本发送回国家档案馆加以保存,等等。PROMISE项目在协作治理、共建共享方面的系列性理论构想和试点经验,能够为我国解决网络信息存档实践过程中面临的存档标准不清、相关支撑技术缺乏、管理创新性不足等问题,[23]为构建国家网络信息存档的协同治理体系提供可供借鉴的发展方向和优化路径。具体来说,在前端控制层面,积极利用档案学会和高校等知识型主体的理论研究成果,在元数据捕获、信息开发利用等方面制定切实可行的标准;
在中端开发层面,发挥档案中介机构、企业等服务型主体的技术保障作用,积极开发网络信息存档的先进技术,实现网络信息的长期保存与有效利用;
在终端利用层面,发挥主管部门的统筹协调作用,引导社会各行各业部门和组织机构开放网络接口(API)、开放网络数据,共同推进网络信息的存档。

加快推进我国网络信息存档行动项目是接轨国际,保护数字遗产的必然要求。比利时PROMISE项目不仅提出了多项研究成果,而且系统设计了存档行动的具体环节内容,是比利时国家层面网络信息存档的先进研究与实践成果,为我国在网络信息存档领域提供一定的启示和借鉴价值。未来,我国的网络信息存档实践工作还需要汲取国际经验,为构建更为丰富和完善的国家数字资源库不懈努力。

*基金项目:本文为国家社科青年项目“数字政府背景下电子文件单轨制管理的数字连续性保障框架研究”(项目号:19CTQ036)研究成果之一。

注释与参考文献:

[1]人民网.《中国移动互联网发展报告(2022)》正式发布[EB/OL].(2022-06-29).[2022-09-10].http://finance.people.com.cn/n1/2022/0629/c1004-32460664.html.

[2]周文泓,苏依纹,代林序,杨梓钒,张玉洁,陈怡.进展与展望:面向数字记忆资源建设的网络信息存档[J].图书馆论坛,2020,40(09):42-52.

[3]IIPC.Web archiving[EB/OL].(2019-08-08).[2022-09-10].http://netpreserve.org/web-archiving/.

[4]Tomwillaert.Through the Black Hole of Information:Friedel Geeraert on building a Belgian Web Archive[EB/OL].(2019-03-27)[2022-09-10].https://www.digitalscholarship.be/2019/03/27/through-the-black-hole-of-information-friedel-geeraert-on-building-a-belgian-web-archive/.

[5]DNS Belgium.History of DNS Belgium[EB/OL].[2022-09-10].https://www.dnsbelgium.be/en/about-dns-belgium/history-dns-belgium.

[6]liberas.Catching the digital heritage[EB/OL].[2022-09-10].https://www.liberas.eu/catchingthe-digital-heritage/.

[7]antwerpen.DAVID—Archiving websites[EB/OL].[2022-09-10].http://www.antwerpen.be/david.

[8]Ian Milligan.Lost in the Infinite Archive:The Promise and Pitfalls of Web Archives[J].International Journal of Humanities and Arts Computing,2016(10):78-94.

[9]Eveline Vlassenroot,Sally Chambers,Emmanue,Di Pretoro,Friedel Geeraert,Gerald Haesendonck,Alejandra Michel,Peter Mechan.Web Archives as a data resource for digital scholars[J].International Journal of Digital Humanities,2019:85-111.

[10][11][12][14][18]Rolande Depoortere,Friedel Geeraert,Sébastien Soyez,Sophie Vandepontseele.A Roadmap for Establishing A Belgian Web ArchiveAt the Federal Level[J].In Monte Artium,2020(13):25-42.

[13]KBR.PROMISE project[EB/OL].[2022-09-10].https://www.kbr.be/en/projects/promise-project/.

[15][17][19][21]Geeraert Friedel Geeraert,Peter Mechant,Alejandra Michel.Preserving Online Multiple Information towards a Belgian strategy[R/OL].[2022-09-10].https://www.ugent.be/mict/en/research/projects/2017/promise-preserving-online-multiple-information-towards-a-belgian-strategy.

[16]徐飞,郑秋生,高艳霞.基于云存储的网页存档方案的研究[J].计算机时代,2017(04):21-24+28.

[20]SERVICE PUBLIC FEDERAL DE PROGRAMMATION POLITIQUE SCIENTIFIQUE.18 AOUT 2010.- Arrêté royal portant exécution des articles 5 et 6 de la loi du 24 juin 1955 relative aux Archives[EB/OL].[2022-10-9].https://www.ejustice.just.fgov.be/cgi/article_body.pl?language=fr&caller=summary&pub_date=10-09-23&numac=2010021091.

[22]中文互联网数据资讯网199IT.CNNIC:第50次中国互联网网络发展状况统计报告[EB/OL].(2022-09-22).[2022-10-09].http://www.199it.com/Archives/1496741.htmlCNNIC:第50次中国互联网网络发展状况统计报告.

[23]黃新荣,曾萨.网页归档推进策略研究——基于网页归档生态系统视角[J].图书馆学研究,2018(16):63-70+16.

(作者单位:1.中国人民大学信息资源管理学院、中国人民大学数字人文研究中心、中国人民大学人文北京研究中心 加小双,副教授;
2. 中国人民大学信息资源管理学院 林妍歆,硕士研究生;
何露彤,硕士研究生;
王春蕾,硕士研究生 来稿日期:2022-11-21)

猜你喜欢比利时治理逃不掉的澡小学生学习指导(高年级)(2020年5期)2020-06-24噩 梦小学生学习指导(高年级)(2019年5期)2019-04-20他骗我!小学生学习指导(高年级)(2019年4期)2019-04-20比利时炸薯条也要申遗时代英语·高一(2017年5期)2017-11-14社会参与美国社区学院治理及对中国应用型本科高校治理的启示职教论坛(2016年24期)2016-11-14关于治理潮州市区流动摊贩占道经营问题的思考考试周刊(2016年85期)2016-11-11浅析网络舆情治理经营者(2016年12期)2016-10-21数据+舆情:南方报业创新转型提高服务能力的探索中国记者(2016年6期)2016-08-26总觉得别人的好环球时报(2009-12-15)2009-12-15

推荐访问:框架 启示 存档