岳彩申 青 彤
提要:政府开放数据的主要原因之一是建立透明政府。基于大数据和人工智能设计提高透明度作为数字政府的实践指南,不仅可以实现透明度的有益功能,而且可以减少政府在自动化决策环境中所面临的风险。由于“透明度”是多维概念,包含不同意涵和功能。首先,我们从伦理规范、社会关系和制度语境阐释“透明度”的意涵,进而分析透明度在政府自动化决策实践中的优势和挑战;
其次,阐述政府开放数据和关联数据实现透明度的基本理论——参与式生态系统论,并厘定影响政府透明度的维度和类型;
最后,借鉴隐私设计,慎思与大数据相关的语境、技术、信息和利益相关者的敏感度等因素,提出基于人工智能设计提高政府透明度的三大阶段和九项原则。
政府开放数据的主要目的之一是提高透明度。自20世纪90年代中期以来,政治家和政府开始创建政府门户网站,发布政府信息,(1)有关政府信息概念,参见《中华人民共和国政府信息公开条例》第二条。包括预算和统计数据。进而政府利用大数据和人工智能创建能够做出基本自主决策的系统。传统意义上,算法必须遵循规则实行手动编程,并把权重附加到特定的数据点;
而机器学习算法改变了数据集中提取模式和预测方式。随着计算机技术的发展,越来越多的政府将决策过程委托给算法——自动化决策,(2)有关政府自动化决策概念,比较《中华人民共和国个人信息保护法》第七十三条。它是大数据和人工智能系统的子集,且不需要人工参与即可做出决策的自动化过程。从政治和法律视角而言,自动化决策系统对个人和社会潜在的不利影响需要政府做出监管反应,它关涉的核心问题是政府监管在多大程度上能够实现透明度,民众是否有权参与政府决策过程。
透明度已成为数字时代政府监管的重要话题之一。作为政治制度的透明度,它意味着系统或组织让第三方了解它们内部的知识、过程和决策,适用于诸多领域,如组织结构的透明度、会计和预算的透明度、政府行动和责任的透明度以及政府文件的透明度。在我国,《政府信息公开条例》的立法目的之一是“提高政府工作的透明度”(3)参见《中华人民共和国政府信息公开条例》第一条。;
《中国政府透明度指数报告》(2010-2021)依据各类指标评估了我国各级政府(乡镇除外)12年的政务公开情况;
(4)参见《中国政府透明度指数报告》(2010-2021)。https://xianxiao.ssap.com.cn/catalog/6138742.html.《个人信息保护法》把透明度作为个人信息保护的基本原则;
(5)参见《中华人民共和国个人信息保护法》第七条。《网络安全法》提出“建立多边、民主、透明的网络治理体系”(6)参见《中华人民共和国网络安全法》第七条。。
(一)透明度之意涵
透明度是复杂而多维的概念。不同学科强调透明度的不同功能和优点:“经济学家认为透明度是最优化市场的先决条件;
政治学家把透明度概念化为政治参与的先决条件;
法律学者强调透明度是行政合法的先决条件”。(7)A. Meijer, Transparency, In M. Bovens, R. E. Goodin, & T. Schillemans (Eds.), The Oxford Handbook of Public Accountability, Oxford: Oxford University Press, 2014, pp.507-524.
1.行政学视角
政府透明度是一种关系属性,其基本定义是:如果一个代理(机构)I 对另一个代理(公众)P 是透明的,那么它可以让 P 获得有关其基本运作的足够信息。由此,它必须满足两个条件:政府所提供的信息必须是充分的;
政府信息必须以可获得的方式公开发布。其基本意蕴是:政府信息应当是可预见的、完整的和易获取的,且从提供准确结论的意义上是可推断的。有关政府公共决策的透明度可分为三种类型:形式透明度,向公众告知政府的最终决定或政策;
过程透明度,关于形成政府决策的过程透明;
理性透明度,关于政府做出决策所基于的原因和理由透明。(8)G. Michener, Policy Evaluation via Composite Indexes: Qualitative Lessons from International Transparency Policy Indexes. World Development, Vol.74, No.3, 2015, p.185.
2.金融法视角
提高透明度是建设法治政府的基本要求。透明度是法治的核心要素,公开和问责制是透明度的核心内容。国际货币基金组织有关金融透明度的概念是政策的目标、法律、体制和经济框架、政策决定及其基本原理、与货币和金融政策有关的数据和信息以及各机构的问责条件,必须在可理解、可获得和及时的基础上向公众提供。(9)IMF, Supporting Document to the Code of Good Pratices on Transparency in Monetary and Financial Policies, Jul.2000, p.4.它具体表现为依法明确中央银行和金融机构的作用、责任和目标,公开制定金融政策和货币政策的决定过程,并提供有关货币政策和金融政策的信息,实施问责和廉正保证。
3.信息学视角
从信息学视角透明度定义可格式化为:作为利益相关者A(公众和其他组织)希望从利益相关者B(政府或其他公共机构)那里获取信息,这样A就可以在决策中使用这些信息。其基本意蕴是:参与透明度规定过程的行为者之间的信息流动;
通过披露信息使透明度变得更有意义;
所披露的信息对特定利益相关人有用,即通过披露信息为他们提供决策能力;
向利益攸关方保证披露信息的质量。其具体化为:数据透明度,与数据、内容和信息有关,即在透明度语境下需要哪些信息以及谁是利益相关者;
过程透明度,与过程、行为和交互有关,即在透明度语境下从事特定行为的程序和方式;
策略透明度,与目的、政策和决策有关,即在透明度语境下执行特定决定和行为的原因。
4.综合视角:伦理规范、社会关系和制度语境
当下阐述透明度概念主要关注透明度的信息维度,忽视了透明度在特定机构、社会关系和系统实践中的深度价值嵌入。首先,有关政府透明度要求的自动化决策算法不是信息技术明确界定和中立的组成部分,或者与实现细节无关的概念化对象,而是异质和分散的社会技术系统,(10)N. Seaver, Algorithms as Culture: Some Tactics for the Ethnography of Algorithmic Systems, Big Data & Society, Vol. 4, No.2, 2017,pp.1-3.它通过嵌入技术实例化而赋予其社会意义,并把多样且往往是变动的角色融入技术和文化实践中。其次,必须从批判和整体视角审视政府信息系统,包括审慎思考数据发现涉及的政治经济、思想意识、知识形式、政府法律、实践方式、地理位置和社区管理,并在算法分析中认知数据的文化维度。最后,必须考虑算法本身的技术特征和现有社会结构实际运行所赋予的文化意义,尤其考量算法透明和负责任的努力本身可能改变数据运行的社会场景。
我们阐释和分析政府透明度概念应当从更广泛的维度:一是,作为伦理规范的透明度是一种理想概念,它确定如何评估公共行为者的行为标准,要求确定代理人、系统或组织在本质上具有特定的价值和意义。由此,透明度要求政府对其运行过程、行为方式、行为意图以及所需要考虑的其他事项一致公开。二是,在社会关系视角下,透明度不是个体表征,而是代理人与信息接收者(被代理人)之间的一种信任—委托关系。代理人仅对其业务表现出开放是不够的,接收者如何接受和理解它们的开放信息具有同等重要性。在此,透明度是关于特定行为者信息的可用性,且许可其他行为者监督该行为者的工作或具体表现。(11)A. Meijer, Transparency, In M. Bovens, R. E. Goodin, & T. Schillemans (Eds.), The Oxford Handbook of Public Accountability. Oxford: Oxford University Press, 2014, p.511.三是,从系统观点阐释透明度必须考虑制度语境,充分认识制度语境与信息披露的相关特征,包括相关法律、政府监管和组织措施,因为这些信息对我们充分认识政府透明度的实际影响至关重要。
因此,政府透明度作为一种规范理想或伦理要求,必须认识其深深嵌入系统和组织基因的重要性;
作为社会关系的透明度,必须确保透明度措施的设计和评估总是考虑政府信息对利益攸关方的影响;
依据系统观点的政府透明度必须考量执行语境下的制度嵌入,尤其是问责制和政府公信力的作用与效果。
(二)基于信息维度提高政府透明度的优势
在信息维度下,透明度作为克服信息不对称的手段,使信息在私人领域与公共领域之间流动,从而减少信息不对称。然而透明度并非意味着信息接收者能够完全获取信息,它仅仅是指在不存在有问题的信息不对称状态下没有人有更好的知情优势。因此,透明度作为一种平等参与,不仅确保双方当事人通过协商能力共享信息,而且保证每个人可以获得关于过程或组织内部运行的相关信息。
1. 基于信息透明度要求的数据与可解释性相关。参与决策过程的人应当在事前获取关于数据处理的质量或意图的信息,并在事后获得有关数据披露的结果。鉴于参与人有权获得有意义的信息,并预测其后果,世界各国数据安全法规定了特定利益相关人的自主决定权。在专业标准和最佳实践中,基于信息维度的透明度已转化为可审查性概念。因此,透明度原则作为大数据语境下提高政府自动化决策能力的首要原则,与可追溯性、可验证性、可解释性和诚实设计联结起来。
2. 基于大数据的信息方法使透明度与问责制联结起来。通常,问责意味着政府对其决策和行为负责,并对其后果承担责任。透明度与问责制之间的联系在于:政府运用所创造的数据知识为逻辑系统的任何观察提供洞见力;
信息和数据知识又反过来成为追究系统责任的先决条件。在此,透明度仅指系统的透明运作,它并非要说明为什么这个系统在政府决策方面做得更好。
3.提高透明度的另一优势是互信。信任是一种心理状态,它包括基于对他人意图或行为的积极预期,从而从心理上接受该行为或后果。(12)D. M. Rousseau, S. B. Sitkin, R. S. Burt, & C. Camerer, Not so Different after All: A Crossdiscipline View of Trust, Academy of Management Review, Vol.23, No.3, 1998, pp.393-404.信任涉及委托人与代理人之间在能力、正直和诚信等方面的可信性评估。透明度不仅表明政府有能力按照预期或承诺行为,而且与诚信有关,即政府透明披露信息是表达它们的诚信。有关透明度—信任关系的实证研究表明:透明度对政府管理和商业营运具有积极影响,如社会资本增益、增加合作行为和声誉溢出效应。(13)J. Elia, Transparency Rights, Technology, and Trust, Ethics and Information Technology, Vol.11, No.2, 2009, pp.145-153.
因此,提高政府透明度不仅可以通过存放信息实现信息共享,而且许可政府与利益相关者之间更广泛的互动和沟通:利益相关者有更多的学习机会,获得他们实际需要的信息,满足他们的特殊诉求;
政府有更多机会与利益相关者进行协商和沟通,并获得有价值的反馈;
所有信息参与者都有机会改变所提出的问题,挑战所提供的信息,并不断完善和重新定义其共享和相互冲突的利益。
(三)基于信息维度提高政府透明度面临的挑战
尽管提高政府透明度可以带来诸多公共利益,如经济和社会创新、公众参与、公私合作和公共问责,然而从信息视角阐释政府透明度仍然备受质疑。
1. 政府信息披露往往忽视透明度的需求要素。信息不仅需要披露,还需要被受众接受和理解。为了使信息披露变得更加透明,信息必须适应受众需求。按照数据时代的信息观点,透明度基本是静态的:信息已存在,且可供被要求披露的人使用。其重心是信息的可获得,而不考虑信息的性质和语境、获取和提供方式及其过程。换言之,信息仅仅被视为中立的事实,而不是社会建构和解释的人为产物,它很少考量隐藏于数据披露背后的遴选机制、程序和政治意义,因为提供透明度的尝试从根本上只是形式,它们不创造关于组织的中立知识和观察,而是以意想不到的方式重新组合。(14)L. Ringel, Unpacking the Transparency-Secrecy Nexus: Frontstage and Backstage Behaviour in a Political Party, Organization Studies, Vol.40, No.5, 2019, p.706.
2.与隐私有关,政府公开披露信息可能导致敏感数据泄露。(15)参见《中华人民共和国数据安全法》第三十八条。使数据技术系统完全透明可能暴露敏感数据和私人数据,尤其是个人数据用于训练机器学习算法。基于偏差较小的算法原则,政府和公共组织需要多样化和具有代表性的训练数据集,其中包括来自社会弱势群体的数据,这些数据一旦公布可能使那些处于社会不利地位的人受到更大伤害。因此,要求政府信息透明和公开的吁求必须与隐私保护相权衡。
3. 透明度与问责制之间的积极联系并非总是能够实现。透明度是否转化为问责取决于体制语境、权力结构、问责需求和其他推动因素。一是,计算机化的系统通常由许多人设计和操作,责任主体分散使承担责任变得模糊不清。二是,软件不可避免的错误为责任主体提供借口,使追责机构对软件错误的适当分析模糊化,从而有效阻碍问责的实现。三是,当行为主体出错时很容易责怪算法,而不是相关责任人。四是,软件开发人员断然拒绝对他们的产品负责,使其追责无济于事。五是,没有任何现成的系统能够处理、消化和使用信息适应变化,可预见性对于问责的目标具有风险。(16)M. Ananny, & K. Crawford, Seeing without Knowing: Limitations of the Transparency Ideal and Its Application to Algorithmic Accountability, New Media & Society, Vol.20, No.3, 2018, p. 978.
数据是可以由计算机(人或机器)对其进行运算的符号,是创造信息和知识的基础。(17)L. Floridi, Philosophy and Computing: an Introduction, Routledge, London,1999, pp.106-108.依据数据的概念和特性,政府开放数据通常是指被政府信息管理系统设计为首先向用户发布的主要数据、描述主要数据基本属性的元数据、与信息系统的使用、性能或命令有关的操作数据以及从其他数据提取数据时的派生数据。
(一)政府开放数据的一般理论
政府开放数据是任何人都可以获得、使用和共享的数据,或者任何人都可以出于特定目的自由访问、使用、修改和共享数据。
1. 政府开放数据和关联数据的优势在于,重复使用政府数据,打开新的商业机会,提高透明度和公众参与以及把政府数据处理的成本分配给社会。(18)参见《中华人民共和国数据安全法》、《中华人民共和国网络安全法》和《中华人民共和国政府信息公开条例》。结合我国法律法规和数字政府建设实践,政府开放数据的原则包括数据必须完整、来自主要来源、及时、可获取、机器可处理、非歧视、非专有和无许可。其核心原则是制定和颁布法律,以公开数据的形式依法公布政府和其他公共部门的信息。质言之,政府应当公布和公开使用公共资金形成的数据,增加公众获取政府部门生成的高价值的、机器可读的数据集,帮助公众了解政府运作过程和政策制定。
2.政府开放数据需要适当的制度安排。首先,它需要人员、技术和数据之间的多次重复互动,并制定协调行为、执行过程和决策以及管理错位和冲突的指导方针、程序和规则。其次,创建基于大数据分散管理技术的政府开放数据生态系统,向公众显示使用开放数据的指导路径,使公众能够链接不同要素的主要数据和元数据。最后,建立数据质量管理系统和数据过滤机制,获得低成本的通信技术,使分享信息的成本降至最低,并建立信息聚合需要的认知分类机制,使信息聚合在特定语境下保持敏感性,保留有价值的知识,排除无关或无用的知识。
3.在政府开放数据系统中,开放数据通常是由政府或政府控制的实体所产生或授权的数据,为了预防潜在的数据歧视和滥用,政府需要创建数据技术保护机制。加密技术旨在增加未经授权获取数据的技术难度或成本;
模糊技术旨在减少信息内容,使敏感信息根本不会被发布,且即使使用聚合和推理,信息窃取者也无法获得敏感信息;
信誉技术旨在评估系统中其他代理(如信息接收者)的早期行为,以便使用统计和机器学习方法评估其可信性。
总之,政府开放数据的意义在于使公众了解政府能力,它关乎政府内部运作能力的外在化。一方面,提高政府透明度使利益相关者对政府的决策和行为具有普遍的认知,从而认可公共政策;
另一方面,政府开放数据在一定程度上克服信息不对称,为政府实施决策和执行政策提供良好的信任基础。
(二)政府开放关联数据的基本理论:参与式生态系统论
关联数据是指作为现代民主国家的公民可以自由获取、共享和重复使用数据、信息和知识,从而扩大我们的资源和能力。(19)C. Bizer, T. Heath, T. Berners-Lee, Linked Data-the Story so Far, International Journal on Semantic Web and Information Systems, Vol.5, No.3, 2009, pp.1-22.政府通过发布关联数据,使任何公民可以在网上发布和接收数据,并以流畅的方式运行人工智能算法,与其他人发布的数据资源相链接,从而获取所需要的信息。
1. 参与式生态系统的技术属性
政府开放关联数据表现为关联数据(基础设施层)、关联平台(逻辑层)和关联生态系统(社会层)三层重叠结构,依赖于更广泛的生态系统:一方面,政府开放关联数据作为民主政府形式的基本资源表现为人、数字技术和数据之间分布式的交互作用;
另一方面,从狭义的技术解释,开放关联数据的参与式生态系统是由用户处理数据所需要的所有硬件设备、程序文件和数据组成。
(1)开放式。人、技术和数据之间的交互总是发生在特定环境中,它们的相互作用构成内部环境,可描述为一组给定的行动选择。即使受环境限制,参与式生态系统也是高度动态的:人、技术和数据之间的交互随环境变化而变化,且相互适应。此外,参与式生态系统的开放性还表现为任何数据节点的输出都可用作其他节点的输入,数据相关人可以从简单的向上链接发展为复杂的处理链。在此,参与式生态系统理论可称之为适应复杂系统理论。
(2)模块化。通过政府开放关联数据形式,数字工具支持公民和群体的各种模块选择:数据收集、事实核查、监测、签署诉愿书、众筹、构思、审议、起草、投票等等。在模块化参与式生态系统中,信息参与者可以依据不同的兴趣和偏好选择不同的参与方式:简单化的参与形式可能吸引大量的参与者;
需要更多时间、认知力或奉献精神的参与形式吸引的人群较少。因此,参与式生态系统的参与程度是数据模块化的综合结果。
(3)分布式。参与式生态系统可描述为具有多节点的分布式沟通网络。去中心化和分布式模型之间的区别并非总是清晰可见,尽管二者在概念上经常被视为同义词,然而分布式模型可视为分散系统的子集。换言之,使用一个还是另一个术语取决于技术规范(体系结构和逻辑功能)和治理模型(决策过程、监管和政治)的组合选择。在分布式参与生态系统中,尽管社会可能描绘出许多边缘群体或关联集群,然而个人、群体和社会仍可视为同位节点,它意味着数据、软件和其他文件可以通过复制数据存储或对等技术在多站点上存储和操作。由此,分布式提高了政府数据文件的长期可用性和操作可靠性,造福于社会。
2. 参与式生态系统的社会属性
政府信息系统是人类行为者和技术组成部分相互关联和相互作用的社会技术系统。从更广泛的意义而言,政府开放关联数据的参与式生态系统不仅涉及技术要素,还涉及社会要素。
(1)认知责任。在复杂的政府数据系统中,对政策和干预负责任的人应当尽其所能,使他们能够承担创造知识条件的更多责任。由于政府决策者被特定的认知语境所限定,他们往往依赖可支配的信息基础设施。在大多数情形下,他们的决定和判断质量取决于他们的知识工具(信息系统、程序和数据)的质量。因此,政府决策者的重要责任就是在事前设计认知资源和信息基础设施,这是政府开放数据的主要目标之一。
(2)设计隐私。隐私是现实信息社会中的利益相关人为实现对社会的认识和理解所必须遵从的规范约束。虽然这一术语是指与个人、个人生活和个人身份有关的广泛精神权利、需求、主张、利益和责任,但是隐私对于个人发展是必不可少的。因此,数据保护技术必须与数据挖掘技术和电子社会科学共同研发。设计和开发新形式的隐私保护是政府开放关联数据的中心目标之一。
(3)增加信任。信任意味着信任者和受托人之间的道德约束关系,这种关系部分由受托人遵从道德规范的信念或假定所构成。在复杂的数据技术环境中,信任要求负责设计信任关系环境的组织和个人尽可能明确和透明地说明指导他们从事设计的价值观、原则和政策,使塑造信息社会的价值观、原则和政策具有公开性和透明,最终建立公平互信的信息社会。
总之,政府开放关联数据的参与式生态系统是一个多层互动的框架体系:一方面,它是由社会技术层面多个相互依赖的维度、行为者(包括数据提供者、信息中介和信息消费者)、要素和单元所构成;
另一方面,它需要应对与政策、许可、技术、融资、组织、文化和法律框架有关的挑战,并受技术基础设施的影响。
(三)基于大数据和开放关联数据设计政府透明度之维度
在政府数据开放方面,透明度博弈涉及三方参与者:信息发送者(政府)、信息接收者(公民或组织)与透明度监督者,其中重要的利益攸关方是开放数据的发布者和用户。数据发布者的主要活动是披露数据,这是数据使用的前提条件。然而仅仅只是披露数据并不必然带来透明度,只有数据实际使用才能实现透明度。换言之,只有当数据已披露且被利益相关人使用,才能实现透明度。在此,我们从两个基本维度——数据披露与数据使用划分了实现政府透明度的特定类型。
1.数据披露类型
政府要做到透明,就必须公开数据。公开数据是创建透明政府的前提条件。然而简单地把政府数据置于网上显然不够。政府应当告知公众个人数据类型、平台收集或创建个人数据的方式、平台使用个人数据的方式以及政府运用什么方法确定个人数据的优先顺序、分配权重和数据排列,拒绝向公众放大推荐内容。关于信息质量的元数据和信息披露的方式也实际影响政府透明度。
(1)数据的披露类型
政府数据和信息披露发生的情形是政府依法主动传播和发布所需要的材料、公开会议(主动公开)和举报人泄露(被动公开)。(20)《中华人民共和国政府信息公开条例》第三章和第四章。数据的披露类型依据不同披露方式分为两个子维度:正式的数据披露(政府报告和公开政府会议)和非正式的数据披露(告密者举报)。此外,还必须分析和查明数据披露的不同表现方式,如政府所披露的数据是同一类数据还是不同格式和条件的数据。
(2)数据披露的渠道类型
数据披露渠道是建立透明政府的重要步骤之一。随着数字技术的发展,政府数据披露的渠道越来越多样化,它包括下列类型:政府透明门户网站;
政府利用各种渠道所获取的自由信息;
开放的政府数据门户网站;
政府门户网站;
(21)中华人民共和国中央人民政府门户网(https://www.gov.cn/)和地方各级人民政府官网(http://www.xx.gov.cn/)。政府公报和新闻发布会;
政府服务广告仪表板;
户外公共工程会计支出数据;
公共财务报表;
基于政府黑板的文告;
基于门户网站的互联网;
政府呼叫中心所提供的信息;
政府呼叫中心提供获取和需求的公共服务。数据披露渠道可以使用不同类型的技术,其中特定的数据披露技术必须具有可解释性,如公共财务报表、报纸、政府黑板文告和通过门户网站的互联网。
(3)用于披露数据的技术类型
用于披露数据的技术类型是数据披露的重要组成部分。我们可以列出下列技术类型清单:政治话语和公务员回复;
政府印刷品(书面文件、报刊、电子视频、公共工程和服务户外活动、标志等);
(22)参见《中华人民共和国政府信息公开条例》第二十三条。电子数据格式(静态门户网站、可下载文件等);
实时电子可访问数据(直接数据库访问和应用程序编程接口)。
(4)披露数据的特征类型
披露数据的特征类型是指理解披露数据的各种因素和条件如数据质量,同时必须考虑数据披露的类型、使用数据的渠道类型和技术类型以及它们的特定属性。数据披露的特征类型可以细分如下:数据的准确性;
数据的及时性;
数据的可访问性;
数据的完整性;
数据的安全性;
数据的可信度;
零数据;
数据文档;
数据永久性和历史;
主要数据、元数据和关联数据;
数据的非专有性;
数据的非歧视性;
数据的免许可;
数据的可处理性;
门户网站简单语言;
开放数据政策与许可。
2.数据使用类型
政府只发布数据并不能实现透明度。提高政府透明度的第二步是数据使用,其中公众使用数据的主要目的是解决他们所需要解决的问题,他们只有选择自身认为最好的技术和方式才能解决他们的利益和问题。按照这一原则,作为第二基本维度的数据使用又可以细分为下列类型。
(1)对数据使用感兴趣的参与者类型
任何人或组织都是基于特定的旨趣把政府披露的数据运用于已确定的特定业务或工作模式中,并使用自身所选定的技术收集、处理和分析各类数据。根据数据使用的主体特性,我们可以确定通常使用政府透明数据的五类行为者:学者;
企业;
政府;
新闻记者和有组织的社会社团。
(2)对数据使用感兴趣的类型
从使用披露数据的行为者来看,我们有必要了解他们使用这些数据的特定旨趣。根据数据使用者的偏爱和旨趣可以确定四种类型:提供公共服务;
问责;
政治宣传和公众参与。
(3)数据使用业务模式的类型
为了维持数据的有效使用,适当运行的业务模式必不可少。我们根据业务模式运行所使用的数据可以确定六种类型:政府的大数据分析;
政府门户网和参与程序;
社会控制的政府门户网(主要用于问责);
有组织的社会团体门户网和参与程序;
有组织的社会团体数据可视化门户网站,以促进政府和社会团体之间的中间关系;
通过广告或由社会团体或组织所支持的私人应用程序,其目的在于为改善政府服务提供条件。
(4)数据行为者使用的技术类型
考虑到数据参与者使用政府开放数据是基于特定的旨趣,并遵循特定的业务模式,数据使用的技术维度显得尤其重要。我们根据参与者使用数据的技术特性可以确定六种类型:计算机编程语言;
数据可视化;
地理编码和绘图;
网络分析;
商业智能和数据挖掘。
总之,政府开放数据作为动态的生态系统,是利用数据生成信息,赋予知识可动性,从而协调公民行动和政府集体决策。由此,数字技术使政府在开放数据生态系统内实施多层链接成为可能。
术语“设计透明度”源于两方面:一是隐私设计,卡沃基安创造“隐私设计”,构想整体和综合的隐私保护框架,帮助政府和组织分析隐私保护的积极价值,反驳最终以牺牲其他价值为代价实施隐私保护的假定。(23)A. Cavoukian, Privacy by Design: The 7 Foundational Principles,2009, Retrieved January 10, 2020.二是透明度预测分析,它侧重于信息流,把实现透明度的过程分为三个部分:第一,人工智能系统的设计:政府开发新系统提高透明度的一般设计要求;
第二,数据处理和信息分析:一旦系统被使用,信息提供使数据处理、决策过程和风险变得更加透明;
第三,问责制:在可检验、可回应和可报道的决策过程中,政府面向组织和利益相关者的透明。(24)T. Z. Zarsky, Transparent Predictions, University of Illinois Law Review, Vol.53, No.4, 2013, pp.1503-1570.在此,我们设计政府透明度聚焦于透明度博弈三方参与者之一政府(信息发送者)设计透明度的总体需求、面向用户(信息接收者)的系统信息提供以及组织意义上的透明度系统管理。在此,我们综合我国有关政府透明度的法律、法规和其他规范性文件,结合有关政府透明度的学术文献(25)《中国政府透明度指数报告》(2010-2021)提出评价我国政府透明度的一系列指标,如一级指标“决策公开”项下的二级指标包括重大决策预公开(40%)、规范性文件公开(30%)和政策解读(30%)。https://xianxiao.ssap.com.cn/catalog/6138742.html、政策和行业报告,提出三个阶段和九大原则。
(一)人工智能系统设计(第一阶段)
政府及其设计系统的工程师和开发人员必须关注政府信息系统的基本价值和行政伦理,并系统分析运用人工智能设计政府透明度的基本关切:一是,与系统所依赖的数据质量有关的认知关切;
二是,对不平等、不正义和不公平结果的规范性关切;
三是,政府决策的可追溯性。(26)B. D. Mittelstadt, P. Allo, M. Taddeo, S. Wachter & L. Floridi, The Ethics of Algorithms: Mapping the Debate, Big Data & Society, Vol.3, No.2, 2016, p.7.认知关切促使政府及其设计人工智能系统的工程师审慎思考使用什么数据才能得出特定结论以及是否可以通过评估方式得出特定结论;
规范性关切激励政府及其工程师监控人工智能系统的合法性和社会伦理影响,并寻找错误和偏见;
决策可追溯性(尤其是机器学习算法)挑战促使政府及其人工智能设计工程师考虑人工智能系统可能如何影响政府透明度,如果信息系统缺乏可追溯性可能对政府决策带来多大影响以及政府在特定情形下所做出的决策缺乏可追溯性是不合理的。
1.主动性:主动,而不是被动(原则1)
政府采用技术和组织措施应当保证从人工智能系统开发之初就着眼于实现透明度。其基本假定是:技术必然体现价值,只有在设计过程中积极关注价值,才能确保它们的实现不会因意外的决策设计而变得更加困难。弗里德曼等人的价值敏感设计和艾姆·范·温斯伯格有关医疗保健机器人以关怀为中心的价值设计已形成概念化方法,旨在实践中实现其价值目标。(27)B. Friedman, P. Kahn & A. Borning, Value Sensitive Design and Information Systems, In K. E. Himma& H. T. Tavani (Eds.), The Handbook of Information and Computer Ethics, Hoboken, NJ: Wiley. 2008, pp.69-101.因此,政府及其系统设计者必须从一开始就考虑如何使那些对系统决策感兴趣的利益相关人(不同类别的用户以及监管者)能够理解政府决策的标准和价值。
2.一体化:透明度视为一个完整过程(原则2)
政府在设计人工智能系统时应考虑透明度需求的复杂性,必须超越透明度的静态理解。政府的动态透明措施必须客观处理决策过程的复杂性,并显示系统的不同方面应当如何达到公共管理系统内的决策标准。由于人工智能系统通常是从数据点进行推断,它可能得出超出这些数据所包含信息的结论。由此,政府必须阐明它们认为可接受的决策标准,包括制定一般原则和具体标准。从综合视角而言,政府及其系统设计者必须认识到借鉴不充分或未充分实现的决策标准可能对决策产生的实际影响。尽管人工智能系统的偏见和歧视并不能完全消除,然而政府必须努力减少偏见和歧视。为此,政府依据人工智能系统所做出的决策、数据集和形成人工智能系统决定的过程,包括数据收集、数据处理和算法使用都应当尽可能地以最佳标准进行记录,并运用记录过程查明政府自动化决策产生错误的原因。它有助于政府预测自动化决策可能给特定利益相关者带来的不良后果,并防止可能发生的错误。
3.受众关注点:以更多受众敏感的方式进行交流(原则3)
政府及其系统开发人员必须客观对待透明沟通。政府的责任不仅是提供信息,而且必须考虑接收和解释信息的可能受众,因为透明度要求政府根据不同的信息接收者而有所不同。尽管正在处理个人信息的人是数据的主要接收者,但也必须考虑其他利益攸关方如各类系统用户、监管机构或普通公众,这是政府信息系统运行的性质和功能决定的。政府应当区分作为信息提供对象的一般公众与特定受影响人,因为有关个人决策的特定信息需求是主要关切。政府提供给其他政府机构、监管机构和公共机构的信息不仅要针对它们的具体需求,而且要针对更多的技术要求,因为这些机构比一般公众拥有更多的相关专业知识和技术。换言之,如果针对除数据主体自身之外训练有素的第三方或代表公共利益的监管者,透明度披露可能更具有影响力。(28)A. Tutt, An FDA for Algorithms, Administrative Law Review, Vol.69, No.1, 2017, pp.83-123.因此,政府必须让受影响的个体、组织和监管机构自己做出决定,使数据披露更具有可信性。
(二)数据处理和信息分析(第二阶段)
此阶段的重点是政府应向利益相关者提供信息,包括处理数据的类型、处理数据的方式以及与数据处理相关的风险。其核心问题是确定政府需要披露的信息,从而履行对利益攸关方的透明度义务。政府提供透明信息的目标是使系统及其风险对利益攸关方具有可解释性。根据有关机器学习公平、问责和透明的算法原则,可解释性意味着确保算法决策和驱动决策的任何数据都能以非技术术语的方式向终端用户和其他利益相关者做出解释,包括解释系统的一般功能、系统内数据的具体用途以及系统做出特定决定的信息。我国《数据安全法》针对不同的利益攸关方,确定了一些不同但密切相关的目标,为决策辩护、风险控制、系统改进和发现系统中隐含的新知识提供条件。因此,在多大程度上实现可解释性取决于政府决策的背景、后果的严重程度以及相关利益主体的特殊性。
1.数据处理:解释使用哪些数据和如何处理这些数据(原则4)
鉴于人工智能系统复杂决策的可解释性受潜在技术限制,该原则要求政府及其工作人员为披露数据提供易于理解的描述性大纲:说明系统正在使用什么数据以及如何使用这些数据,包括关于数据处理在哪个阶段可以接受检查以及监管者何时在系统可以行使自由裁量、干预或监管权的信息。政府数据可以在系统中用于各种功能。根据我国《数据安全法》规定,数据处理方式包括数据的收集、存储、使用、加工、传输、提供、公开等。(29)参见《中华人民共和国数据安全法》第三条。在数据分析阶段,从技术视角审视透明度意味着政府应当披露用于自动化决策的软件。如果政府使用定制软件,依据透明度要求则可能侵犯知识产权,政府必须考虑设计相关各方都能接受且具有检查属性的系统,而不必披露输入和输出数据及其源代码,保护私人敏感数据和商业秘密。因此,可解释性要求政府披露与系统有关且易于理解的信息:政府人员凭借个人意志行使自由裁量、干预或监管时,必须提供透明信息;
当特定个体对政府决策的影响可能导致偏见时,应使之透明;
公众享有不受政府自动化决策影响的权利,尤其是政府决策可能对公众产生重要的法律后果或其他重大影响时。
2.决策标准:解释决策标准并证明其合理性(原则5)
除数据处理的可解释透明外,政府应当注意解释决策标准。政府对决策标准的解释应包含下列内容:为什么某类数据是政府做出推断的正常和可接受基础;
为什么这些推断在正常情况下可以被接受,且与政府自动化决策所选定的处理目的和类型有关;
用于得出推断的数据和方法是准确的,且统计上是可靠的。同时,政府对数据处理既需要事前预测,考虑哪些数据源与预期结果有关;
也需要对结果实施事后评估,考虑作为数据主体的第三方如何看待和评估政府决策的基础推论,(30)S. Wachter, & B. Mittelstadt, A Right to Reasonable Inferences: Re-thinking Data Protection Law in the Age of Big Data and AI, Columbia Business Law Review, Vol.7, No.2, 2019, pp.494-620.且必须反思数据的来源与推论之间的联系。
3.风险披露:说明风险和风险缓解措施(原则6)
该原则的核心是使与人工智能系统运行相关的风险变得更加透明。传统上,政府通过发布信息与人民进行沟通,政府(或公共组织)与公民之间的信息沟通就是实现透明度,其中风险沟通是知情同意的基本要素。政府自动化决策可能带来新风险:侵犯隐私、算法歧视和有偏见的决策以及声誉、信息自决和有问题记录的潜在存在。由于数据处理的模糊性,用户对系统和政府自动化决策相关的风险知之甚少。在此,了解风险是实现政府透明度的先决条件之一,它有助于增加人工智能系统用户的自主性和控制力。尽管我国法律并未规定有问题的政府自动化决策对个人造成损害究竟应当采取何种补救措施,(31)参见《中华人民共和国政府信息公开条例》《中华人民共和国数据安全法》《中华人民共和国网络安全法》和《中华人民共和国个人信息保护法》。但是有关风险的透明度不仅要求政府识别对隐私保护产生影响的风险,而且必须解决算法偏见和歧视所带来的风险以及与政府自动化决策失败相关的其他风险。此外,政府在关于风险的说明中应当包括有关减轻风险措施的信息,使公众更好地评估剩余风险可能存在的范围。因此,任何政府问责制都必须纳入与形成风险有关的信息。
(三)面向组织与利益相关者的透明度管理(第三阶段)
以组织和利益攸关方为导向的透明度管理是设计政府透明度模式的最后阶段,它涉及受众参与社会关切的要求。政府既定的决策标准必须接受有效审查,且必须在实践中得以遵从。由于政府和组织可能通过操纵、适应或运用行政伦理方式参与社会期望管理,有效的透明度管理需要政府的适当性回应,但必须基于规范与伦理。必须依据有关政府自主决策与智能系统伦理一致性要求确定具体责任的分担方式,即政府和组织应当为其使用算法所做出的决策负责,即使因详细解释算法可能导致法律后果也不能回避责任,政府应当关注人工智能系统的“算法问责”(32)ACM, Statement on Algorithmic Transparency and Accountability, 2017, Retrieved January 10, 2020, https://www.acm.org/binaries/content/assets/public-policy/2017_usacm_statement_algorithms.pdf.。它支持一种非人主体责任形式,并受对机器负责的持续关注所影响。在此,以组织和利益相关者为导向的政府透明度管理是以系统的可追溯性和可审核性为前提。可追溯性意味着人工智能系统的设计方式许可追溯其决策之初,并许可信息参与人重建相关流程和决策记录,从而确定决策的责任主体。可审核性意味着系统的设计必须许可适格的外部人员获取有关政府信息的流程和决策因素,并对其适当性做出判断。其基本要求在于,问责制必须有明确的程序规定,且适合所要求的回应和必要时适时变化。
1.可检验性:确保数据信息可检验和可审核(原则7)
政府人工智能系统自动化决策必须通过审核检验系统。这一原则涉及有关透明度的可追溯性而不是前瞻性。根据有关机器学习公平、问责和透明度原则,可审核性“通过数据披露提供有关监管、检查或批评的信息,包括提供详细的文档、技术上合适的应用程序编程接口和许可使用条款,使感兴趣的第三方能够探测、理解和审查算法行为”(33)J. Zerilli, A. Knott, J. Maclaurin & C. Gavaghan, Transparency in Algorithmic and Human Decision-making: Is there a Double Standard? Philosophy & Technology, Vol.32, No.4, 2019, pp.661-683.。有关金融透明度的可检验性还包括针对有技术素养的利益攸关方的具体信息,但要求金融机构在非专业人士可获得信息的描述中必须提供关于决策依据的核心信息。由此,政府及其系统设计者和创建者不仅应当基于内在能力引导审核员了解系统的基本技术路径,而且应当针对各种典型和非典型场景的测试结果处理反事实事件。
2.可回应性:对利益相关者的询问和关切做出回应(原则8)
此原则要求政府对个人和利益攸关方做出回应,这不是针对个人决策的可检验性问题。政府开放数据的可回应性要求:(1)政府决策接受媒体、社会团体、公共行政人员和普通公众等利益攸关方的接触和审查。如果利益相关者有合理的问题、疑问和顾虑,他们可以轻松地发起与政府的透明沟通。(2)政府和组织应当确保对透明度问题做出有意义的答复,并兼顾个案。(3)部署人工智能系统的政府代表应当以积极的态度对待询问,并对这些询问做到认真、及时和个性化回答,承认询问者所表达关切的有效性。在此,可回应性不仅适用于未达到透明度标准的情形或透明度所暴露的相关关切,而且还必须涵盖遵从任何制裁条件、实施严格的自我评估和采取有意义的矫正行为。
3.可报道性:认真对待报告系统(原则 9)
依据该原则,政府及其系统设计者应当通过详细报告使政府活动变得更加公开透明:(1)政府出版定期报告,提供与人工智能系统有关的信息吸收和使用、准确性描述和信息汇总;
政府风险评估工具的开发者应当公布使用工具的法域、系统做出决定的数量以及决定结果。(2)在可能情况下,政府应当通过实地考察和比较分析其他决策的结果作为确定自身决策质量的基准。(3)根据信息的重要性和数据披露的即时性,政府报告可以每年、每季、每月或每天出版,且采用不同格式:从传统的文本文档,到提供聚合信息的可搜索平台,再到许可提取和仔细检查原始数据的应用程序编程接口。此外,政府采用适当的报告格式应考虑受众的信息需求和能力,可根据最重要的利益攸关方和群体的需求加以分类排序。此原则与前两项透明度管理原则相结合,要求部署系统的政府和组织以及受系统运作影响的利益攸关方或公众都能充分发挥主动性。
总之,设计相对合理的政府透明度模式应当符合我国国情、政府、组织、个人或其他群体的期许:设计理性的政府透明度模式,使政府和监管机构以公开和诚实的方式解释它们所做出的决策和决定;
以现有最新科学为基础,既关注政府透明度设计的复杂性、语境嵌入性以及随后的局限性,又综合考虑数据技术的发展速度、透明度概念的多维性、实现透明度的不确定性、处理不同利益攸关方的最佳方式以及政府实施透明度举措的不同方式;
实施任何作为风险沟通方案的透明度举措,政府都必须适当地评估,使利益攸关方通过提供反馈和创建新的数据资源参与改进政府数据集。