尚权推荐SHANGQUAN RECOMMENDATION

尚权推荐丨马国洋:论非法人工智能证据的排除

作者:尚权律所 时间:2026-05-18

摘要

 

非法人工智能证据的判断应以权利保障理论为基础,其主要包括因算法歧视侵犯平等权的证据与因数据使用侵犯隐私权的证据。相较于其他类型证据,非法人工智能证据具有权利侵犯扩张化和权利侵犯实时化的侵权特征。对非法人工智能证据进行排除时可能面临双重困境。第一重是既有证据排除困境的加剧。与其他类型证据相似,法官在排除人工智能证据时,同样需要面临排除权力不足与外部阻力较大的问题,并且这种困境可能会进一步增强。第二重是因人工智能不可解释性导致的证据审查困难,进而引发的新困境。未来,非法人工智能证据排除制度体系的构建应注意关注证据种类、非法人工智能证据的范围等问题。同时,也应借鉴利益权衡理论建立“绝对排除+裁量排除”的排除模式,并充分发挥专家作为诉讼参与人的作用以应对证据排除的困境。

 

关键词:非法人工智能证据;非法证据排除;算法歧视;隐私保护

 

 

《中华人民共和国国民经济和社会发展第十五个五年规划纲要》指出,要“加快实破人工智能基础理论和核心技术,推进人工智能模型架构改进、算法优化,强化‘模芯云用’协同创新”。可以说,人工智能技术已经成为国家未来重要的发展方向。从实践中看,此项技术也已经对各行各业产生了巨大影响。在证据科学领域,人工智能技术的重要影响便是人工智能证据的出现。所谓人工智能证据,是指人工智能对海量数据进行筛选、汇总、提炼、形成结论并在审判中使用的证据。这种证据不同于任何传统证据种类,其是由机器依托数据作出的实质判断,典型的表现形式包括人脸识别证据、语音文字转换证据、智能轨迹分析证据、大数据分析报告等。此类证据虽然可以帮助法庭提升事实认定的准确性,但也对公民权利保障形成了较大挑战。

 

对于人工智能证据这种权利侵犯风险,最为有效的应对方式便是通过非法证据排除的方法将涉及侵犯公民基本权利的证据排除于法庭之外。但当前我国并未建立非法人工智能证据排除规则,并且鉴于人工智能证据与物证书证等证据类型之间的较大差异,既有规则也无法提供参考。这便需要理论界和实务界对该问题展开探索。令人遗憾的是,目前无论是理论界还是实务界,均尚未对此给出令人满意的答案。就理论界而言,各个学者主要是从相关性和可靠性(真实性)两个方面对人工智能证据的审查问题进行分析。即使有一些讨论提及了此类证据的合法性问题,也仅仅是略作说明或是刻意回避,并未详细展开。换言之,当前理论界尚未提出关于非法人工智能证据排除问题的系统性论述,在什么是非法人工智能证据、如何排除非法人工智能证据等问题上均存在研究空白。就实务界而言,在当前的司法实践中,法官罕有对此类证据合法性进行审查的情况。为了更好地分析人工智能证据的审查状况,本文以“人脸识别”“语音文字转换”“智能轨迹分析”“大数据分析”为关键词在中国裁判文书网上进行检索,发现当前刑事诉讼中出现的人工智能证据共计 3004例。对于这些证据,法官往往未对其证据能力进行分析便直接采纳了证据。即使在个别采取审查措施的案例中,法官也多是从可靠性的角度加以审查,检索案例中目前尚未发现因人工智能证据不具有合法性而被排除的情况。

 

有鉴于此,本文将在既有研究的基础上,深入分析非法人工智能证据排除的相关问题,并尝试构建相应的制度体系,以期为科学有效地审查人工智能证据提供支持。具体来说,本文的第一部分将理清非法人工智能证据排除的理论基础、非法人工智能证据的类型以及其在侵权方式和排除规则方面的特殊性;第二部分将结合我国既有非法证据排除规则的运行情况和人工智能证据的特点,探讨非法人工智能证据排除可能遇到的困境;而最后一部分,将以上述分析为基础,探讨非法人工智能证据排除规则构建的具体方案,并就其运行过程中可能面临的问题提出解决路径。

 

一、非法人工智能证据是侵犯公民基本权利的新型非法证据

 

非法人工智能证据排除的有效实现,需要首先从理论基础层面确立排除的原理,进而明确非法人工智能证据的类型和侵权特征等基础问题。

 

(一)非法人工智能证据排除的理论基础:权利保障理论

 

在非法证据排除的问题上,理论界存在着虚伪排除理论、权利保障理论和程序性制裁理论等观点。从当前的发展趋势看,以程序性制裁为核心思想的理论正在被愈发强调,甚至有论者认为其已经成为我国主流的证据排除理论。“程序性制裁所针对的是侦查人员、检察人员和审判人员违反法律程序的行为,并以宣告诉讼行为无效为其基本制裁方式。”程序性制裁理论将是否违反法定程序作为证据是否具有合法性的判断标准,同时将维护司法的纯洁性和威慑违法行为作为非法证据排除的核心价值追求。总体而言,基于该理论指导下的非法证据排除可以应对大多数证据排除的状况,但是其在一些情况下也可能具有失灵的风险。一方面,当某项证据的取证方式未被法律所确认时,程序性制裁可能会“无的放矢”。特别是在我国,当法官没有明确的非法证据排除的依据时,即使证据搜集方式侵犯了公民的基本权利,非法证据排除程序很多时候也不会被启动。另一方面,程序性制裁理论本质上是一种“权力本位”的证据排除理论,其并未将权利保护置于非法证据排除的核心地位,这就导致在证据排除过程中,权利保护的价值可能会让位于事实认定准确等其他价值追求。而这两方面风险就造成该理论无法有效处理非法人工智能证据的排除问题。就前一项风险而言,尽管人工智能证据权利侵犯的程度可能很大程度上超越传统证据,但受制于立法的滞后性,法律很难短时间内对此类证据的取证程序进行有效设计,当前我国的立法样态也证明了这一点—目前我国对于大数据侦查的程序并未作出较为明确的规定。当法官无法通过规则判断取证方法是否合法时,也就很难判断证据是否合法。即便是立法可以根据当前大数据侦查和人工智能证据的特点设计相应的取证程序,但随着科学技术不断发展,基于新技术衍生的人工智能证据可能会再次诞生新的风险,此时立法仍然可能存在滞后的问题,这便进一步加剧了程序性制裁理论在应对相关问题时的窘境。就后一项风险而言,非法人工智能证据的排除必然会涉及权利保障与其他价值间激烈的竞争,若仍然坚持以程序性制裁理论为基础构建非法人工智能证据排除规则,则很有可能导致权利保障价值让位于其他价值,而无法达成非法证据排除的目标。

 

基于此,非法人工智能证据排除的有效实现,需要首先调整证据排除的基本理论。对此,一些学者提出的权利保障理论在非法人工智能证据排除的问题上显得更为奏效。具体而言,该理论主张将公民权利保障作为非法证据排除的首要追求,并将是否侵犯公民的基本权利作为非法证据排除的判断依据。这样的方式可以有效解决前述程序性制裁理论在非法人工智能证据排除问题上的困境。

 

一方面,对于“无的放矢”的问题,权利保障理论将非法证据排除的标准确立为权利侵犯,这便意味着即使没有取证程序作为参考,法官也可以根据技术是否侵犯基本权利对人工智能证据的合法性进行判断,而这些基本权利已被宪法等规则所厘定,这就提升了非法证据排除对社会变化和技术发展的适应性。另一方面,权利保障理论将公民基本权利保障置于首要地位,也可以进一步强调非法证据排除的过程中权利保障的价值位次,使其在准确性和效率性等价值竞争中取得领先优势。当然,需要说明的是,采用权利保障理论并不意味着无条件牺牲其他所有价值,而是需要在权利保障与其他价值分量相当时,优先考虑前者。

 

事实上,当前世界上很多国家在非法证据排除问题上的出发点均是权利保障。1914 年,美国联邦最高法院在威克斯诉合众国案中裁定,违反宪法第四修正案而非法搜查和扣押获得的证据,不得在联邦法庭上使用。这标志着非法证据排除规则正式确立。该案非法证据排除的初衷正是对权利的救济。自此案之后,世界各国也纷纷设立了类似规则。但由于不同的诉讼结构,各国在非法证据排除过程中也采用了不同的方式方法。总体来看,当前各国非法证据排除的方式可以分为两种,一种是以庭审为中心的非法证据排除,即不具有合法性的证据也不具有可采性,不得在法庭中出示,其典型代表是英美法系国家。另一种是贯穿诉讼全过程的诉讼行为制裁方式,这又包括两种模式,一是以法国、意大利为代表的程序制裁模式,二是以德国为代表的实体制裁模式。其中,程序制裁模式是在程序法层面对可能侵扰基本权利的侦查行为进行干预,审查主体主要为刑事法官或者预审法官。宪法法官的介入机制主要为抽象性的违宪审查,极少介入具体刑事案件的评价。而实体制裁模式则是以基本权利为基础,对损害基本权利的诉讼行为进行合宪性审查并对不具有正当性的行为进行制裁。基于以上分析不难发现,尽管各国刑事诉讼中的非法证据排除规则不尽相同,但设立这一规则的目的或初衷是相同的:都是从人权保障的价值出发。故而,从比较法考察的角度看,将非法人工智能证据排除的理论基础调整为权利保障,也符合世界发展的趋势。

 

当然,也需要说明的是,一方面,使用权利保障理论也并不完全排斥程序性制裁理论。若我国未来在关于人工智能证据的取证方面设计了相应的规则,则法官也可以据此排除证据。另一方面,侦查行为与基本权利保障之间不可避免地会存在冲突,由此,并非只要侵犯基本权利就必然存在非法证据,还应进一步结合侵权的方式、程度进行综合分析。

 

(二)非法人工智能证据的类型

 

从当前人工智能与司法裁判结合的理论和实践看,其可能侵犯的基本权利类型相对较多。本文主要选择在人工智能生命周期中,对技术使用中较容易侵犯基本权利的典型场景进行分析。

 

1. 因算法歧视侵犯平等权的人工智能证据

 

平等权是指公民平等地享有权利,不受任何差别对待,要求国家给予同等保护的权利与原则。平等权最早被法国的《人权宣言》所确认:“法律对于所有的人,无论是施行保护或处罚都是一样的。在法律面前所有的公民都是平等的,故他们都能平等地按其能力担任一切官职,除德行和才能的差别外不应有其他差别。”此后现代宪法国家均通过各种方式确定了平等权。我国《宪法》第 33条规定:“中华人民共和国公民在法律面前一律平等。国家尊重和保障人权。”该规定为公民享有平等权提供了宪法基础。具体到公民和国家的关系上,平等权主要表现为“公民有权要求国家提供平等的保护,不因公民性别、年龄、职业、出身等原因给予差别对待。”

 

算法是为完成某项任务在软件设计时嵌入的数字化流程或规则,其可以为人工智能提供核心驱动。人工智能证据在算法方面对权利最大的威胁便是因算法歧视导致的公民平等权受损。所谓算法歧视,是指依据算法所作自动决策实施的直接或间接歧视性行为。相较于传统歧视,算法歧视依托于大数据、云计算等新兴技术,具有更强的隐蔽性和广泛性,其可能引发性别、种族等各种歧视,进而对平等权造成更加严重的侵犯。

 

一般而言,算法歧视的原因主要有两个方面。一方面,算法的设计和运行均可能导致算法歧视的发生。尽管人工智能具有自主建立规则并进行决策的能力,但其并不能完全摆脱人类而独立存在,算法的形成仍然要由人类进行设计。在算法设计过程中,人类需要构建问题并在处理数据之前就算法应该预测的内容作出选择。此外,在确定预测目标后,人类还必须决定他们希望算法考虑哪些属性,以便算法确定每个属性是否以及在多大程度上预测了既定目标。因此,设计者很多时候需要进行社会性构建,例如,对量刑系统中各个类型的刑事被追诉人进行主观评价。而这种建构便可能导致算法设计者的偏见直接植入算法之中。现有人工智能实践已经证明了因人类偏见可能导致算法歧视,很多人脸识别算法会受到设计者前见的影响便是一个较为典型的例子。除此之外,即使算法在设计时不存在偏见,若在未拟定的情形中使用非歧视算法,同样可能导致算法歧视。例如,用来预测给定群体特定结果的算法若适用于另一群体,就会生成不准确的结果,继而对这一群体造成不利影响和偏见。

 

另一方面,数据的选用同样是引发算法歧视的原因之一。以机器学习为核心的人工智能技术往往需要大量的数据作为“养料”以建立相应的规则。在这一过程中,若作为“养料”的数据本身就具有歧视性,那么依托于这些数据所形成的算法也很容易产生歧视—输入的样本数据既有可能无法充分代表某些特定社会群体(例如,输入的数据未包含某些特定群体的信息),亦有可能过度代表某些特定社会群体(例如,对特定职业不墨守成规的人可能受到更多监督,也更有可能被发现问题)。无论是哪种情况,当样本选择不当时,很有可能出现“偏见进,偏见出”的问题。以贷款预测系统为例,如果该系统过多使用了男性数据而较少使用女性数据,那么算法就会错误评估男性和女性的还款可能,从而引发歧视。为避免这样的问题,人们会选择拓展样本数量,即通过获取更多数据的方式解决问题。但很多时候,这一方法并没有太大效果—算法可能会通过机器学习过程继续获取有偏差的样本。而在连续的训练之后,偏差将被进一步放大,最终左右算法结论。即使输入的数据具有较强的代表性,但如果人类社会在某一领域已经存在歧视,那么基于该数据得出的算法结论同样可能存在歧视。例如,若某类群体更容易从事低薪酬的工作,因此点击低薪酬的广告频率也相对更多,那么算法可能会据此建立相应规则,更多地向此类群体推送低薪酬的广告。换言之,算法将保持或进一步扩大人类社会的既有偏见。

 

必须注意的是,在当前的各类智能应用中,算法歧视的现象并不罕见。(1)性别歧视。在性别歧视问题上,比较有代表性的案例是谷歌对于工作的差异性推送。研究表明,谷歌对男性推送高收入服务广告的频率要远远高于女性,这直接造成了对女性的歧视。类似的性别歧视还有亚马逊人工智能招聘程序在遇到女性相关词汇时,会进行降级处理。(2)种族歧视。种族歧视是算法歧视的高发区,有大量案例涉及算法种族歧视。例如,相关研究显示,关于逮捕记录的暗示性广告往往会更多与黑人发生联系。在 2016 年,用户在谷歌图片中搜索“三名黑人青少年”便出现了抢劫的相关信息,而搜索“三名白人青少年”则主要导向了快乐白人孩子的照片。此外,据有关数据显示,对于人工智能系统而言,肤色较深的女性是最容易被错误分类的群体(错误率高达 34.7%)。而对于肤色较浅的女性来说,最大错误率为仅 7. 1% 。

 

事实上,算法歧视的案例远不止于此,在犯罪预测、司法审判、员工招聘、广告投放、价格制定、图片和文本搜索、翻译工具等各种人工智能应用场景中,均有不同程度的算法歧视直接对平等权造成了侵犯。而当这些算法在大数据侦查中使用,并生成了人工智能证据时,其合法性便可能受到挑战。

 

2. 因数据使用侵犯隐私权的人工智能证据

 

隐私权是指公民享有的私人生活安宁与私人信息依法受到保护,不被他人非法侵扰、知悉、搜集、利用和公开等的一种人格权。世界上很多国家均将隐私权作为公民的基本权利进行保护。例如,美国通过格瑞斯沃尔德诉康涅狄格州案确立了宪法对隐私权的保护。而在德国,“虽然普遍认为隐私权属于一般人格权的范畴,但在司法裁判中,也认为隐私权属于宪法权利的范畴。”我国对隐私权的保护采用了公法和私法共同保护的模式,即宪法人权条款 + 法律(司法解释)设置的模式——在宪法中确立相关权利条款,并通过下位法加以具象化。

 

随着信息技术的发展,当前人类的隐私权已经不仅仅依附于房屋、车辆等实体之上,而更多体现在邮件信息、聊天记录、医疗记录等电子数据之上。例如,电子健康记录是捕获和存储患者临床护理信息的重要方式,其对于检测患者健康具有较大意义。但同时,该记录也作为重要的数据信息来源被大量上传于数据库用于科学研究、从业人员健康查询等其他目的。而该应用方式存在较大风险,电子健康记录可能包含很多患者的隐私信息,例如健康状况、疾病史、健康风险等内容,随意使用此类信息可能导致有关人员遭到歧视。此外,美国相关的司法实践同样可以证明隐私权所包含的内容正在不断扩充。一个具有代表性的案例是卡平特案。在该案件中,美国联邦调查局调取了卡平特的手机基站定位数据,并绘制了相关的轨迹分析。卡平特以无证搜查为由,要求排除该证据。最终,美国联邦最高法院认定在没有搜查证的情况下获取相关信息是违宪行为。该案件将隐私权的保护客体拓展到数据信息,并确立了“最后的价值趋向是否会有体现个人隐私的可能”的新标准.而随着人工智能技术的不断发展,人类隐私权的范围可能会进一步拓展,很多在传统观念中或者法律规定中未被纳入隐私权保护范围的数据和信息,也可能反映公民的隐私。例如,传统意义上“住宅不受侵犯”主要是指住宅不受到非法搜查或非法侵入。但当前的智能家居很多都具有监视的功能,而这些家居所产生的信息也同样可能侵犯公民的生活空间,故而这些信息也属于公民隐私的范畴。再例如,自动驾驶技术使汽车内部空间变为数据收集空间,人们在车内的行为也会被随时记录下来,而这些被记录下的信息往往也具有隐私性。具体而言,机器可能收集的隐私信息包括:(1)车内人员的姓名、声音等个人信息;(2)车内人员的相关活动;(3)车内人员的活动轨迹;(4)车内人员的财产信息;(5)车内人员的健康信息等。

 

如前文所述,人工智能结论的形成需要以数据为基础,甚至可以说,数据的数量越多、质量越高,结论的可靠性也就越高。因此,侦查机关往往会搜集海量数据以获取准确情报。例如,为了提高大数据分析的准确性,“湖北云公安”项目“已全面完成内部信息资源整合,并与 30 个省直部门签订信息共享协议,整合‘衣食住行、业教保医’和互联网等信息资源 30 871 亿条,构建起一座相当于 2 610 个国家图书馆藏书容量的公安大数据仓库”。当这些数据用于生成式人工智能证据时,便可能存在两方面侵权风险。一是隐私数据可能被直接用于人工智能证据的形成。例如,侦查机关可能借助公民的通讯数据和身份数据生成智能轨迹分析证据。二是侦查机关可能通过数据挖掘,拼凑出侵犯公民隐私权的信息,并用以形成人工智能证据。人工智能技术具有超强的数据“画像”能力,借助物联网、大数据等技术,人工智能的数据整合和分析能力得到极大的增强,能够轻易地描绘出被分析人的完整“画像”。这种方法可以通过很多看似不起眼甚至无关的信息,拼凑出可能侵犯隐私权的信息,即“马赛克效应”。例如,用户在大众点评等平台公布的旅游、饮食、位置等信息,经过拼凑,可以反映用户的健康状况、性取向等隐私信息。而无论是哪种数据使用的方式,其一旦被用于人工智能证据的生成,相关证据合法性便可能存疑。

 

(三)非法人工智能证据的侵权特征

 

相较于传统证据,非法人工智能证据对于权利的侵犯具有两大重要特征。一是权利侵犯扩张化。

 

一般来说,常规证据即使涉及权利侵犯问题,也大多是关于刑事被追诉人,但人工智能证据则大幅度拓展了可能的侵权对象。这一特征在因数据使用侵犯隐私权的人工智能证据之中体现得更为明显。如前文所述,人工智能证据的形成通常需要通过大量数据进行训练,而这些数据既包括刑事被追诉人的信息也包括其他公民的信息。例如,智能人脸识别系统的有效运转便依赖于大量不同的人脸照片。据乔治城大学法学院隐私与技术中心的一项调查显示,美国联邦调查局人脸识别数据库所掌握的人脸数据已经达到 1.17 亿,占成年人口的 48% ,而由此生成的人脸识别证据,也是以这1.17 亿人的数据为基础的。再例如,e 租宝案件中的大数据分析证据是依托于 4 000 多家银行、247家第三方支付平台、164 家保险公司、114 家券商汇总的 1 万多个账户的几十亿条资金交易流水信息生成的,也就是说,该证据的生成很可能包含上万人的账户信息。当上述信息涉及隐私问题时,就存在大规模侵权的风险。换言之,非法人工智能证据侵犯隐私权的对象不仅限于刑事被追诉人,也会拓展至其他公民。相对而言,因算法歧视侵犯平等权的人工智能证据的侵权对象并不会辐射全体公民,但其同样可以体现侵权扩张化的特征。一般而言,算法歧视的对象往往是一类人,例如,黑人、女性、少数民族、老年人等。因此,当侦查机关使用存在算法歧视的算法生成证据时,其侵权对象也会涉及某一类群体,而并非只限于刑事被追诉人。

 

二是权利侵犯实时化。在传统的侦查模式下,侦查机关的取证往往有较为明确的程序限制。例如,若侦查人员在侦查过程中想要从有关单位或者个人处调取证据,必须制作《呈请调取证据报告书》,并报办案部门负责人批准。但对于人工智能证据的数据调取和算法使用则并没有相关程序限制。在大数据平台下,公民的相关隐私信息被直接存入平台,当需要形成人工智能证据时,侦查人员可以立刻调取数据,并依靠相关算法进行分析。换言之,侦查人员可以随意使用各种算法以及公民的信息,缺少相应的程序启动条件。因此,人工智能证据所依赖的算法和数据的使用并没有具体的行为时间点,证据最终的形成是之前不断搜集数据并利用数据进行算法分析的结果,这也就导致了证据具有实时侵权的风险。

 

(四)非法人工智能证据排除无法借鉴既有规则

 

如前文所述,在目前我国的司法实践中,法官基本不会审查人工智能证据的合法性。之所以会出现这种状况,原因主要在于我国尚未建立非法人工智能证据的排除规则。不仅如此,既有的非法证据排除规则也无法在非法人工智能证据排除的问题上提供借鉴。申言之, 当前我国非法证据排除规则主要包括非法言词证据的排除规则和非法实物证据的排除规则。一方面,非法人工智能证据的排除无法借鉴非法言词证据排除规则。非法言词证据主要是使用刑讯逼供等非法手段取得的证据,而人工智能证据是机器根据数据生成的结论,其形成过程并不涉及侦查人员采取强制的有形力措施,因此,排除规则难以提供参考。另一方面,非法人工智能证据的排除无法借鉴非法实物证据排除规则。根据《刑事诉讼法》第 56 条和《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第 126 条之规定,非法实物证据排除的主要考量因素是证据违反法定程序以及所造成后果的严重程度,这同样无法直接移植到非法人工智能证据的排除。一是由于当前我国并未对大数据侦查建立相关的制度和程序,法官无从判断取证是否严重违反程序,甚至可能不了解人工智能证据的取证模式;二是由于非法人工智能证据大多直接侵犯公民的平等权或隐私权,不仅权利性质重要,而且可能涉及案外第三人,故而,非法证据一旦形成就容易造成严重后果。基于上述原因,法官即使想要排除非法人工智能证据也无据可依,这也就不难理解当前实践中的审查样态。

 

二、非法人工智能证据排除的障碍:新旧困境的双重限制

 

非法人工智能证据的排除将可能面临两重困境。第一重是既有排除困境的加剧。当前我国非法证据排除整体实践效果并不理想,而非法人工智能证据的排除可能会面临更大困难。第二重是人工智能证据的不可解释性所带来的排除困难,这是因人工智能技术特点而引发的新困境。

 

(一)既有困境的加剧:排除权力的削弱与排除阻力的增强

 

我国目前虽然已经确立了非法证据排除规则,但是具体司法实践效果却不甚理想。实证研究显示,我国非法证据排除在启动门槛、启动方式、证明标准等方面均存在一定问题,真正实现非法证据排除的案件仅有 1.9%,而且没有案件因非法证据排除而被判无罪。相比较而言,美国全年非法证据排除的案件数量是中国的 2—3 倍,且非法证据排除确实可以导致无罪判决,例如,美国每年约有 3 万名毒品犯罪嫌疑人因非法证据排除而脱罪。究其原因,当前我国非法证据排除规则的行使存在着较大困境。一方面,法官对于非法证据排除的权力较为有限,其能够直接排除的只有非法言词证据。而对于物证、书证等实物证据, 若想要实现排除,必须是该证据的取证不符合法定程序、可能严重影响司法公正,并且不能予以补正或者作出合理解释。在这样严苛的标准下,真正能被排除的证据数量并不是很多,反映到实践中,便呈现出了弱排除模式,裁量排除也逐渐演化为不排除。另一方面,我国流水作业式的诉讼结构使得法院在进行证据排除时,往往会受制于源自侦查机关的外部阻力。在当前的诉讼结构中,公安机关、检察机关和法院往往更加注重相互配合,有意无意地忽视相互的监督。特别是对于非法证据排除而言,一旦启动,不仅可能导致侦查机关之前的努力付诸东流,还可能影响有关部门的业绩,甚至可能导致相关人员被追责。故而,很多法官不具备足够的勇气与侦查机关抗衡。正如有论者对上述两项困境所总结的那样,“只有从个体法官的有限权力与局促地位入手,我们才能解释这样一种奇怪的现象:一是中央司法机关充满期待地通过司法解释、内部意见一再重申非法证据排除规则的意义;二是地方各级司法机关对辩护方提出的排除请求‘不启动程序’‘不排除证据’的消极回应。”若针对非法人工智能证据进行排除,既有的法官权力不足的问题以及诉讼结构所导致的外部阻力将进一步加剧。

 

1. 法官权力进一步削弱

 

从法官排除权力的角度看,非法人工智能证据排除所面临的困境将会较其他类型证据进一步加剧,法官很难在非法人工智能证据排除上获得更大的权力。这主要是基于以下三个方面原因。

 

首先,从立法上看,当前我国对于非法言词证据和非法实物证据本就采取了不同的立场。这主要是考虑到物证、书证本身具有的客观性和不可替代性,同时也是为了更好地打击犯罪。值得注意的是,《刑事诉讼法》并没有将视听资料和电子证据纳入可排除实物证据的范畴,换言之,在非法证据排除问题上,视听资料和电子证据所受到的限制要更小,这同样可能是考虑到此类证据对于犯罪控制的价值,进而在立法上留下了空白。而其他规则也大多忽视了视听资料和电子证据的合法性审查,例如,《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》主要是从电子证据完整性、原始存储介质封存、笔录制作、见证人、保管移送等方面规定电子证据真实性的审查方法,而少部分涉及电子证据取证中权利保障的内容也只是概括性条款,可操作性不强。人工智能证据某种意义上可以说是电子证据进一步科学化的形态,有论者将其称为第三代电子证据,而把当前主要使用的网络证据称为第二代电子证据。故而,按照目前的立法倾向,人工智能证据可能在合法性问题上受到的限制将更小,这也就意味着,法官的排除权力也将变得更小。

 

其次,实践证明,人工智能在很多领域的准确率已经超过了人类,最具有代表性的例子就是AlphaGOZero 在围棋领域的统治级别表现,其先后与数十位顶尖棋手对局,最终取得了 60 胜 0 败的战绩。除此之外,在多个领域,人工智能也同样取得了超越人类的成绩。例如,在医疗诊断领域,人工智能在经过一段时间学习后,对疾病的诊断率已经可以达到 87.0%,而人类只有 86.4%。在识别无病患问题上,人工智能的准确率为 92.5% ,比专业的医护人员要高两个百分点。具体到肿瘤、心脏病、抑郁症等问题的诊断上,人工智能同样有更好地发挥。在微表情测谎问题上,马里兰大学和达特茅斯学院的研究人员开发出的 DARE 人工智能系统在测谎准确率上已经超过了人类,其准确识别微表情的比例达到了 92%,而人类只有 81% 。在天气预测领域,人工智能对于冰雹、雷暴等灾害性天气的预测同样已经超越了人类预报员。这也就意味着,一些人工智能证据同样可能具有更强的可靠性。我国司法理念中长期存在的“有罪必究”的观念,促使当前的证据规则和证据审查之中往往将证据的合法性与真实性相关联,甚至如果仅仅是取证手段违法而真实性未受影响的证据一般也不会被排除。在此背景之下,为了更好地追求案件的真相,法官对此类证据排除的权力可能会受到进一步限制。

 

最后,当前建设智慧司法、司法信息化等活动可能将进一步削减法官排除非法人工智能证据的权力。如前文所述,推动人工智能技术进步是国家未来发展的重要方向。在该指导思想之下,智慧法院的建设也成为法院发展的重要方向。《人民法院第六个五年改革纲要(2024—2028 年)》专门将“完善数字法院建设体系”作为主要任务,由此推动大量人工智能应用进入各个法庭,例如,北京市高级人民法院“睿法官”系统、贵州省贵阳市“贵阳政法大数据办案系统”、上海市高级人民法院“上海刑事案件智能辅助办案系统”等。从这个意义上讲,允许人工智能证据进入法庭并在事实认定中发挥作用,也符合当前智慧法院建设的要求。此外,从舆论宣传的角度上讲,此类具有科技含量的证据进入法庭也可以获得较为积极的宣传。例如,借助 VR 技术制作的示意证据的使用便广受各路媒体好评,该类证据被认为可以“提高工作效率、注重出庭效能、立足出庭效果、强化证据效用”。VR 技术虽然不属于大数据和人工智能技术,但这一现象却可以反映当前智慧司法建设中对高科技证据的追捧。由此可以推断,人工智能证据进入法庭同样也符合舆论宣传的方向,这也就进一步限制了法官排除非法人工智能证据的空间。

 

2. 外部阻力进一步增强

 

从外部阻力的角度上讲,人工智能证据的排除将进一步遭到侦查机关的反对。从实践中看,当前侦查机关对大数据侦查的运用正在不断增多。相较于传统侦查方式,大数据侦查主要有以下三方面优势。(1)大数据侦查可以获取更多信息,并基于相关信息作出更加合理的判断,从而回应新常态下犯罪发展出的系列性、跨区域性、地域性趋势,弥补过去侦查机关由于对信息占有量不足、准确性低,所导致的破案率低、追赃少的不足,甚至很多陈年旧案也因为大数据侦查的出现而得到了破解。例如,甘肃白银案长达二十几年未告破,公安机关通过大数据和人工智能技术对 DNA 和指纹等相关信息进行了比对,最终实现破解。(2)大数据侦查可以通过相关分析得出人类原来通过因果分析无法得到的判断,进而为最终的案件侦破提供更多的视角。例如,某地侦查机关借助大数据分析,将车辆、房产等信息与骗取低保补贴案件相联系,最终实现了破案。(3)大数据侦查可以将事后侦查变为事前预防。依托大数据分析的预测功能,侦查机关可以对犯罪的发生进行提前研判,进而合理分配资源,更好地打击和预防犯罪。该方式改变了传统“案件发生—侦查介入—证据收集”的侦查模式,其最典型的应用便是犯罪热点图的绘制,例如,北京市怀柔区警方通过运用大数据、云计算和科学分析模型,整合历年案件信息并建立了犯罪数据分析和趋势预测系统,能够预测犯罪趋势,指导警力投入,取得了十分理想的效果。

 

然而,非法人工智能证据排除可能会对大数据侦查造成巨大打击。如前文所述,大数据侦查及人工智能证据的获取模糊了立案前与立案后的行为,这也就意味着侦查机关可以实时收集数据和使用算法。这种侦查模式就导致,当一个环节受到限制,整个侦查活动都将受到牵连。相对而言,对于算法的否定性评价可能影响没有特别明显,因为某一个算法无法使用,不会对其他算法的使用造成太大影响。但是,对于数据的否定性评价则可能牵连甚广。申而言之,当法官基于权利保障对人工智能证据进行排除时,若否定了某个数据,则意味着基于该数据形成的人工智能证据的合法性均存在疑问。而当前数据合作和数据流转十分迅速,一旦否定一个数据,很多参与数据合作和数据共享的数据库都可能被就此否定,大量的大数据侦查以及由此形成的人工智能证据可能均将面临被认定为违法的风险。这种风险是传统证据排除并不需要面对的。以电子证据为例,若侦查机关在立案前对刑事被追诉人的隐私信息进行了搜查,即使法院据此排除了相关的电子邮件、微信聊天记录等证据,也并不会对下一次搜查造成影响。但如果因某个数据排除了人工智能证据,侦查机关就需要检查相关数据库中是否有相同或类似数据,这不仅增加了侦查活动的经济成本和时间成本,同时可能降低侦查和证据的准确性。故而,为了保证更加先进的侦查方法能够更快更好地运转,更多的证据能够出现在法庭之上,侦查机关势必会更加反对排除人工智能证据。

 

(二)新困境的出现:人工智能不可解释性引发的审查难题

 

就传统证据的合法性审查而言,法官在进行判断时基本并没有太大认知性的障碍。例如,对于“刑讯逼供或者冻、饿、晒、烤、疲劳审讯等非法方法”,即使不同法官在具体内容的理解上有所差异,也很难出现不知道何为“刑讯逼供”的情形。但人工智能证据的非法证据审查则有所不同,很多时候,人类很难观察和理解人工智能建立的规则和结论产生的原因,这种不可解释性也就导致了法官对于人工智能证据的认知困境。

 

人工智能的不可解释性主要来源于两个方面原因。一是人工智能的黑箱性。算法的本质是数据的输入与输出,但其中的神经元网络中存在着不为人所直观捕捉到的隐层,即“黑箱”。这一隐层实际上包含着大量的线性变换和大规模的神经元连接,因此很难准确窥测其运行状况。由于算法黑箱的存在,人类很难发现机器作出决策的原因,即人类无法判断一些算法作出的决策是基于合法理由还是基于非法理由,也就谈不上非法人工智能证据的排除。

 

二是人工智能的复杂性。人工智能的不可解释性不仅意味着算法的不可观察,还意味着算法的不可理解。换言之,人类可能无法理解算法结论产生的原因。这主要是由于机器学习的运算不受固定参数所控制,当其动态运行时,人类便无法控制其组合和比较数据,也就无法对算法进行解释。故而,即使是算法设计者,有时也无法理解算法得出结论的原因。特别是对于一些自主型算法,其主要通过考察数据主体的个人情况—如工作绩效、经济状态、健康状况、个人偏好或兴趣、可靠性或行为、居住地点或位置移动等—预测数据主体的行为模式,最终作出决定。对于此类算法,算法设计者并不负责设计考虑因素、权重等,而是任由数据画像技术自行发现影响因素及权重,算法设计者也便更不可能了解算法具体的运行方式。例如,目前人工智能技术已经可以通过照片识别人的性取向,但算法的设计者并不能解释为何人工智能可以比人类更为准确地进行识别,其只能对人工智能所建立的规则进行猜测。除此之外,当前算法分工日益复杂,算法的设计、开发和应用可能分散于不同的研发主体,这便意味着人类需要对不同主体研发后的算法进行分析,这也进一步增加了解释工作的难度。

 

法官虽然是法律适用的专家,但是在人工智能领域与普通人并无差异,其很难理解人工智能的运行过程和结论产生的原因。换言之,面对人工智能证据,当法官试图进行非法证据排除时,其很难了解相关算法运行的过程以及数据使用的方法,即使人工智能证据的出示方向其提交了相关算法和数据,法官也很难依靠其所拥有的知识对证据合法性进行审查。

 

三、非法人工智能证据排除制度体系的构建

 

非法人工智能证据排除制度体系的构建需要基于相关理论基础制定完善的排除规则,并建立相配套的审查机制和方法,以解决排除过程中可能出现的各项问题。

 

(一)非法人工智能证据排除规则的构建

 

非法证据排除的前提是有法可依,即应给予法官对非法证据进行排除的依据,对于非法人工智能证据的排除同样如此。基于权利保障理论,在设计相关规则时,应将权利保障作为非法人工智能证据排除的逻辑起点。以此为基础并结合我国相关法律规定,非法人工智能证据排除规则的设计应包括以下几方面内容。

 

首先,应明确人工智能证据的地位并将其纳入非法证据排除的范围。我国《刑事诉讼法》第50 条规定了证据的八个种类,该规则不仅是证据审查的第一道门槛,也是其他证据审查规则的展开基点。故而,应首先将人工智能证据纳入法定证据种类之中,即确定人工智能证据为独立的证据种类。在此基础上,再将人工智能证据纳入《刑事诉讼法》第 56 条所规定的可以进行非法证据排除的证据种类。

 

其次,应明确非法人工智能证据的范围。(1)从证据类型上看,非法人工智能证据应包括使用侵犯平等权算法和使用侵犯隐私权数据的证据。(2)从侵权对象上看,传统非法证据主要侵犯的是刑事被追诉人的权利,而非法人工智能证据的侵权对象可能不仅限于刑事被追诉人,还包括其他公民。(3)从时间节点上看,一般而言,刑事被追诉人在立案前后接受询问或讯问的身份不同,相应的权利、程序保障措施以及制裁后果都是不同的,这也直接影响了非法证据排除的适用。例如,当前理论界对于非法电子证据判断的标准一般是在立案前采取强制性侦查措施获取的电子证据属于非法证据。但人工智能证据的获取模糊了立案前和立案后的行为,因此,对于非法人工智能证据的判断再设置时间节点也就显得没有太大意义。

 

最后,应明确非法人工智能证据的启动方式和证明责任。当前,我国非法证据排除的启动主要有两种方式,一种是依职权启动,即审判机关主动对证据合法性进行审查;一种是依申请启动,即当事人及其辩护人、诉讼代理人申请对非法证据进行排除。从实践效果看,依申请启动是主要的非法证据排除启动方式,实证研究显示,在 486 起涉及非法证据排除的案件中,依申请启动的案件比例高达 98.4% 。在证明责任问题上,依申请启动的非法证据排除,申请者具有初步的证明责任,其需要提供相关线索和信息,使法官产生证据不具有合法性的合理怀疑。这种启动方式和证明责任均不适合于人工智能证据。一方面,如前文所述,基于当前的各种实践,大量人工智能证据都涉嫌侵犯隐私权和平等权,换言之,只要人工智能证据在法庭上出示,就具有侵犯公民基本权利的可能,也就没有再让辩方提出相关线索和信息的必要。另一方面,对于传统证据的排除,刑事被追诉人及其辩护人一般可以掌握和了解一定证据非法性的信息。例如,对于被殴打、虐待等情况,作为亲历人的刑事被追诉人大多可以提供一定线索。但人工智能证据则有所不同,大多数时候,辩方根本无法获取人工智能证据所使用的算法和数据库,即使获得了相关信息,也很难理解算法和相关数据的含义与使用方法。这种证据偏在性导致辩方几乎没有能力提供任何非法人工智能证据的线索。故而,应该免去辩方提供相关线索和信息的步骤,直接由公诉方主动提供能证明人工智能证据具有合法性的证据。

 

(二)非法人工智能证据排除规则运行保障机制的构建

 

1. 第一重困境的化解:建立“绝对排除 + 裁量排除”的排除模式

 

非法人工智能证据排除的第一重困境,在于法官证据排除权力不足,以及源自侦查机关的外部阻力。对此,一方面,应增强法官对非法人工智能证据的排除权力。事实上,尽快确立非法人工智能证据排除规则是提升法官排除权力的重要方式,除此之外,通过建立适当的证据排除方法以拓宽法官的自由裁量空间也可以有效提升法官的排除权力;另一方面,应该注意利益权衡,不过度打击侦查机关对于人工智能证据的应用。对此,一是要绝对排除侵犯权利且无益于准确事实认定的非法人工智能证据;二是要裁量排除存在侵权可能但有利于准确事实认定的非法人工智能证据,即赋予法官一定自由裁量权,在提升其排除权力的同时,也给予一部分大数据侦查和人工智能证据的应用空间。

 

具体而言,对于侵犯公民权利且可靠性不足的、包含算法歧视的人工智能证据,应采取绝对排除。算法歧视不同于数据的搜集和使用,其并不是人工智能证据可靠性的必要条件。甚至算法的歧视和偏见将直接影响证据的可靠性。例如,谷歌图片软件将黑人识别为大猩猩的事件,不仅构成了对黑人的种族歧视,也造成了错误的结果。换言之,就人工智能证据而言,数据越多准确率越高,因此,在数据使用和证据排除之间有一定矛盾。但对于算法歧视而言,歧视程度的提升不仅不会增强算法的可靠性,还很可能降低算法的可靠性。因此,对存在算法歧视的人工智能证据采用绝对排除的方式不仅契合于提升事实认定准确性的需求,而且如前文所述,对算法的否定性评价不会严重影响大数据侦查以及其他人工智能证据的应用,故而,也不会引发侦查机关的过度反弹。

 

相较于算法歧视问题,因数据使用问题导致的证据排除可能会面临更大困境。如前文所述,若  对因数据使用侵犯隐私权的人工智能证据予以排除,可能会引发侦查机关的强烈反对。此外,考虑  到侦查行为与权利保障之间的张力,以及当前我国立法导向上对于非法电子证据排除持保留态度,绝对排除使用隐私数据生成的非法人工智能证据很可能不具有可行性。但鉴于人工智能证据的高度  风险性,对其使用进行适当限制也有一定必要。对此问题,一些学者在限制大数据侦查使用问题上 引入比例原则(必要性原则)的做法值得借鉴。《个人信息保护法》第 6 条也规定:“处理个人信息应当具有明确、合理的目的,并应当与处理目的直接相关,采取对个人权益影响最小的方式。”事实上,这种比例原则同样适用于非法证据排除,即裁量排除。但基于前文分析,我国法官目前裁  量排除的空间并不大,并且现有判断依据无法直接适用非法人工智能证据的裁量排除。若想要真正  有效排除非法人工智能证据,必须减少对法官自由裁量的限制,给予更多自由裁量的空间。具体而  言,应拓宽法官在进行排除时的考量因素,并允许法官根据不同案件选取不同的考量因素。在考量  因素的选择上,较为具有参考价值的是德国的利益权衡理论,该理论要求法官在证据审查时综合考量国家追诉利益与个体利益,最终确定是否在取证程序违法时适用证据使用禁止。以此为基础,德国联邦最高法院通过一系列判例确立了更多的考量因素,即利益权衡理论之多因素论,实践证明,该方式可以赋予法官更大的裁量权力。一般而言,法官的考量因素包括所追诉犯罪的种类及严重程度、可能的刑罚种类及严重程度、非法获取之证据对于定罪量刑的权重、证据是否可以通过正常合法途径获得、侵害基本权利的种类及程度、个体的保护利益与保护需求以及程序违法的权重。结合人工智能证据的特点以及权利保障理论的要求,法官在裁量排除非法人工智能证据时,可以考量的因素应包括四个方面。(1)权利侵犯程度。权利侵犯程度越严重的人工智能证据,越应该予以排除。由于目前需要裁量排除的人工智能证据主要侵犯的是隐私权,法官在裁量时基本不需要考量侵犯的权利类型。(2)证据是否可以通过合法方法获得或是否可以采取更轻微侵犯权利的方法获得。如果存在更好的证据生成方式,那么通过使用隐私数据获取的人工智能证据则应考虑排除。(3)被追诉犯罪以及可能刑罚的种类和严重程度。“鉴于大数据侦查对犯罪嫌疑人和大量无辜公民的个人信息甚至隐私信息施加了全面监控与比对,该项措施只能限于预防或者侦查严重犯罪时方可使用。”基于此,对于较为严重的犯罪或可能遭受严重刑罚的情形,应给予人工智能证据更大的使用空间。(4)证据的证明力以及对犯罪认定的重要程度。对于待证要件事实具有重要证明作用的人工智能证据,排除时应采用更为宽松的审查标准。除上述考量因素外,由于人工智能技术的高速发展,其侵权的方式和程度可能也会产生不同的变化。因此,应允许法官根据技术和数据的相关情况建构新的考量因素,这同样也是提升法官自由裁量权的重要方式。相对来说,对数据使用侵权的非法人工智能证据采取裁量排除的方式,既可以给予法官更多裁量空间和权力,控制侦查机关过度搜集和使用隐私数据,也不会从根本上否定大数据侦查的行为及其成果,无论是对于法官还是对于侦查机关,这种方式的可接受性会更强。

 

2. 第二重困境的化解:发挥专家诉讼参与人的作用

 

专家诉讼参与人包括鉴定人、专家辅助人等,其主要作用是解决法庭中的专业性问题,弥补法官、被告人等角色专业知识不足的困境。人工智能证据虽然是机器所得出的结论,但是由于其技术复杂性以及结论不可解释性,很多时候也需要专家出庭对相关问题进行解释。具体而言,这些专家既包括参与算法设计、应用等相关活动的专家,如算法设计师、数据标注师等,也包括对机器学习等相关领域具有专业知识的人。这些专家在非法人工智能证据排除的过程中可以发挥以下两方面的作用。

 

一方面,专家可以弥补法官大数据、人工智能等知识方面的不足,辅助法官对人工智能证据的合法性进行审查。具体来说,专家可以通过侦测工具对算法歧视问题进行检验。当前已经有不少学者投入到对算法歧视的侦测研究之中,具体方式是建立相关的度量标准并利用程序进行侦测。例如,特拉莫尔(Tramer)等人提出了公平试验(Fair Test)的方法,该方法通过杂糅不同度量标准的方法论和工具,可以侦测到机器学习算法与可能被歧视群体之间的关联。除此之外,专家还可以对人工智能证据所依赖的数据进行检测,并分析人工智能证据的形成是否利用了隐私数据。

 

另一方面,专家可以对人工智能证据的形成过程、原理、依据及相关结论进行解释。尽管很多情况下,人工智能算法及其结论无法为人类所理解,但是,随着可解释人工智能(XAI)领域研究的日益深入,这种情况正在逐渐被改善。可解释人工智能是一个旨在让人类更容易理解人工智能系统结果的研究领域。自机器学习特别是深度学习算法出现后,人类对于人工智能的研究主要集中于人工智能的可预测性,而并不重视可解释性。但随着人工智能在司法、医疗、交通等领域应用的日益深入,人工智能决策的可解释性地位日益提升,这主要是由于在这些领域,人类无法放心地使用无法理解的结论。值得一提的是,传统的人工智能可解释性研究主要是从统计可解释性的角度出发,很多情况下,人类并不能真正了解人工智能。而当前一些研究正在转向“人类何以真正理解人工智能”,该领域主要是将人工智能可解释性与因果关系连接在一起,从根本上解决人类理解人工智能的困境。以上研究的进展为人类专家解释人工智能证据提供了重要基础。此外,从技术伦理的角度上看,可解释性正在逐渐成为人工智能技术未来发展的一部分。例如,我国《新一代人工智能治理原则—发展负责任的人工智能》指出:“人工智能系统应不断提升透明性、可解释性、可靠性、可控性,逐步实现可审核、可监督、可追溯、可信赖。”美国《国家人工智能研究与发展战略计划》 (The National Artificial Intelligence Research and Development Strategic Plan)将提高可解释性和透明度作为“确保人工智能系统安全可靠”战略的重要内容。欧盟《可信赖人工智能伦理准则》(Ethics Guidelines for Trustworthy AI)将可解释性作为一项重要的伦理准则。因此,由于人工智能技术发展以及伦理的要求,未来出现在法庭之上的人工智能证据将更多是人类专家可以解释的证据。有关专家可以通过可视化等方法向法官提供其可以理解的机器结论的生成过程,从而帮助法官更好地认识人工智能证据。

 

需要特别指出的是,对于专家都无法解释的人工智能证据,不宜作为合法证据在法庭之上加以使用。一方面,其剥夺了刑事被追诉人进行质证的诉讼权利,当没有人可以解释人工智能证据的运行过程和结论时,辩方显然无法就该证据提出异议;另一方面,其在某种意义上剥夺了法官认定事实的主导地位,使法官对证据的审查功能虚置,这将导致可能侵犯刑事被追诉人乃至全体公民权利的证据直接用于待证事实的认定,不仅有悖于证据法“求善”的目标,甚至可能会引发机器统治法庭的危机。

 

四、结语

 

随着人工智能技术的发展以及大数据侦查应用的日益深入,人工智能证据必然将越来越多地出现在法庭之上。然而,这类证据在提升事实认定准确性的同时,也对刑事被追诉人乃至全体公民的权利保护带来了前所未有的挑战。对此,通过非法证据排除的方法,保障公民权利,规制侦查行为,是一种行之有效的方式。当然,非法证据排除毕竟是一种后置方法,即侵权行为已经发生,证据已经生成后的补救措施。换言之,当非法人工智能证据出现在法庭之上时,刑事被追诉人乃至公民的权利便已经处于不圆满之状态。因此,对于大数据侦查或人工智能证据取证的限制不应仅仅依靠非法证据排除这种较为滞后且被动的方式。建立事前的规则和程序,例如,设置大数据侦查的启动条件,明确数据收集、应用的方法和相关的审查机制等,也同样十分重要。

 

 

 

来源:《证据科学》2026年第2期,第172-187页

作者:马国洋,北京交通大学法学院副教授