尚权研究SHANGQUAN RESEARCH

尚权研究丨王勃:Seedance 2.0模型对刑事诉讼的冲击及刑辩律师的应对

作者:尚权律所 时间:2026-02-11

 

 

王勃

北京市尚权律师事务所合伙人

尚权有组织犯罪研究与辩护部主任

 

2026年2月7日,字节跳动公布了Seedance 2.0视频AI生成模型,其画面逼真度高,难以辨别真伪,迅速引发广泛关注。以往鉴别视频是否由AI生成,主要靠人眼识别与模态分析。但Seedance 2.0模型的出现,对以往的鉴别模式带来了巨大的冲击,刑辩律师需要及时把握这一技术变革浪潮,调整对视频类证据的质证方式,提高质证能力。

 

本文不可避免地会提到涉及AI模型的专业术语,有些对法律人可能比较晦涩难懂。但文章要论证的内容并不复杂:第一,Seedance 2.0模型让刑事诉讼中的任何视频类证据都不再可信;第二,Seedance 2.0模型会让刑事诉讼的鉴真过程更加复杂,诉讼成本急剧上升;第三,刑辩律师要更加注重对视频证据来源与原始载体的审查。

 

一、AI视频是否会被用作指控犯罪的证据?

 

刑辩律师看到Seedance 2.0生成的AI视频,可能会产生令人细思极恐的联想:一份AI生成的,记录犯罪全过程且不含声音的监控视频,有没有可能逃过了鉴定人员的法眼,被用作指控一个人犯罪的核心证据?如果技术上存在以假乱真的可能,是不是刑事诉讼中的任何视频类证据都不再如它表面一样可信?

 

这个问题在过去不成立,是因为人眼即可“鉴定AI”。以Sora2模型为例,它生成的AI视频画面模糊、动作及转场不合理、不连贯,其违和感显著到不需要任何专业技术即可分辨。过去的AI绘画也是一样,通过Diffusion模型生成的AI图片的同质感完全可以通过肉眼鉴别。

 

但Seedance 2.0的高技术力阻断了“人眼鉴定AI”的途径,甚至可能欺骗目前的专业检测手段。在传统的刑事诉讼中,即使辩方提出对关键视频来源的质疑,裁判者往往也不会在意,因为裁判者自信AI视频根本骗不过人眼。可是,如果Seedance 2.0时代的高欺骗性AI被滥用,仅靠人眼已经不能分辨,以后是不是所有的视频类证据都不如表面一样可信?是否都要经过更为专业的鉴定以验明正身?

 

二、最新AI鉴定标准在Seedance 2.0时代可能落后过时

 

可能会有人认为,人眼察觉不出“违和感”,交给专业的鉴定机构不就可以分辨吗?问题没有那么简单,最新的AI鉴定标准在Seedance 2.0时代可能过时,因为“违和感”一直是司法鉴定中鉴定视频是否为AI视频的主要依据。从2025年6月1日起,我国正式实施了一系列司法鉴定标准,如《GB/T 45430-202法庭科学伪造人像深度伪造检验》标准、《GB/T 45433-2025法庭科学伪造人像可解释性检验特征集》支撑性标准。这些标准都是近年来为应对AI浪潮形成的鉴定方案。具体而言,国标鉴定标准给出的鉴定方法分为专家检验和AI检测两种方式,而这两种模式在仅仅8个月之后的Seedance 2.0时代,都可能出现误判。

 

1.专家检验。这在某种程度上可以理解为“人眼鉴AI”。以人脸为例,它重点观察视频中生物特征与物理规律的一致性。比如手部细节、五官对称性、微表情、眼神光、眨眼频率、口型与语音同步性。同时观察环境是否具有物理一致性,比如光影、透视关系、运动轨迹是否符合物理规律等等。在Seedance 2.0之前,这些鉴定并不困难,普通人也能发现AI的违和感。但科技发展日新月异,短短几年,AI模型的迅速迭代已经把视频的违和感消除殆尽,几乎把“人眼鉴AI”这条道路堵死了。

 

2.AI检验。AI有生成式模型,就有对抗式模型。经过训练的对抗式AI模型本身就可以用来检测一段内容是否是由AI生成,俗称“AI查AI”。近些年生成式语言AI被广泛使用,一些学生甚至用AI生成论文或作业,老师就用对抗式AI去鉴别文字内容是否为其它AI生成。同样的,对抗式模型也可以用来检测图片或者视频是否为AI生成,如AI Foundation的Reality Defender模型、Adobe的Content Credentials模型。具体方式有以下几种:

 

(1)元数据检验。元数据包含的内容很多,比如视频文件的EXIF数据或者编码信息或者水印。国内大部分生成式AI都有明显水印注明“视频由AI生成”,理论上只看水印就可以知晓视频的性质。但我们能依然看到很多没有打水印的AI视频。这些视频如果是由“正规正经”的AI公司模型生成,往往打了“暗水印”。肉眼无法分辨“暗水印”,但AI可以识别。以2025年1月Google DeepMind研究团队提出的SynthID-Text水印生成方案为例,它可以在不影响画面生成内容的同时,形成无法用肉眼识别的水印,以此为视频内容打上AI标识,方便AI工具检测识别。

 

 

“暗水印”本质上是巨头为规避风险的行业自律行为,类似于Seedance 2.0已经禁止用户利用真人进行模型训练。但行业自律不是强制性法律规定,它不是AI公司的必选项,“暗水印”技术也不是所有生成式AI模型的必需项。如果有人心怀不轨,完全有可能绕开“暗水印”这样一个能直接被AI检测的方式去生成视频。毕竟Seedance 2.0虽然目前闭源,但这种成熟的技术不可能永远被垄断,早晚会流入市场。这就导致无法通过“暗水印”的方式鉴定AI视频。

 

(2)模态分析。模态分析可以理解为AI对“违和感”的数据分析方式。比如Sora2模型经常会出现画面某些地方突然模糊的情况,这就是频域模态不真实的特征。真实图像的频率分布自然,而较为落后AI生成的图像在特定频带可能出现异常能量分布。其他的模态比如像素模态,用来分析单帧图像纹理、边缘与噪声,可以用来检测皮肤毛发是否自然;时序模态,可分析帧与帧之间的连贯性;物理几何模态,通过算法去检查光源方向与透视关系等。

 

 

可以看到,模态分析本质上是具体问题具体分析,它没法形成一个“放之四海而皆准”的通用判断标准。不能像电子数据鉴定一样,通过检验哈希值去判断电子数据是否受到篡改。在AI视频方面,目前没有能够一击致命的单一技术鉴定方案。

 

更“不幸”的是,Seedance 2.0在某种程度上把以上几个落后AI才会有的问题都解决了。尤其是频域模态方面,Seedance 2.0的AI异常性体现得并不明显,在画面逻辑通顺方面也做得很好。换言之,国内技术的快速进步已经让2025年6月施行的国家鉴定标准,在一定程度上落后甚至过时了,毕竟现在连具体的AI对抗技术方案都没有形成。相信在本周,各大AI巨头都在努力生成新的对抗式AI,试图找到能快速识别Seedance 2.0视频AI特征的方案。

 

鉴定技术跟不上伪造技术,就可能存在以假乱真的风险。著名谍战电视剧《潜伏》中,天津站反派人物李涯和主角余则成围绕谢若林提供的录音带真伪的精彩对决,就是当前AI视频现状的映射。李涯坚信录音带没法作假,所以一口咬定其声音是真实的。但掌握录音基本原理的余则成伪造了一份假的录音带,以此对冲了谢若林提供的录音带的真实性。

 

 

有专业人士指出,在《潜伏》剧情发生的那个年代,对录音带是否为拼接确实没有很好的检测方法。但假如这段剧情发生在今天,可以很容易去辨别录音带的真伪,查明李涯的录音带是真的,余则成的录音带是拼接的。Seedance 2.0出世后的今天的鉴定技术,一如1945年对录音带真伪的鉴定技术,并不完善。这并不是说完全不能通过技术手段鉴定一个视频是否为AI视频,只是原有的低成本方案已经不适用,而可能的新鉴定方案投入过大,成本过高。如果是AI视频混合声音,还可以通过鉴别AI声音的方式去查明视频的来源。但假如像本文开头所举的例子,AI伪造的是不需要声音的监控录像,录像还通过压缩和添加视频噪音的方式去躲避AI特征检测,现有的技术可能还真不好辨明真伪。

 

根据以上逻辑,很容易得出下面的预测:AI伪造技术不断进步,无法人眼鉴别,辩方就会质疑视频是否为AI伪造。裁判者无法按照传统路径否定辩方主张,使得刑事诉讼产生了大量鉴真需求。但现有鉴定技术又跟不上AI伪造技术的飞速迭代,导致查明视频类证据真实性的诉讼成本急速上升。可以预测,Seedance 2.0的出现可能会让我国的刑事诉讼快速达到这种状态。本次《刑事诉讼法》及相关司法解释的修改可以考虑对此问题有所回应。

 

三、重视视频来源的审查或重新回归为刑辩律师质证的主要路径

 

在《潜伏》电视剧中,余则成安排廖三民杀掉了谢若林,伪造了谢若林贪财逃跑的证据,杜绝了通过谢若林这条线查明李涯录音带来源的可能。但余则成没有让廖三民杀了录音带中的重要人员徐宝凤,导致徐宝凤脱逃,最终还是让李涯查明了录音带的真伪。电视剧中的故事逻辑真实合理,放在刑事诉讼中依然适用:当现有手段无法对证据本身的真伪进行鉴定时,查明证据的来源、证据的原件或原始形成载体至关重要。

 

在传统的司法实践中,辩方可能并不在意证据是否为原件、原件存放于何处、提取过程是否严格、视频的原始拍摄载体是否移送等。对视频类证据而言,即使不是原件,只要视频没有明显的伪造删减痕迹,辩方和裁判者基本都默认视频内容是真实的。没有特别的线索或事由,仅以视频不为原件或原视频拍摄载体未移送,去质疑视频的真实性,在司法实践中并不具有说服力。

 

但Seedance 2.0的出现打破了现状:既然视频的鉴真目前没有特别好的方案,只能通过查询视频原始载体存放何处,在案视频的编码是否与原始载体一致等方式,去对视频形成方式鉴真。道理很简单:AI视频没有原始拍摄载体,无法通过AI伪造。而原始拍摄载体形成的视频证据会伴生一系列客观的痕迹,在实践中伪造难度较大。

 

总结起来,在Seedance 2.0刑辩律师对视频类证据的辩护路径需要进行调整:第一,质疑视频内容本身的真实性,要求对视频是否为深度伪造进行鉴定。第二,根据具体的鉴定意见,告知裁判者以目前的鉴定方法,无法分辨视频是否为深度伪造。第三,要求调取视频的原始拍摄载体,结合原始载体对视频内容的真实性进行实质性质证。

 

刑事审判与历史研究具有相似之处,都是利用证据或文物,结合经验与逻辑,对过去进行探寻与还原。区别在于,历史研究不强求当下形成结果,但刑事法官需在一定时限内作出裁判。当今AI的快速发展,可能会形成大量能以假乱真的“文物”,不可避免地冲击刑事诉讼制度,改变刑事辩护方式。面对这些“新出土的文物”,任何法律人都不能盲信表面。要先问一问自己,这个表面真实的“文物”在这里出土,是否合理?毕竟现实永远是最细腻的存在。