尚权推荐SHANGQUAN RECOMMENDATION

尚权推荐丨劳佳琦:量刑的法外因素与量刑规范化改革

作者:尚权律所 时间:2022-04-19

摘要

 

量刑规范化改革试图通过规范量刑方法和步骤、统一量刑标准和尺度来实现同案同判。然而,量刑决策的本质、法官认知的机制、司法环境的局限共同决定了在量刑活动中至多只能消减而无法消除法外因素对量刑的显著影响,而且这种影响可能会越来越隐秘。以犯罪人性别这一典型的法外因素作为观察指标的实证研究发现,在控制了犯罪严重性、犯罪人的前科劣迹以及法官主体性因素的影响后,犯罪人性别对量刑结果存在不系统的显著影响,这种影响存在与否及其表现形式因罪而异:法官对故意杀人罪量刑时具有“重男轻女”的倾向,对诈骗罪和贩卖毒品罪量刑时却表现出了“重女轻男”的相反倾向,只有抢劫罪的量刑结果实现了“男女平等”,并不普遍存在传统观点所主张的“重男轻女”的统一趋势。在评估量刑规范化改革成效时,既要关注量刑指导意见所列出的法定因素是否得到了规范、统一的适用,还要关注未被量刑指导意见提及的法外因素在量刑活动中是否得到了有效控制与消减。即使发现法定因素的适用没有偏离量刑指导意见,也不能认为改革目标已经达成,还需要进一步借助大数据与算法等先进技术手段对法外因素带来的量刑偏差进行识别与控制。

 

关键词:量刑规范化 法外因素 犯罪人性别 实证研究

一、一个问题与观察指标

 

“刑罚作为国家对犯罪行为的否定评价与对犯罪人的谴责的一种最严厉的形式”,必须审慎地进行裁量。量刑公正与否,关系到刑罚目的的有效实现,也影响到司法公信力和人民群众对于刑事审判工作满意度的提升。为了进一步规范刑罚裁量权,促进量刑公正,量刑规范化改革在我国刑事司法领域轰轰烈烈拉开帷幕。十余年来,我国的量刑指导意见历经多次修订,已经成为影响量刑最重要的规范性文件之一。为了实现同案同判的法治理想,历年的量刑指导意见均着力于以下三点:一是明确与限定法官量刑时应该考量的因素;二是改进与规范这些因素的考量顺序和使用方法;三是统一和细化这些因素对于量刑的影响方向与幅度。量刑规范化改革期待通过上述进路,保证量刑指导意见所明确提及和列举的所有因素都进入法官量刑的考量范畴,而且保证这些规范性文件所明示的法定因素的适用更为规范和统一。与此同时,在重申“以事实为根据,以法律为准绳”的量刑指导原则的前提下,量刑指导意见以明示的方式列出法官在量刑过程中应当考虑的法定因素并对其适用进行规范和统一,这一举措也表明那些没有被意见提及的因素都是无关因素,不影响法官的量刑决策。随着改革的全面推行,保证那些未被规范性文件提及的法外因素被排除出法官量刑的考虑范畴,不再对法官的量刑决策产生显著影响,亦是量刑规范化的应有之义。

 

那么,随着量刑规范化改革的纵深推进,那些未被量刑指导意见认可的法外因素是否还对量刑结果产生显著影响?本文选取犯罪人性别这一法外因素作为观察指标,运用实证研究的方法,通过检验量刑规范化改革全面施行之后我国量刑决策是否受到犯罪人性别这一法外因素的影响,探寻这一问题的答案。之所以选择犯罪人性别,原因有三:其一,犯罪人性别是毫无争议的法外因素。国外学界和实务界普遍认为,基于犯罪人性别产生的量刑差异是一种量刑歧视。在我国,除了《刑法》上明确规定审判时怀孕的妇女不适用死刑之外,《刑法》和量刑指导意见均未允许犯罪人性别影响量刑决策。犯罪人性别作为犯罪人自身特征之一,既不是规范层面的法定量刑情节,也不是酌定量刑情节,本不应对法官量刑产生影响。其二,犯罪人性别是必然存在的法外因素。性别作为犯罪人与生俱来的身份特征,是每一个刑事裁判必有的信息。犯罪人性别这一因素在所有刑事案件中的稳定存在,使得每一位法官在量刑之前就一定能了解、掌握这一信息,因而具有影响所有法官量刑决策的潜在可能性。其三,犯罪人性别是便于观察的法外因素。不同于犯罪人年龄、受教育程度、职业类型等法外因素自身内部的分类繁多,犯罪人性别只分男女。选择犯罪人性别作为观察指标,便于进行研究设计和后期的统计学处理,防止由于观察指标自身的复杂性导致研究结果的含混不清。

 

围绕着待解决的问题,本文主要分为三大部分。首先是研究方法的交代,本部分将详细阐明实证研究的设计思路和具体的操作方法;其次是研究结果的呈现,本部分先对实证研究所得结果进行初步的描述性分析,而后进一步对研究结果展开回归分析;最后是总结与思考,本部分将在总结和分析实证研究结果的基础上,尝试从更为一般的视角来探讨量刑决策的本质与量刑规范化改革的成效评估问题。

 

二、方法进路与研究设计

 

(一)既有的方法进路

 

根据德国阿尔布莱希特教授的概括,量刑实证研究一般可以分为两大类:一类是宏观层面的观察,这类研究尝试从社会整体惩罚情况的变化入手,从制裁结构的规模与运作流变来解释量刑差异的产生;另一类是微观层面的研究,这类研究关注法庭以及法官层面出现的量刑差异,试图确定法官判决行为中的决定因子。关于第二类关注法庭及法官层面量刑差异的研究,目前国内学者主要选择两种不同的实证研究方法来进行探究。

 

一种研究方法是对已经上网的刑事判决书展开内容分析。一般来说,采用这一方法的研究者往往从中国裁判文书网等网站上根据不同标准选取并下载大量刑事判决书为样本,对于刑事判决书提供的信息进行归类和提取,通过统计方法展开定量分析,来观察法官量刑决策的影响因子。在技术的支持下,这类研究可以立足于海量的刑事判决书展开统计分析,因此在广度上具有优势。然而,一个无法否认的事实是目前我国刑事判决书的上网存在着选择性。在这一前提之下,即使这类研究能够不断增加刑事判决书样本的数量,还是无法真正克服样本有偏这一根本缺陷。因此,这种研究方法所得结果的可推论性并不像人们所预期的那样高。而且,我国的刑事判决书内容过于简略与格式化,说理明显不足,所提供的信息维度较为有限和扁平。“对案件处理具有显著影响的因素未必都写进判决书”,很多可能影响法官量刑决策的因素,特别是法外因素的相关信息无法从刑事判决书中获取,也就无法在数据分析环节加入量刑数据模型并进行控制,最后导致所建数据模型与法官真实量刑场景相去甚远,很难具有较强的解释力。

 

另一种逐渐兴起的研究方法是对法官量刑展开实验研究。法官的量刑决策过程本质上是一个心理学和认知科学的现象,而实验则是心理学和认知科学的主要研究方法之一。因此,在研究法官行为方面,实验方法具有天然的应用价值。国外学者经常运用实验方法探寻某些法外因素是否会给法官的量刑决策带来影响。比如,康奈尔大学法学院的拉林斯基等人曾采用一系列实验方法,尝试检验法官个人情感与认知偏误等法外因素是否会影响法官对于案件的决策,结果发现情感因素确实会对法官决策产生关键影响,而锚定效应、框架效应、损失厌恶等这些行为经济学概念上的认知偏误亦都对法官的判决有着关键性的作用。我国学者在运用实验方法研究法官决策行为方面也不乏出色的先行者。比如,李学尧等人曾对法官进行过一项认知流畅度的实验,研究发现认知流畅度这一法外因素对法官判决轻重有显著影响。刘庄亦通过实验研究发现,要求法官在判决前写下说理将有效降低法外因素对法官判决的影响。

 

相较于针对上网刑事判决书的内容分析而言,以真正的法官为研究对象的实验研究在样本获取方面难度明显增加。样本数量过少以及随机选取的难以实现,对于样本代表性的实现具有显著的不利影响,因此这类研究的结果的可推论性同样受到诟病。然而,作为社会科学中最接近自然科学研究的一种研究方式,实验研究是“一种经过精心的设计,并在高度控制的条件下,通过操纵某些因素,来研究变量之间因果关系的方法”。实验研究方法的使用者一方面可以通过精心设计实验从研究过程中获得多维度的变量信息,更为逼真地还原法官量刑决策的实际过程,另一方面可以通过高度控制,在排除其他所有可能影响法官量刑决策因素的情况下,准确观察某一个因素是否对法官量刑结果这个因变量产生了显著影响。综合比较而言,实验研究是从微观层面深入观察犯罪人性别是否对我国法官量刑存在显著影响更为理想的方法进路。

 

(二)本文的研究设计

 

为了探究科研机构培养科学家时是否存在性别歧视,来自耶鲁大学生物学、心理学、管理学等多个专业的学者们曾进行过这样一项实验研究。研究者们制作了两份简历,简历内容几乎完全相同,唯一不同的是简历人的姓名:一份简历写着典型的男性姓名,另一份则写着典型的女性姓名。随后,研究者们将简历投给美国一百多家高校科学实验室,应聘实验室主管职位。结果显示,即便男女简历内容完全一样,署男性姓名的简历却得到了潜在雇主显著更高的评价,并且获得了更高的工资许诺。这项研究验证了美国科学领域性别歧视的广泛存在。受这一研究设计思路的启发,本文以我国刑事法官为调查对象,分别制作了A和B两类问卷。问卷内容均分为三大部分:第一部分调查法官的客观背景,第二部分调查法官的主观理念,第三部分为虚拟案例量刑。第三部分分别设置了故意杀人罪、抢劫罪、诈骗罪与贩卖毒品罪四个虚拟案件。每个虚拟案例首先给出一个基本案情,请法官根据自己的判断给出量刑结果;随后,在基本案情的基础上,每个虚拟案例给犯罪人添加一个普通累犯情节,请法官再给出一个量刑结果。两类问卷的第一部分和第二部分的内容完全相同,唯一的区别在于第三部分虚拟案例中犯罪人性别的设置:问卷A虚拟案例中所有犯罪人的性别均设置为男性,匹配典型的男性名字,问卷B虚拟案例中所有犯罪人的性别均设置为女性,匹配典型的女性名字。问卷设计完毕后,我们任选国家法官学院两期进修的刑事法官作为调查对象,在国家法官学院先后进行两次问卷调查。为了满足实验研究“高度控制”的要求,每一次调查都需要将同期进修法官随机分配为两组:向一组法官发放问卷A,即问卷虚拟案例中犯罪人为男性的问卷,简称男犯组;向另一组法官发放问卷B,即问卷虚拟案例中犯罪人为女性的问卷,简称女犯组。在问卷调查的过程中,随机分配这一操作非常关键,其意在通过概率论来控制各种干扰变量的出现,尽可能让两组法官从统计学意义上而言在各个方面都比较相似,只剩下所填问卷虚拟案例中犯罪人性别这一项有所不同,以此排除诸如法官个人特质、法官所处量刑语境等因素对于量刑结果的干扰,进而才能尝试在犯罪人性别与可能出现的量刑差异之间建立因果联系。两次问卷调查一共发放问卷340份,其中问卷A为170份,问卷B为170份,有效回收的问卷共计272份,有效回收率高达80%。关于问卷有效回收率的标准,美国社会学家艾尔·巴比曾提出一个简单的等级规则:问卷有效回收率达到50%属于足够,达到60%算是好的,而达到70%就非常好。根据这一规则,本研究的问卷有效回收率显然非常好。而且,比较来看,本研究的有效样本数量和有效回收率亦与国外类似的法官量刑实验研究相当。

 

由于种种原因,我们无法进入国家法官学院亲自发放问卷,只能委托工作人员代为发放,对于整个调查过程没能进行足够的控制。而且,实证研究的伦理强调被试者必须是自愿参加。在国家法官学院进修的法官有其主观能动性,他们有权选择拒绝合作。问卷调查结束后,我们发现,虽然问卷总体的有效回收率令人满意,但是男犯组和女犯组问卷的有效回收率却出现了较大差异。在有效回收的272份样本中,问卷A仅有117份,问卷B则有155份。男犯组问卷的有效回收率为68.8%,女犯组问卷的有效回收率为91.2%。两组法官问卷回收率出现明显差异,意味着问卷调查过程中随机分配这一关键步骤没有得到很好的执行。由于实验操作过程中的控制不足,两组法官很有可能存在某些个人特质方面的显著不同,进而导致两组问卷量刑结果之间的差异。鉴于此,即使最终问卷结果显示两组法官在量刑结果上确实存在显著差异,也不能直接将其归因于犯罪人性别差异这一个因素。

 

法学属于社会科学。由于社会科学的研究对象和内容存在诸多限制,社会科学研究者想进行类似于自然科学或心理学那样十分严格、完备的标准实验研究几乎是不可能的。为了解决操作过程中出现的控制不足的问题,下文首先会对有效回收的法官问卷结果进行一个描述性分析,重点观察两组问卷在法官个人特质和虚拟案例量刑结果方面是否均存在显著的组间差异。如果发现两组问卷在以上两方面均存在显著的组间差异,为了弥补调查过程中的控制不足,则需要建立回归模型进行再控制。在排除两组法官不同个人特质可能带来的量刑干扰之后,才能进一步观察犯罪人性别这一法外因素对我国法官的量刑决策是否存在显著影响。

 

三、问卷结果与组间差异

 

(一)法官个人情况与组间差异
 

1.客观背景。问卷的第一部分调查法官的客观背景。根据有效问卷的回收数量,接受调查并有效提交问卷的法官共计272名。这些法官的平均年龄为40(±10)岁,年龄最小的为20岁,年龄最大的为60岁。男性法官占总数的68.6%,女性法官占总数的31.4%。从婚姻状况来看,77%的法官处于已婚状态,21.9%的法官尚未婚配,另有1.1%的法官离异。这些法官均受过良好的教育,66.3%的法官拥有本科学历,33.7%的法官是硕士乃至博士。从法官来源来看,40.5%的法官来自东部地区,34.8%的法官来自中部地区,24.7%的法官来自西部地区。从这些法官所在法院的层级来看,39.5%的人来自基层法院,37.3%的人来自中级法院,来自高级法院的法官占总数的23.2%。

 

2.主观理念。问卷的第二部分询问法官对于犯罪、犯罪人和监狱功能的主观看法。(1)当被问及犯罪人犯罪的主要原因是什么时,在有效完成问卷调查的272名法官中,42%的人认为主要应该归咎于犯罪人个人,56.9%的人认为犯罪人个人与社会均有过错,只有1.1%的法官认为主要应该归咎于社会。(2)当被问及犯罪人与普通人的差异时,8.9%的法官认为二者很不一样,49.8%的法官认为二者有点差别。30.1%的法官认为二者基本差不多,还有11.2%的法官表示说不好。(3)当被问及不同犯罪类型犯罪人之间的差异时,27.7%的法官认为他们很不一样,50.9%的法官认为他们之间有点差别。13.5%的法官认为他们基本差不多,还有7.9%的法官表示说不好。(4)当被问及男女犯罪人之间的差异时,绝大部分法官认为他们和她们之间存在差异。其中,认为男女犯罪人很不一样的法官占总数的33.2%,认为有点差别的法官占总数的45.4%。只有占总数14.8%的法官认为基本差不多,另有极少数法官表示说不好,仅占总数的6.6%。(5)当被问及监狱能否实现惩罚功能时,法官的回答总体而言比较乐观。1.9%的法官认为监狱能够完全实现惩罚功能,68.8%的法官认为监狱的惩罚功能基本能实现。另有25.2%的法官认为监狱的惩罚功能比较难实现,认为监狱的惩罚功能基本不能实现的法官则仅占总数的4.1%。(6)当被问及监狱能否实现改造功能时,法官的回答略显悲观,超过半数的法官对此表示不同程度的否定。其中,44.6%的法官认为监狱的改造功能比较难实现,10.7%的法官表示监狱的改造功能基本不能实现。认为监狱的改造功能可以基本实现的法官占总数的43.9%,不足一半,仅有0.7%的法官认为监狱的改造功能完全能实现。(7)当被问及犯罪人再犯罪可能性时,大部分法官认为犯罪人重新犯罪时会延续原来的犯罪模式。关于暴力犯罪人重新犯罪更容易再实施暴力犯罪这一说法,有68.3%的法官表示赞同,余下31.7%的法官表示反对;关于财产犯罪人重新犯罪更容易再实施财产犯罪这一说法,有69%的法官表示赞同,还有31%的法官表示反对。

 

3.组间差异。在法官客观背景方面,男犯组与女犯组在法官年龄、法官婚姻状况和来源法院这三个个人特质上存在显著的组间差异。(1)从年龄来看,男犯组法官的年龄普遍大于女犯组法官,男犯组法官的年龄均值为44(±9)岁,女犯组法官的年龄均值为37(±11)岁,两组年龄均值相差7岁。独立样本T检验结果显示,两组法官在年龄方面组间差异显著。(2)从婚姻状况来看,男犯组中处于已婚状态的法官明显要比女犯组多。男犯组中已婚的法官占全组的92.2%,只有6.9%的法官未婚和0.9%的法官目前处于离异状态,而女犯组中已婚的法官仅占全组的65.4%,有33.3%的法官未婚,1.3%的法官目前处于离异状态。卡方分析结果显示,两组法官在婚姻状况方面组间差异显著。(3)从来源法院来看,男犯组法官来源法院的层级分布较为均衡,而女犯组法官来源法院的层级分布则呈现金字塔状。具体来说,男犯组中,有30.2%的法官来自基层法院,有38.8%的法官来自中级法院,还有31%的法官来自高级法院;女犯组中,有46.5%的法官来自基层法院,36.1%的法官来自中级法院,仅有17.4%的法官来自高级法院。卡方分析结果显示,两组法官在来源法院层级方面组间差异显著。(4)在法官主观理念方面,男犯组与女犯组法官在关于男女犯罪人差异问题上的认识有显著差别。男犯组法官中有41%的人认为男女犯罪之间很不相同,这一比例接近半数,有38.5%的人认为男女犯罪人之间有点差别,认为二者差不多的法官占17.4%,还有3.4%的法官表示不好说。女犯组法官中认为男女犯罪人很不相同的人仅占全组的27.3%,50.6%的人认为二者有点差别,13%的人表示二者差不多,还有9.2%的法官表示不好说。卡方分析结果显示,两组法官在男女犯罪人差异认识上组间差异显著。

 

(二)法官量刑结果与组间差异

 

1.故意杀人罪虚拟案例基本案情:犯罪人身材矮小,性格懦弱,结婚后常常遭到凶悍配偶的辱骂和责打,无力反抗。某日犯罪人因为琐事再次受到配偶的羞辱和打骂,积压多年的愤怒终于爆发。趁其配偶熟睡后,犯罪人拿来家里的榔头,猛锤配偶头部致其死亡。案发后,犯罪人主动投案自首,对其罪行供认不讳。针对本案的基本案情,7.4%的法官判处犯罪人死缓,28%的法官判处犯罪人无期徒刑,还有64.6%的法官判处犯罪人有期徒刑,有期徒刑刑期均值为114(±46)个月。当被告知犯罪人有累犯情节时,法官量刑的严厉程度显著增长,0.7%的法官判处犯罪人死刑立即执行,20%的法官判处犯罪人死缓,29.6%的法官判处犯罪人无期徒刑,还有49.7%的法官判处犯罪人有期徒刑,有期徒刑刑期均值上升为118(±41)个月。有期徒刑刑期均值因累犯从严增加4个月,增幅为3.5%。

 

初步观察男犯组与女犯组法官针对本案基本案情以及加入累犯情节后给出的量刑结果,男犯组法官量刑普遍比女犯组法官更为严厉,两组法官的量刑结果存在显著的组间差异。以刑罚种类和有期徒刑刑期作为衡量量刑结果轻重的两大维度,男犯组法官无论是针对基本案情还是加入累犯情节之后的量刑结果在这两个维度上都显著重于女犯组法官。

 

针对本案的基本案情,男犯组中56%的法官判处犯罪人有期徒刑,44%的法官判处了比有期徒刑更严厉的主刑刑种(33.6%的法官判处犯罪人无期徒刑,10.4%的法官判处犯罪人死缓);而女犯组中71%的法官判处犯罪人有期徒刑,只有29%的法官判处了犯罪人比有期徒刑更为严厉的主刑刑种(23.9%的法官判处犯罪人无期徒刑,5.1%的法官判处犯罪人死缓)。卡方检验结果显示,两组法官量刑在刑种方面的组间差异显著。从有期徒刑刑期来看,男犯组法官判处犯罪人有期徒刑刑期均值为136(±40)个月,女犯组法官判处的有期徒刑刑期均值为101(±44)个月,两者相差35个月。独立样本T检验结果显示,两组法官量刑在有期徒刑均值方面的组间差异也显著。

 

加入累犯情节后,两组法官量刑结果还是呈现出类似的组间差异。从主刑刑种分布来看,累犯从严后男犯组中38.8%的法官判处犯罪人有期徒刑,61.2%的法官判处犯罪人比有期徒刑更为严厉的主刑刑种(35.3%的法官判处犯罪人无期徒刑,25.9%的法官判处犯罪人死缓);而女犯组中57.8%的法官判处犯罪人有期徒刑,只有42.2%的法官判处比有期徒刑更为严厉的主刑刑种(24.7%的法官判处犯罪人无期徒刑,15.6%的法官判处犯罪人死缓,1.9%的法官判处犯罪人死刑立即执行)。卡方检验结果显示,两组法官累犯从严后量刑在主刑分布方面的组间差异显著。从有期徒刑刑期来看,累犯从严后男犯组法官判处有期徒刑的刑期均值升至138(±36)个月,女犯组法官判处的有期徒刑刑期均值升至109(±40)个月,两者相差29个月。独立样本T检验结果显示,两组法官累犯从严后量刑在有期徒刑均值方面的组间差异也显著。

 

2.抢劫罪虚拟案例基本案情:犯罪人身材高大,性格嚣张,某日伙同王某(另案处理)到百货商场门前,见被害人徐某(女)拿着一部苹果手机经过,王某把徐某按倒在地上,犯罪人拿出随身携带的刀具对徐某进行威胁,随即抢走徐某的手机以及其他随身的财物(价值共计8000元)。二人得手后逃跑。两日后,二人被民警抓获,赃款赃物已发还给被害人。针对本案的基本案情,3.4%的法官判处犯罪人无期徒刑,还有96.6%的法官判处犯罪人有期徒刑,有期徒刑刑期均值为84(±38)个月。当被告知犯罪人有累犯情节时,法官量刑的严厉程度显著提高,3%的法官判处犯罪人死缓,10.4%的法官判处犯罪人无期徒刑,还有86.6%的法官判处犯罪人有期徒刑,有期徒刑刑期均值上升为102(±38)个月。有期徒刑刑期均值因累犯从严增加18个月,增幅为21.4%。

 

初步观察男犯组与女犯组法官针对本案基本案情以及加入累犯情节后给出的量刑结果,两组法官量刑结果严厉程度差不多,并不存在显著的组间差异。以刑罚种类和有期徒刑刑期作为衡量量刑结果轻重的两大维度,男犯组法官无论针对基本案情还是加入累犯情节以后给出的量刑结果在这两个维度上与女犯组法官均无显著差异。

 

针对本案的基本案情,男犯组中96.6%的法官判处犯罪人有期徒刑,3.4%的法官判处了比有期徒刑更严厉的主刑刑种(3.4%的法官判处犯罪人无期徒刑);而女犯组中96.7%的法官判处犯罪人有期徒刑,3.3%的法官判处了比有期徒刑更为严厉的主刑刑种(3.3%的法官均判处犯罪人无期徒刑)。卡方检验结果显示,两组法官量刑在刑种方面的组间差异不显著。从有期徒刑刑期来看,男犯组法官判处犯罪人有期徒刑刑期均值为87(±42)个月,女犯组法官判处的有期徒刑刑期均值为81(±35)个月,二者相差6个月。独立样本T检验结果显示,两组法官量刑在有期徒刑刑期均值方面的组间差异并不显著。

 

加入累犯情节后,两组法官的量刑结果轻重依然没有显著的组间差异。从刑罚种类来看,累犯从严后男犯组中88%的法官判处犯罪人有期徒刑,12%的法官判处比有期徒刑更为严厉的主刑刑种(8.6%的法官判处犯罪人无期徒刑,3.4%的法官判处犯罪人死缓);女犯组中85.6%的法官判处犯罪人有期徒刑,14.4%的法官判处比有期徒刑更为严厉的主刑刑种(11.8%的法官判处犯罪人无期徒刑,2.6%的法官判处犯罪人死缓)。卡方检验结果显示,两组法官累犯从严后量刑在主刑分布方面的组间差异不显著。从有期徒刑刑期来看,累犯从严后男犯组法官判处犯罪人有期徒刑刑期均值升至104(±40)个月,女犯组法官判处犯罪人有期徒刑刑期均值升至100(±36)个月,二者相差4个月。独立样本T检验结果显示,两组法官累犯从严后量刑在有期徒刑刑期均值方面的组间差异也不显著。

 

3.诈骗罪虚拟案例基本案情:犯罪人以给被害人马某的侄子找工作的名义,骗取被害人马某(男)人民币共计5万元后逃走。被害人随后到公安机关报案,一周后,犯罪人被抓获,赃款已被挥霍。针对本案的基本案情,0.8%的法官判处犯罪人无期徒刑,还有99.2%的法官判处犯罪人有期徒刑,有期徒刑刑期均值为44(±22)个月。当被告知犯罪人有累犯情节时,法官量刑的严厉程度显著提高,1.1%的法官判处犯罪人无期徒刑,还有98.9%的法官判处犯罪人有期徒刑,有期徒刑刑期均值上升为59(±29)个月。有期徒刑刑期均值因累犯从严增加15个月,增幅为34.1%。

 

初步观察男犯组与女犯组法官针对本案基本案情以及加入累犯情节后给出的量刑结果,两组法官的量刑结果在刑罚种类方面差异不大,在有期徒刑刑期上则存在显著的组间差异。从有期徒刑刑期这一维度来看,女犯组法官量刑普遍比男犯组法官更重。

 

针对本案的基本案情,男犯组中100%的法官都判处犯罪人有期徒刑,没有人判处比有期徒刑更为严厉的刑种;而女犯组中98.6%的法官判处犯罪人有期徒刑,还有1.4%的法官判处比有期徒刑更为严厉的刑种(1.4%的法官判处犯罪人无期徒刑)。卡方检验结果显示,两组法官量刑在主刑刑种方面的组间差异不显著。从有期徒刑刑期来看,男犯组法官判处的有期徒刑刑期均值为40(±20)个月,女犯组法官判处的有期徒刑刑期均值为47(±22)个月,两者相差7个月。独立样本T检验结果显示,两组法官量刑在有期徒刑刑期均值方面的组间差异显著。

 

加入累犯情节后,两组法官的量刑结果依然只在有期徒刑刑期方面差异显著。累犯从严后男犯组中100%的法官都判处犯罪人有期徒刑,没有人判处比有期徒刑更为严厉的刑种;而女犯组中98%的法官判处犯罪人有期徒刑,还有2%的法官判处比有期徒刑更为严厉的刑种(2%的法官判处犯罪人无期徒刑)。卡方检验结果显示,两组法官累犯从严后量刑在主刑刑种方面的组间差异不显著。从有期徒刑刑期来看,累犯从严后男犯组法官判处犯罪人有期徒刑刑期均值升至51(±23)个月,女犯组法官判处的有期徒刑刑期均值升至59(±28)个月,两者相差8个月。独立样本T检验结果显示,两组法官累犯从严后量刑在有期徒刑刑期均值方面的组间差异显著。

 

4.贩卖毒品罪虚拟案例基本案情:犯罪人将12克海洛因卖给吸毒者姚某和李某,从中获利人民币3万元。五天后,警方将其抓获。针对本案的基本案情,0.8%的法官判处犯罪人死刑立即执行,1.2%的法官判处犯罪人死缓,1.9%的法官判处犯罪人无期徒刑,还有96.1%的法官判处犯罪人有期徒刑,有期徒刑刑期均值为82(±31)个月。当被告知犯罪人有累犯情节时,法官量刑的严厉程度显著提高,1.6%的法官判处犯罪人死刑立即执行,1.2%的法官判处犯罪人死缓,5.1%的法官判处犯罪人无期徒刑,还有92.1%的法官判处犯罪人有期徒刑,有期徒刑刑期均值上升为102(±34)个月。有期徒刑刑期均值因累犯从严增加20个月,增幅为24.4%。

 

观察男犯组与女犯组法官针对本案基本案情以及加入累犯情节后给出的量刑结果,我们发现,两组法官的量刑结果在刑罚种类方面存在显著的组间差异,而在有期徒刑刑期上则差别不大。从刑罚种类这一维度来看,女犯组法官量刑普遍比男犯组法官更重。

 

针对本案的基本案情,男犯组中100%的法官都判处了犯罪人有期徒刑,没有人判处比有期徒刑更为严厉的刑种;而女犯组中除了93.2%的法官判处犯罪人有期徒刑外,另有6.8%的法官判处比有期徒刑更为严厉的刑种(3.4%的法官判处犯罪人无期徒刑,2%的法官判处犯罪人死缓,还有1.4%的法官判处犯罪人死刑立即执行)。卡方检验结果显示,两组法官量刑在主刑刑种方面的组间差异显著。从有期徒刑刑期来看,男犯组法官判处犯罪人有期徒刑刑期均值为79(±28)个月,女犯组法官判处的有期徒刑刑期均值为84(±33)个月,二者相差5个月。独立样本T检验结果显示,两组法官量刑在有期徒刑刑期均值方面的组间差异不显著。

 

加入累犯情节后,两组法官的量刑结果依然只在主刑刑种分布方面差异显著。累犯从严后男犯组中98.2%的法官判处犯罪人有期徒刑,只有1.8%的法官判处了比有期徒刑更为严厉的主刑刑种(1.8%的法官判处犯罪人无期徒刑),而女犯组中只有87.7%的法官判处犯罪人有期徒刑,有12.3%的法官判处了比有期徒刑更为严厉的主刑刑种(7.5%的法官判处犯罪人无期徒刑,2.1%的法官判处犯罪人死缓,还有2.7%的法官判处犯罪人死刑立即执行)。卡方检验结果显示,两组法官累犯从严后量刑在主刑刑种方面的组间差异显著。从有期徒刑刑期来看,累犯从严后男犯组法官判处有期徒刑的刑期均值升至100(±32)个月,女犯组法官判处的有期徒刑刑期均值升至104(±36)个月,二者相差4个月。独立样本T检验结果显示,两组法官累犯从严后量刑在有期徒刑刑期均值方面的组间差异并不显著。

 

四、再控制与回归分析

 

(一)再控制的必要性

 

按照原先的研究设计,两组问卷虚拟案例案情设置完全一样,只有犯罪人性别不同。这一安排保证了两组法官在量刑时所应考虑的与犯罪社会危害性和犯罪人人身危险性相关的法律事实完全相同,排除了法定因素不同对量刑可能带来的干扰影响。将同期受训法官随机分配为两组,通过概率论保证两组法官在主体性特质方面的相似性,以此排除了法官客观背景或主观认知方面的不同对量刑可能带来的干扰影响。与此同时,让两组法官在同样的虚拟场景下完成问卷调查,量刑语境相关的各种干扰变量比如刑事政策、同侪压力、所处地域等会以同样的方式对两组法官产生影响,以此排除与量刑环境相关的因素对量刑可能带来的干扰影响。只有完全实现了这三重控制,才能在犯罪人性别差异与法官量刑呈现的组间差异之间建立因果关系。

 

然而,两组法官问卷有效回收率出现明显差异,意味着随机分配这一关键操作没有实现。前文的描述性分析结果显示,男犯组与女犯组法官在年龄、婚姻状况、来源法院层级以及对于男女犯罪人差异认识上均存在着统计学意义上的显著差异。从理论上来说,量刑作为一个兼具报应与预防二元目的的司法过程,法官应该只考虑与犯罪社会危害性以及犯罪人人身危险性相关的法律事实来形成量刑结果。但是,不同的法官对于相同的法律事实有不同的建构与把握。早在1826年,冯·桑腾就把审判冠以“创作者的人格印记”之名,认为在具体确定刑罚的时候,审判者自身的某些特点发挥了作用,导致了差异的产生。在社科法学的研究视野下,法官自身主体性特征的不同会导致量刑差异这一点被一再证实。“法官的某些价值取向、主观偏好、司法潜见、偏见、实践经验,甚至性别、年龄、学历、个性等事实上也与案件处理结果有关。”鉴于此,随机分配的失败没能按照预期完全排除法官自身主体性方面的差异,目前法官量刑所呈现的组间差异有可能是犯罪人性别差异造成的,也有可能是法官客观背景或主观认识的不同导致的。研究过程中的控制不足导致现阶段无法直接将观察到的组间量刑差异完全归因于犯罪人性别差异这一个变量。为了弥补调查过程中的控制不足,需要通过回归模型进行再控制,在排除法官自身主体性因素差异对量刑的干扰影响之后,才宜进一步观察犯罪人性别对法官量刑结果有无显著影响。

 

(二)再控制的操作化

 

根据问卷安排,四个虚拟案例量刑都分为两个环节:首先,要求法官针对每个罪名项下的基本案情量刑;其次,在基本案情上加入一个普通累犯情节要求法官再次量刑。因此,法官在每个虚拟案例之下都会依次给出两个量刑结果。探寻犯罪人性别这一法外因素是否显著影响法官量刑也分为两步走:首先观察犯罪人性别是否显著影响法官对每个罪名项下基本案情的量刑结果,然后观察不同罪名项下法官对累犯从严的力度是否受到犯罪人性别的显著影响。

 

1.步骤一的操作化。步骤一旨在排除法官主体性差异的干扰,判断基本案情的量刑结果是否受到犯罪人性别的影响。因此,待建立的回归模型因变量为基础案情的量刑结果,自变量分为两类:犯罪人性别是解释变量,法官年龄、婚姻状况、来源法院层级以及对男女犯罪人差异的认识这四个组间差异显著的主体性特征是控制变量。考虑到样本数量的有限性,除了法官年龄之外,将其余所有自变量都处理成哑变量的形式放入回归模型。

 

在因变量的操作化上,借鉴前文量刑结果质量二维的描述框架,我们也拟从刑罚种类与有期徒刑刑期这两个维度来衡量基本案情的量刑结果。不过,由于四个虚拟案例的量刑结果过分集中于有期徒刑这一个主刑刑种,如果将刑罚种类操作化为传统的主刑刑种,将不利于回归模型的建立与运行。在司法实务中,一般将被判处有期徒刑10年以下的犯罪人称为短刑犯,将被判处有期徒刑10年及以上直至死刑的犯罪人称为长刑犯。下文尝试借鉴这种刑罚种类的二分法,将刑罚种类操作化为是否判处长刑这一二分变量,作为基本案情量刑结果的一个衡量指标。另一方面,把有期徒刑刑期统一以月为单位进行换算,作为基本案情量刑结果的另一个衡量指标。

 

在将基本案情量刑结果操作化为是否判处长刑与有期徒刑刑期这两个指标后,我们采用以下方式进行再控制。一方面,以是否判处长刑这一二分变量作为因变量,将犯罪人性别、法官年龄、法官婚姻状况、法官来源法院层级、法官对男女犯罪人差异的认识作为自变量,在四个虚拟案例罪名项下分别构建四个二分类Logistic回归模型。另一方面,以有期徒刑刑期这一连续变量作为因变量,将犯罪人性别、法官年龄、法官婚姻状况、法官来源法院层级、法官对男女犯罪人差异的认识作为自变量,在四个虚拟案例罪名项下分别构建四个多元线性回归模型。

 

2.步骤二的操作化。步骤二旨在排除法官主体性差异的干扰,判断累犯从严的力度是否受到犯罪人性别的影响。因此,待建立的回归模型因变量为累犯从严的力度,自变量的种类与处理方法与步骤一相同。

 

在因变量的操作化上,我们同样拟从质量二维来衡量累犯从严的力度。从法理逻辑上来说,累犯从严应该包括刑种从严和刑期从严。刑种从严指的是量刑结果的主刑种类因为累犯从严而升格,刑期从严指的是有期徒刑的刑期因为累犯从严而增加。累犯从严力度操作化为刑种从严力度和刑期从严力度这两个衡量指标。其中,刑种从严进一步操作化为是否因累犯从严而刑种升格这一二分变量,刑期从严操作化为累犯从严后增加的有期徒刑刑期。

 

在将累犯从严力度操作化为是否主刑升格与增加的有期徒刑刑期这两个指标后,我们采用以下方式进行再控制。一方面,以是否主刑升格这一二分变量作为因变量,将犯罪人性别、法官年龄、法官婚姻状况、法官来源法院层级、法官对男女犯罪人差异的认识作为自变量,在四个虚拟案例罪名项下分别构建四个二分类Logistic回归模型。另一方面,以增加的有期徒刑刑期这一连续变量作为因变量,将犯罪人性别、法官年龄、法官婚姻状况、法官来源法院层级、法官对男女犯罪人差异的认识作为自变量,在四个虚拟案例罪名项下分别构建四个多元线性回归模型。

 

(三)回归分析的结果

 

经过上述两个步骤的操作化,总结八个多元线性回归模型和八个二分类Logistic回归模型的分析结果,可以得到如下结论:

 

1.法官自身的主体性因素对于四个虚拟案例的量刑结果普遍存在显著影响。回归分析结果显示,无论是四个虚拟案例基本案情的量刑结果还是累犯从严的力度,均受到了法官年龄、所在法院层级等主体性因素的显著影响。

 

从基本案情的量刑结果来看,法官年龄显著影响故意杀人罪有期徒刑刑期的长短,法官年龄越大越倾向于对故意杀人罪的犯罪人判处更长的有期徒刑刑期(P<0.05)。法官所在法院层级显著影响抢劫罪刑罚种类的轻重,来自基层法院的法官比中级、高级法院的法官更不倾向于对抢劫罪的犯罪人判处有期徒刑十年以上直至死刑的长刑(P<0.1)。法官所在法院层级也对诈骗罪有期徒刑刑期有显著影响,来自基层法院的法官比中级、高级法院的法官更倾向于对诈骗罪的犯罪人判处更短的有期徒刑刑期(P<0.1)。

 

从累犯从严的力度来看,法官所在法院层级显著影响故意杀人罪的刑期从严力度,来自高级法院的法官比基层、中级法院的法官因为累犯从严增加的有期徒刑刑期更长(P<0.05)。法官的婚姻状况显著影响抢劫罪的刑种从严力度,未婚的法官更倾向于因为累犯从严升格原判刑罚的主刑(P<0.1)。法官所在法院层级显著影响诈骗罪的刑期从严力度,来自基层法院的法官比中级、高级法院的法官因为累犯从严增加的有期徒刑刑期更短(P<0.01)。法官所在法院层级对贩卖毒品罪的刑种从严和刑期从严力度均有显著影响,来自高级法院的法官比基层、中级法院的法官更愿意因累犯从严升格原判刑罚的主刑(P<0.05),来自基层法院的法官比中级、高级法院的法官因累犯从严延长的有期徒刑刑期更短(P<0.1)。法官年龄对于贩卖毒品罪刑种从严和刑期从严的力度也均有显著影响,法官年龄越大,越不倾向于因为累犯从严升格原判刑罚的主刑(P<0.05),因为累犯从严延长的有期徒刑刑期也越短(P<0.05)。

 

2.在排除法官主体性因素的干扰后,犯罪人性别对法官量刑结果存在着不系统的显著影响。这种影响是否存在因罪而异,影响方式也各不相同,而且我国法官量刑并不存在“重男轻女”的统一趋势。

 

首先,在利用回归模型控制法官主体性因素对量刑结果的影响之后,大多数情况下犯罪人性别对于法官量刑结果存在着显著影响。回归分析结果显示,犯罪人性别这一法外因素对故意杀人罪、诈骗罪和贩卖毒品罪这三个虚拟案例的量刑结果均有不同形式的显著影响。只有抢劫罪,犯罪人性别无论是对其基本案情的量刑结果还是累犯从严的力度都不存在显著影响。由此可见,犯罪人性别是否显著影响法官量刑结果因罪而异,并不如法官主体性因素的影响那样普遍。

 

其次,在有显著影响的情况下,犯罪人性别对法官量刑的影响方式也因罪而异。从基本案情的量刑结果来看,犯罪人性别对故意杀人罪、诈骗罪和贩卖毒品罪均有显著影响,不过影响维度不同。故意杀人罪犯罪人是否被判处长刑及其有期徒刑刑期长短(质量二维)均受到犯罪人性别的显著影响,诈骗罪只有犯罪人有期徒刑刑期长短(量的维度)、贩卖毒品罪只有犯罪人是否被判处长刑(质的维度)受到犯罪人性别的显著影响。从累犯从严的力度来看,犯罪人性别只对诈骗罪和贩卖毒品罪存在显著影响,影响维度也各异,诈骗罪累犯从严后法官延长犯罪人有期徒刑的刑期长短(量的维度)受到犯罪人性别的显著影响。贩卖毒品罪累犯从严后法官是否会升格犯罪人原判刑罚的主刑(质的维度)受到犯罪人性别的显著影响。

 

最后,我国法官量刑并不存在“重男轻女”或者相反的统一趋势。之前有研究指出,我国法官量刑时普遍存在着“重男轻女”的现象,在同样的情况下女性犯罪人相较于男性更容易得到宽宥。然而,这一观点并未得到本次研究的实证支持。在犯罪人性别显著影响量刑结果的三个虚拟案例中,故意杀人罪基本案情的量刑结果呈现出“重男轻女”的趋势,相比于女性犯罪人而言,男性犯罪人更容易被法官判处长刑,如果被判处有期徒刑,刑期也会更长。加入累犯情节后,故意杀人罪累犯从严的力度并不因犯罪人的性别有所差异。与此相反,诈骗罪和贩卖毒品罪无论是基本案情量刑还是累犯从严的力度则均呈现出了“重女轻男”的倾向。诈骗罪量刑结果在量的维度存在“重女轻男”的倾向:就基本案情而言,在都被判处有期徒刑的情况下,女性犯罪人相较于男性更容易被法官判处更长的刑期;就累犯从严力度来说,被判处有期徒刑的女性犯罪人因累犯从严延长的刑期比男性犯罪人更长。贩卖毒品罪量刑结果则在质的维度存在“重女轻男”的倾向:就基本案情而言,女性犯罪人相较于男性更容易成为有期徒刑十年以上直至死刑的长刑犯;就累犯从严的力度来说,女性犯罪人也更容易因为累犯从严导致原判刑罚的主刑升格。

 

五、讨论与思考

 

(一)法外因素的显著影响

 

为了探寻量刑规范化改革能否排除法外因素对法官量刑的显著影响,上文以犯罪人性别这一典型的法外因素作为观察指标,以国家法官学院将近300名进修的刑事法官为调查对象,进行了一次微观层面的法官量刑实证研究。

 

曾有观点认为,作为一个法外因素,犯罪人性别对于法官量刑结果并不存在真实的显著影响,二者可观察到的相关关系是虚假的。之所以量刑结果显示女性犯罪人相较于男性犯罪人而言普遍受到了更为轻缓的处罚,是因为女性实施犯罪的严重性平均而言更低,而且其前科劣迹相对来说更少。前科劣迹和犯罪行为的轻重程度一旦被引入量刑模型并加以控制,犯罪人性别与量刑结果之间原先可以观察到的相关性就会消失。因此,犯罪人性别并不是法官量刑结果真正的影响因素,实际导致法官量刑差异的是犯罪人罪行的轻重及其前科劣迹的不同。然而,我们的研究结果显示:即使通过研究设计保证犯罪人罪行的轻重及其前科劣迹完全相同,大部分情况下犯罪人性别仍对法官的量刑结果存在着显著影响。只不过这种影响存在与否以及具体的表现形式因罪而异,不存在所谓“重男轻女”的统一趋势。从本次调查问卷中四个虚拟案例的量刑结果来看,法官对故意杀人罪量刑时具有“重男轻女”的倾向,对诈骗罪和贩卖毒品罪量刑时却表现出了“重女轻男”的相反倾向,只有抢劫罪的量刑结果实现了“男女平等”。除了犯罪人性别这一选定的观察指标外,我们发现,法官量刑结果还受到法官自身主体性因素的显著影响。而且,相比于犯罪人性别,同为法外因素的法官自身主体性因素对法官量刑的显著影响更为普遍。上文16个回归模型分析结果一致显示,四个虚拟案例的量刑结果,无论是基本案情的量刑结果还是累犯从严的力度,均受到了法官年龄、所在法院层级等主体性因素的显著影响,只是具体的影响方式有所不同。

 

上文通过虚拟案例量刑的方式来观察法官量刑,一方面通过精心的研究设计保证了与犯罪行为严重性和犯罪人人身危险性相关的法定因素完全相同,另一方面也排除了复杂的环境因素对法官量刑结果可能产生的影响,在这样高度控制与尽力简化的情况之下,法官量刑尚且普遍受到“案件由谁审理”与“犯罪由谁实施”这两方面法外因素的显著影响。那么,在远比研究设定纷繁复杂的司法实践中,法官的量刑决策恐怕难以避免受到更多法外因素的显著影响。立足于本次实证研究的结果,我们不得不断言,即使量刑规范化改革已经在全国推行多年,尽管量刑指导意见的内容已被法官谨记在心,法外因素对我国法官量刑决策的显著影响显然并未被消除。

 

(二)量刑决策的真实面向

 

在量刑规范化改革全面推行后,为什么法官量刑还会普遍受到法外因素的显著影响?这是一种暂时的缺陷,还是一种永久的缺憾?

 

在规范法学的视野之下,法官量刑是一个理性且审慎的推理过程。在“以事实为根据,以法律为准绳”原则的指导下,在罪责刑相适应原则的统摄之下,法官会凭借其专业素养,在统筹考虑与犯罪行为社会危害性、犯罪人人身危险性相关的法律事实的基础上得出一个量刑结果。只要犯罪人的犯罪严重程度、人身危险性相似,依据相同的法律规定,不同的法官给出的量刑结果也应该相差无几。概而言之,这种法律形式主义的思路认为,明确细致的规范指引加上自动贩售机式的法官就能通向同案同判的法治桃花源。然而,现实中指导量刑的法律规范并非如德沃金所说“是一张无缝之网,总有正确的答案存于其中”。与此同时,“尽管常规(大多数)司法决定看上去都是法条主义驱动的,但法官绝非仅适用已有规则或有什么独特的法律推理模式,他们不是法条主义者”。量刑规范化改革期待通过统一司法尺度与细化裁判标准来提高法官量刑的规范性与稳定性,但是,量刑决策的本质、法官认知的机制与司法环境的局限共同决定了在现实中改革至多只能消减而无法消除法外因素对量刑的显著影响。

 

首先,法官量刑与定罪过程一样,本质上都是一种评价过程,其结果由评价主体和评价对象共同决定。“许多事例显示,跟数字打交道的认知难度远高于定性和归类所需要的抽象判断,因而人们在量化决策时会更加情绪化。”相比于定罪而言,量刑过程受到法官这一评价主体的影响会更多。诸多量刑情节并不会自动转换为数字形式的量刑决定,必须经过法官这一评价主体的人为加工才能实现。无论量刑规范化怎样统一司法尺度,细化量刑标准,还是会给也需要给法官留下一定的自由裁量空间。抽象统一的规范指引与具体多彩的案件事实之间必然存在着天然的裂隙,需要法官发挥主观能动性去弥合对接。在这个过程中,量刑决策作为规范判断和价值判断的有机统一,不可避免地会带有法官主体性的烙印。

 

其次,量刑决策受到法官认知机制的制约。法袍之下的法官是人,而且是普通人,受过专业的法律训练既不能使其按照法律形式主义者的理想成为机器,也不能使其摆脱人类共有的认知机制的束缚。认知心理学发现,人类的大脑中有两套认知系统:经验—直觉系统(系统1)与理性—分析系统(系统2)。前者运行自主且快速,不断为系统2提供印象、直觉、意向和感觉等信息,后者需要耗费脑力,因此运行缓慢而懒惰,虽然对前者起到监控作用,但通常都稍微调整或者毫无保留地接受系统1的建议。只有前者运行遇到阻碍时,后者才会从放松状态被激活,加速运作。法官的量刑决策过程同样是经验直觉与理性分析共同作用的过程,经验直觉通常处于先行与主导地位,为后续的理性分析提供基础。基于经验驱动的直觉一旦参与量刑,就会自主迅速地将法官既往经验中的所有信息一并摄入,这种共有的认知机制就为法外因素影响量刑大开方便之门。

 

再次,现有的司法环境难以排除通过经验—直觉机制进入法官决策过程的法外因素。由于我国的刑事司法历来存在重定罪、轻量刑的传统,前期的证据搜集亦有这个倾向。法官量刑时其实处于信息匮乏状态,只能根据有限的证据材料与当事人有导向的供述来构建量刑情节以便作出决策。“由于探索信息不充分问题的答案与做出不确定判断的决策,需消耗更多的心理资源,所以,法官更习惯于依靠自身经验驱动的直觉机制,遵循认知加工的‘吝啬法则’,获取问题的初步答案。”后续的理性—分析系统由于其本身具有惰性,大多数时候会选择直接认可初步的直觉判断而不是修正或否定。只有在法官时间充裕且精力允许时,理性—分析机制才会对先前的直觉判断结论作出审慎的检验。目前各地法院“案多人少”的困境显然进一步压缩了法官的理性—分析机制排除法外因素影响量刑的可能性。

 

最后,司法环境产生的风险与压力亦可成为影响法官量刑决策的法外因素。现阶段,中国法官被视作技术官僚的分支之一,除了扮演着传统司法官的角色,还承担了许多繁重无形的政治任务与社会职责,其司法判决需要追求政治效果、法律效果和社会效果的统一,这就要求法官不能只根据法定因素进行量刑决策,其核心要务不是落实规范,而是把事办妥。2006年起全国法院推行绩效考核制度,“社会效果优先”“涉诉信访一票否决制”“办案数量论英雄”等司法政策纷纷转化为法官的考核标准,量刑结果会不会引发舆论关注、会不会导致被害人上访、会不会影响自己的绩效考核,都是法官不得不慎重考虑的问题。由此,现实环境产生的压力和风险作为法外因素,必然会对法官量刑决策产生显著影响,不会因为量刑规范化改革的推行而改变。

 

(三)量刑规范化的全面评估

 

量刑规范化改革试图通过规范量刑方法和步骤、统一量刑标准和尺度来实现量刑均衡与同案同判,可是“量化裁判的稳定性并不是一个单纯的司法技术问题,而首先是一个认知心理问题”。法官不是冷冰冰的司法机器,而是生活于纷繁复杂真实世界中的活生生的人,其量刑决策不可避免地受到人类共有的认知机制的制约与所处环境的影响。因此,量刑规范化改革无法排除法外因素对法官量刑决策的显著影响,这不是一种暂时的缺陷,而是一个不得不容忍的事实。要想全面评估量刑规范化改革在多大程度上规范了法官的刑罚裁量权,就不能只关注在量刑指导意见上列出的法定因素是否得到了更为规范与统一的适用,还需要关注未被量刑指导意见提及的法外因素对法官量刑的显著影响是否得到了有效控制与消减,二者缺一不可。概而言之,规范与统一法定因素的适用,控制与消减法外因素的影响,应该是量刑规范化改革的一体两面,也是不断趋近同案同判法治理想需要齐下的“双管”。如果忽视法外因素对法官量刑决策的显著影响,任由这种影响在量刑实践中潜滋暗长,势必损害法官决策的明确性与稳定性,违反罪责刑相适应原则与法律面前人人平等原则,最终不利于量刑规范化改革目标的达成。

 

量刑规范化改革选择的制度进路决定了法定因素的规范与统一是其明面,法外因素的控制与消减是其暗面。处在明面的法定因素适用由于有着较为明确与细致的指引标准,是否达到规范化的要求比较容易判断。由于量刑决策过程本身的复杂性以及法官认知机制的运行特点,处于暗面的法外因素对法官量刑的显著影响往往会以难以察觉的隐秘方式得以实现,当事的法官自身很可能都无法察觉,这也就增加了识别与控制的难度。为了得出最终的量刑结果,法官在量刑决策的过程中,首先要在定性维度上考虑各种因素的有无,还要在定量维度上权衡各种因素影响量刑的程度。在各个判断的节点上,法官自身的认知机制都会给其决策打上自身主体性的烙印,并为其他法外因素进入量刑决策过程提供便利。法官在量刑时会尝试运用法外因素提供的信息来减少或者控制不确定性的风险。沿着这条路径,法外因素由此与法定因素产生关联,最终会在适用法定因素的掩护下对法官的量刑结果产生显著影响。举例来说,上文实证研究的结果显示,尽管虚拟案例中累犯情节的适用在大部分情况下都完全符合量刑指导意见的要求,但是法外因素对这些案例累犯从严的力度依然普遍存在着显著影响。随着量刑规范化改革的不断深入,法外因素对法官量刑决策的显著影响不会消失,但是很可能会越来越隐秘。因此,在现实场景下评估量刑规范化改革的成效时,即使发现法定因素的适用没有偏离规定的幅度,也不能认为改革目标已经达成,还需要进一步借助大数据与算法等先进手段对法外因素带来的量刑偏差进行识别与控制。只有在法定因素得到规范和统一适用的同时,将法外因素对法官量刑的影响控制在可接受的范围内,才是量刑规范化的真正实现。

 

来源:《中国刑事法杂志》2022年第2期

作者:劳佳琦,北京师范大学法学院曁刑科院副教授