孟醒|多元大数据应用类型下的证据证明问题及其应对

文章正文
发布时间:2024-09-10 11:21

孟醒

辽宁大学法学院副教授、博士生导师

要目

一、基于大数据的不同应用类型而产生的证据问题二、大数据证据运用的价值权衡三、大数据证据运用的具体规则

不同类型的大数据应用存在不同的证据证明问题。预测类应用的技术特殊性使大数据证据的关联性合法性尤应被关注;识别类应用与损害之间的因果关系证明使算法逻辑的合理性证明成为核心;分析类应用则不仅算法逻辑,算法设计逻辑也同样属于证明焦点。为解决大数据证据的证明难题,应把握大数据技术与民事诉讼、刑事诉讼的司法理念之间的价值权衡,基于比例原则、当事人地位差异、案件性质等要素明确大数据预测类证据的慎重采纳、大数据运用者的算法解释义务、算法合理性的证明责任分配转移等具体证明规则。

“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发”。2013年,英国学者维克托对大数据作出了如此预言。近几年,大数据技术发展迅速,为社会带来了巨大变革。伴随着大数据技术在社会各方面的深入推广使用,司法上也不可避免地要遇到各类承载着机器人算法和人工智能技术的大数据资料。当基于大数据技术而获得的结论造成了事实争议,或者大数据技术运用本身形成争议时,大数据技术便须作为法院审理的核心之一,在法庭上接受质证与调查。因此在证据上,大数据证据不可避免将成为法院需要面对的重要证据之一。法院应如何面对大数据特性带来的证明难题,在大数据的冲击下维持确保司法公正的基本程序原则,是本文要讨论的问题。

一、基于大数据的不同应用类型而产生的证据问题

讨论大数据证据在法院审理中的具体应用,须将证据的使用情景具现化,在详实的语境范围内作出实际探讨。不同的使用情景中自会形成不同的证据问题。因此,有必要首先归纳出目前大数据技术的应用类型,明确不同类型可能产生的不同证据情况。在现阶段,大数据在各方面均已有了十分广泛深入的应用。整体而言,大数据应用根据原理差异,可以分为三种类型,分别为大数据预测类应用、大数据识别类应用、以及大数据分析类应用。这三种应用在刑事及民事诉讼中,会形成具备不同证明功能的大数据证据,从而产生不同的证据问题。

大数据预测类应用

大数据预测类应用是指,通过人工智能对大量数据的提取学习,根据以往数据的统计经验,对具有特定特征的个体未被实际观察监控的行为进行预测判断,从而成为大数据运用者的某项决定或行为的依据来源。例如,公安机关会基于大数据预测分析判断某个个体具有犯罪嫌疑,从而进行侦查、抓捕。基金理财平台会基于对大数据的统计经验,结合用户的以往信息及调查问卷,判断其是否合适特定的理财产品。

这类大数据应用的特点是,其形成判断决定的大数据来源本身并非仅限于判断决定对象,而是参考了大量其他人的数据,通过统计分析,根据概率进行判断预测。其次,这类大数据之所以属于预测类应用,是因为其所针对的是大数据被运用对象的未来行为,而非过去行为。这也意味着,这类大数据应用无论从其数据来源非属于大数据被运用对象而言,还是从其针对的非属于被运用对象的已有行为而言,其影响被运用对象的判断决定的依据来源都具有明显的间接性,其关联性也仅限于概率性的推测判断。当大数据运用方基于此类大数据预测,作出的行为导致大数据被运用方权利受到损害时,相应的大数据证据的关联性必然会受到质疑。

另一方面,尽管这类大数据预测依靠的并不全是(甚至大多数都不是)大数据被运用者本人相应行为的信息数据,其对大数据被运用者的信息监控和提取却是海量的。并且,大数据运用者会通过信息协同效应,将原本没有意义的信息碎片整合起来,形成严重危机个体隐私权的完整情报。例如利用算法,将监控摄像头下每个人一个月内的行径踪迹全部整合起来,从中发现疑点并作出预警,公安机关再根据这些疑点着重调查可疑对象,从中发现犯罪线索,实现犯罪预防。此时大数据算法实际已经将原本零碎的监控内容整合成了每个人完整的生活轨迹,其阻止犯罪的价值与其侵犯个体权益的代价相权衡,使用这类大数据预测的正当性值得考究。因此,对于这类大数据证据,证据的合法性必然也会发生争议,是否应当基于非法证据排除规则予以排除,是值得考虑的问题。

因此,大数据预测类应用应当属于大数据技术差异于传统信息技术最大、发展前景也最远大的一种大数据使用方式。同时,它也是冲击传统逻辑分析、传统道德伦理最大的大数据使用方式。当这类大数据预测出现失误,而给大数据被运用方带来权益损害,因此形成诉讼时,围绕大数据技术的争议将尤为突出。大数据预测使用的技术原理是否不当、以过去数据甚至非本人的过去数据去推论未来行为的合理性是否能在司法层面站住脚等问题将成为法院审理的关键。这些问题与案件事实本身的关联不大,但却需要司法资源的高度投入,相关的司法权衡也会成为未来法院需要面对的难题。

大数据识别类应用

大数据识别类应用是指,通过对图像识别、词汇识别、语音识别等算法,对存在的具有特定特征的信息进行识别筛选,从而对算法监控的特定行为对象进行识别、预警或消除。大数据识别类应用的一般运用即为人脸识别、语音转笔录、听歌识曲等应用,更为复杂的则为以上述识别为基础,进行进一步的判断操作类应用。例如公共场所对类似炸弹等危险物品的识别排除,或对具有特定特征的人进行潜在危险分子的识别预警;网络平台对带有敏感词的语句和视频的识别和自动删除;网络平台对可能侵权的视频和音乐的识别和删除。

当大数据的识别类应用仅限于识别时,不会轻易引起刑事或民事纠纷。纵使其识别错误,但若大数据使用者只停留在对事物的识别阶段,也不会因此错误产生其他损害。然而,当大数据识别类应用涉及识别之后的后续操作时,就可能会因错误识别而给大数据被运用者带来权益损害。大数据识别类的错误识别是一定会出现的概率性问题。由于这类识别的基础逻辑是大数据的累积和概率的推算,因此必然会有错差的可能,而其算法错误造成的权利侵害更会成为大数据被运用者寻求司法救济的对象。此类错误造成的损害存在两种情况,第一种是大数据识别机能本身直接连带其他程序机制,使特定识别结论自带后续程序效果,在被侵权人没有其他行为的接入情况下形成直接损害。例如基于敏感词的累积识别导致微信账户被错误地永久销号;基于危险爆炸物的错误识别导致大数据被运用者的财产灭失乃至人身自由被限制等。第二种情况是大数据识别类应用仅提供识别功能,但因其错误识别导致识别功能的使用者作出错误行为,从而造成损害。例如,植物识别类应用错误识别植物,导致用户食物中毒;医疗识别类应用错误诊断疾病,导致患者误诊。

通过上述两种大数据识别类应用的损害情形可看出,对于此类问题,大数据识别与损害之间的因果关系将成为法院审理的一大焦点。为解决此问题,则大数据算法的合理性必然会成为争论的对象。大数据方当事人会以大数据算法合理为由,将被运用者的损害正当化,以免除自己的过错赔偿责任。而另一方面,被害者也会根据大数据的算法逻辑来证成自己向大数据一方当事人的损害赔偿请求权。

而在面对大数据算法的合理性问题时,算法自身的公开也会成为一大焦点。大数据运用方基于商业机密等原因会拒绝公开,大数据被运用者由于不具有相应的专业能力,也很难在举证之时提出相应的算法不合理的证据。如何确认大数据运用者的责任,如何处理相关的证明责任分配,也会是法院面临的难题。

大数据分析类应用

大数据分析类应用,是指以大数据为人工智能的深度学习材料,基于大数据的信息提取分析,根据大数据运用者的计划设计特定算法,形成实现大数据运用者目的的自动化决策,如外卖平台通过大数据控制骑手分配,自媒体平台通过大数据设计个性化推荐,广告企业通过大数据设计个性化广告推送等。

大数据分析类应用与大数据预测类应用和识别类应用存在一定的机理差异。无论是大数据预测类应用还是识别类应用,其应用设计均有较为明确、较为唯一、且可公开的指向目标。对于大数据预测类应用而言,其目的在于预测筛选未来可能发生的特定行为,这种行为本身是明确且可公开的。例如,公安机关针对机场筛选可能涉及恐怖袭击的行为;金融程序针对客户筛选可能危机金融稳定的行为。此类筛选均有明确且可合理推导得出的积极指向,大数据设计者也没有就筛选对象的隐瞒理由。

但是大数据分析类应用不同。大数据分析类应用的“分析”具有多元化的目的,也会因此存在不同的分析指向和具体的分析逻辑。而分析目的本身是难以公开的。例如广告企业开发大数据分析类应用以设计个性化广告推送,其或者希望刺激不同阶层的客户群跨层增加消费能力,或者希望刺激相应阶层客户群维持相应领域内水平消费能力,可以形成不同的目的。而不同广告企业也会根据不同的标签要素去形成大数据分析逻辑,从而形成不同的个性化广告推送方案。

因此,对于大数据分析类应用而言,除了各大数据技术应用均有的算法自身的黑箱问题之外,大数据运用者影响大数据分析的逻辑动机也处于阴暗之中,可能成为审理的另一焦点。以外卖平台为例,其对骑手的路线和时间计算是否蕴含了商家对骑手过度剥削的动机,其对商家的推送顺序是否蕴含了平台垄断及推广收益的动机,其对消费者又是否存在根据消费者评价记录计算配送优先度、时间限度、价格范围等事项,均属于很难被获知的内容。因此,大数据分析类应用的侵权,不仅涉及算法本身的误差造成的侵权,也会涉及算法设计之初即存在的侵权动机。然而,相比于大数据预测类应用和大数据识别类应用,大数据分析类应用的商业性开发及应用更为广泛,其算法内容,尤其是算法背后的决策逻辑,更加牵扯商业机密,公开质证的难度也会相应升级。在大数据应用侵权的案件中,大数据的算法毫无疑问是具有直接关联性的证据,其被公开质证的正当性基础容易被建立。然而对于算法设计动机,商家极力掩饰,其关联性的建立十分困难。此外,即使被要求公开,商家公开出来的动机的真实性调查也会较为困难。在这种情况下,法院如何平衡双方当事人的地位差别,获得准确全面的证据资料,并对其进行客观的证据评价,将成为一大难题。

二、大数据证据运用的价值权衡

大数据证据在司法运用过程中,存在上述证明难题,其根本原因在于算法技术及大数据的信息基础方面的特殊性与传统司法面对的证据有极大差异,会与司法的诸多价值理念产生权衡方面的难题。因此,欲理清证据规则应如何针对大数据证据进行调整,有必要先理清大数据证据运用的相关价值权衡。

大数据证据采纳与比例原则判断

如上文所述,不同类型的大数据应用均有其大数据证据的关联性和合法性问题,将会影响大数据证据的可采纳性,而大数据证据所要证明的往往是大数据一方行为的合理性和正当性,如果大数据证据不可被采纳,则大数据一方剥夺受害者权益、造成其损害的行为将失去合理依据,从而将在裁判中获得不利的结果。

由此可见,大数据证据能否被采纳,会成为一项证明关键。就结果而言,通过大数据技术而产生的证据显然具有直接关联性,且能够实现大数据运用者所欲追求的特定价值。然而就过程而言,大数据算法所依据的数据及数据获取手段却可能存在不当。尤其如果进行长远的价值考量,大数据证据的获取手段如果被允许,其未来可能带来怎样的影响,是否会违反司法的价值理念,是法院需要慎重考虑的问题。这其中,大数据预测类应用下的证据关联性和合法性问题尤为突出,因为大数据识别类和分析类应用的影响力及于当下而非未来,其主要依据的数据也基本围绕大数据被运用对象本身。当此类的大数据算法存在合理性问题时,其会成为大数据被运用者主张自身损害的事实依据,更多属于法院需要调查的事实问题,而非证据问题。与之相比,大数据预测类应用,尤其是刑事诉讼中,大数据预测类应用作为锁定犯罪嫌疑人的主要线索之一时,其证据的关联性合法性将直接影响到被告的定罪问题,更能成为证据焦点。

由于大数据证据的结果与其获得过程的正当性和与所证事实之间的关联性存在着脱节,因此,对大数据证据是否具备关联性及合法性的判断无法回避对司法影响的价值性判断。此时,应权衡大数据证据被采纳之后所获得的价值,与其所侵害的权益相比,谁更为根本更为重要。在民事诉讼中,应考虑大数据证据被采纳之后所实现的司法救济,与大数据证据的形成过程可能给平等、意思自治、契约合意等私法基本理念带来的损害相比,哪项更为关键。例如,当大数据证据的采纳只能给强势群体带来纯粹的经济价值,而其代价则是弱势群体在私法社会中的意思自由时,该大数据证据的采纳即应予以慎重考虑。反之,若大数据证据对意思自治的侵犯是为了维护更多个体的权益,则该证据即可以考虑被采纳。在刑事诉讼中,要充分考虑大数据证据的运用,是否会给公权机关带来更容易侵蚀公民权利的空间。尤其要考虑的是,当大数据证据被允许自由运用,从而给公权机关传递出可推广大数据技术适用的信号时,是否会产生公权滥用的潜在危险。

算法黑箱与充分质证权

无论是民事诉讼还是刑事诉讼,诉讼当事人均应享有充分的质证权,才能确保裁判结果的公正性。尤其对于刑事诉讼来说,更应赋予被告足以抵抗公权威压的质证权利,才能发挥司法机关权力制衡的基本职能。质证权实质包含两层面的内容,其一是证据的公开,其二是围绕证据充分平等的意见交换。对于普通证据而言,第一层面的证据公开不具有需要特殊关注的需求,证据提交至法院即等于公开。然而对于大数据证据而言,其构成并不具有直观性,并非提交至法院就等于公开。即使大数据运用者将其证据的形成过程公开解构,大量的程序代码与大数据证据之间的衔接依旧无法被直观建立。因此,对于大数据证据而言,其维护当事人质证权的基础并非单纯的提交至法院意义上的“公开”,而是能够让法院及对方当事人形成实质理解的,对大数据证据形成逻辑的“解释”。这种解释不需要讲述代码转换为程序的过程,这一过程作为非专业人士的法官来说也毫无意义。对于法官和对方当事人而言,更关键的公开应为阐明大数据的数据来源、数据类型、算法原理等要素,帮助法院及对方当事人判断是否存在不合理情况。

无论是上述何种大数据应用类型,均会存在需要通过算法公开以论证大数据结论合理性的情况。若大数据算法逻辑不合理,则大数据运用方当事人必然需要承担相应的损害赔偿责任。而如上文所述,大数据分析类应用除了自身的算法逻辑之外,其算法设计的动机逻辑也会影响到大数据应用结论的合理性,会比其他两类大数据应用多一层对算法设计逻辑的公开要求,需要设计者说明对大数据分析的预期设计。

大数据技术往往会被归为商业机密,而大数据分析的设计预期则更可能来源于企业内部的决策机密而在司法上具有较大的公开难度,但是在算法黑箱与充分质证权之间的衡量下,为防止大数据运用方无限利用大数据技术侵犯个体权益,其保密权应当在充分质证权面前进行让步,但该让步只需要达到能够实现证据的公开质证即可,无需因此让大数据运用方彻底丧失对大数据技术的保密能力。一方面,大数据运用方可以保留具体代码技术的机密状态,而只公开大数据构成、算法原理等基本内容。另一方面,大数据证据可以只进行相对公开,被公开人则需要承担相应的守密义务,以维持证据公开质证与商业机密之间的平衡。

证明责任分配与实质平等

无论是民事诉讼还是刑事诉讼,均需要考虑诉讼对抗双方的实质平等问题,避免两者的实力差形成的裁判不公。在民事诉讼中,法院维护实质平等的表现主要在于对基本权利遭受侵害的被害人的侧重关怀,以及在一方当事人为企业等强势主体,另一方当事人为普通个体时对普通个体的侧重保护。在刑事诉讼中,法院维护实质平等的表现主要在于对公权机关强力的程序合法规制,以及对被告人的无罪推定保护。

当大数据被运用方为弱势个体时,其很难通过自己的能力来证明大数据证据的瑕疵问题。弱势个体在主张大数据算法存在问题时,在大数据运用方拒绝的情况下,甚至无法提交大数据证据来佐证自己的主张。基于其弱势地位,为了维护诉讼程序的实质平等,法院应对大数据证据所指向的特定事实进行证明责任转移。例如,当大数据分析类应用可能对个体造成权益损害时,其大数据算法的合理性应由大数据运用者承担证明责任。在公诉机关利用大数据技术对被告人提出定罪量刑主张时,也应由其就相关技术的合理性承担证明责任。但是,应明确上述证明责任分配的转移应仅限于实质平等意义上的证明责任调整。一方面,对于不具有明显实力差异问题的情况,不应实行此证明责任转移。例如,在商事竞争中,同样也会出现大数据算法方面的争议问题,此时,由于双方当事人的争议不涉及基本权利,双方的实力地位也不具有明显悬殊性,便无须启动证明责任分配转移。另一方面,证明责任的分配转移不能超出诉讼程序对主张行为的合理预测。一般而言,对于超出合理范围的主张,应由主张者承担证明责任。基于对理性人普遍诚实守信的预设,诉讼法一般要求打破这一预设的主张人承担更多的证明负担。因此,按照预设,大数据算法的合理性可能在善意范围内存在问题,但是大数据算法设计者的动机应该基本属于善意。如果大数据被运用者想主张算法设计的初衷即存在不当,则其应当承担相应的证明责任,而不基于实质平等的考量予以转移。

值得一提的是,上述证明责任的分配,并不影响承担证明责任的当事人基于自己举证的困难而向法院申请文书提出义务,或向法院申请依职权调查证据。对证明责任的分配,应避免仅因证据偏在而实行常规证明责任的频繁转移。作为实体法明文规定下来的证明责任,其分配应考量更宏观的社会调整以及同类型案件的整体共性,而证据偏在这种更加个案、更为具体的问题则可通过程序法的文书提出义务制度解决。换言之,对于大数据运用者而言,即使其不承担证明责任,也可能基于文书提出义务或法院的要求而产生必须提交大数据证据的举证负担,否则即可能需要承担相应的不利后果。

三、大数据证据运用的具体规则

根据上文分析的价值权衡,本文认为,大数据证据的司法运用,应当基于民事诉讼和刑事诉讼各自不同的情况,遵循以下具体的证据规则。

大数据预测类证据的慎重采纳

如上文所述,大数据预测类应用与其他两种应用不同,需要采纳更广泛多元的数据来预判尚未发生的行为对象,对这类证据的司法采用将对司法理念产生更为深远的影响,因此要慎重考虑。刑事诉讼和民事诉讼的司法理念并不相同,因此应分开分析。就民事诉讼而言,其司法理念优先保护自由公平的交易社会,尽可能减少对双方当事人的权利约束。因此,只要大数据预测类应用没有严重侵犯一方当事人的意思自由,使其彻底失去公平交易的机会,则可予以允许。然而对于刑事诉讼而言,公权机关的特殊性使其对大数据预测类的应用具有更深远的侵犯公民权利的潜在危险,因此应予以更为审慎的规制。由于大数据预测类应用始终要以大量个体零碎化信息为依据,始终存有隐私侵害、偏见统计等问题,因此应谨慎适用。通过大数据预测来获取线索的侦查手段,应局限在重大恶性案件,并在其他常规侦查手段穷尽的情况下才可以使用,否则即应将这类证据视为缺乏合法性而予以排除。

无论是民事诉讼还是刑事诉讼,大数据预测类证据若想被采纳,需要确保其大数据来源的合理性。其一,大数据预测类应用不能利用明确违法的手段收集数据,组成大数据来源。基于民事诉讼和刑事诉讼的不同,收集数据的手段究竟是否违法,可能会存在不同的判断标准。类比于非法证据排除,民事诉讼的标准可远松于刑事诉讼标准,只对“严重”侵害对方利益的情况予以排除。但民事与刑事诉讼共同的底线应是防止大数据运用方通过大数据获取来过度侵蚀大数据被运用方正当的权益空间。其二,应确保预测类应用的大数据中不具有会产生歧视影响的数据。此外,考虑到大数据预测的基础是关联性较弱的其他数据,大数据预测类证据的证明效力应整体降低,不能作为认定事实的唯一证据。

最重要的是,应确保这类大数据预测只是一种问题的解决手段,而非发现问题的平台,以防止这类大数据的滥用。例如,对于贩毒案件,大数据预测类应用应当是在发现贩毒问题之后,为了能够锁定犯罪嫌疑人所在地点,在穷尽其他侦查手段后,通过大数据预测来判断其可能出现的地方。大数据预测类应用不能直接作为一种犯罪预测,在贩毒案件被发现之前启动预警,引导侦查机关去发现案件以及犯罪嫌疑人。如果采用后一种应用模式,大数据预测类应用就会长期启动,所有人都会长期处于过度的监控之下,且所有人的信息在碎片整合的情况下能够随时均被大数据运用者完全掌握,而不仅仅是在亟须这类信息的时候才被掌握。这样的大数据预测类应用是超过其需求范围的滥用,应当予以禁止。

大数据运用者的算法解释义务

为了确保司法上的充分质证权不会因为大数据证据的专业性和内里算法的机密性而被削弱,应当明确规定大数据运用者的算法解释义务。算法解释义务并非要求大数据运用者从大数据应用开发的专业角度来解释算法,而是要求其从大数据应用的结果出发来解释其结果的形成依据。算法解释需要同时包含大数据的算法逻辑和大数据的数据来源。为应对大数据分析类应用的特殊情况,大数据运用者的算法解释义务还应扩张至算法设计的逻辑动机,以防止算法本身合法,但算法设计动机不合法的情况出现。

对于大数据运用者的算法解释,对方当事人提出申请时,不需要承担过重的说理负担,只需要具有一定合理的理由,说明该大数据证据的质证需求以及自己不具有算法信息的获取能力,即可认定申请成立。法院也可依职权要求大数据运用者进行算法解释。对算法进行解释,主要是对算法的基本逻辑及其大数据的数据库样本情况、数据来源、设计者等信息进行解释,让法院和对方当事人理解大数据运行的基本逻辑,以确定当中是否有不正当的歧视偏见成分,或者存在出现不合理误差的情况,以此成为大数据侵权的过错责任认定依据。

算法解释应与相应的证据相配合,确保大数据运用方提供的解释为真。例如,外卖平台公司为证明自己没有利用大数据分析模型来过度剥削骑手劳力,应对自己的外卖配送算法逻辑和算法设计逻辑予以解释,并同时提交外卖配送程序开发时的记录文件和载有讨论运营成本利益的公司文件,以对相应解释进行佐证。在必要的情况下,当事人及法院可以委托第三方中立机构对大数据算法进行专业鉴定,进一步确认大数据运用方的算法解释是否真实。在民事诉讼中,当事人的鉴定申请可以由法院根据案件情况决定是否准许。然而在刑事诉讼中,考虑到公诉机关与被告人之间的关系,以及两者与法院之间的距离和被告人对司法公信力的主观感受,对于当事人委托第三方中立机构来鉴定大数据算法的申请,刑事法庭应当以准许为基本原则,只在申请明显不合理的情况下予以驳回。

算法解释义务必须附有违反该义务时的严苛制裁,才能确保义务人的履行。大数据运用者的算法解释义务可以比照文书提出义务,违反义务时排除该证据,或者法院直接认定对方当事人所主张的事实为真,以督促大数据运用方积极履行算法解释义务。

在刑事诉讼中,对于公权机关采取的大数据算法,应当予以绝对公开,接受社会监督。即使是法律规定的不予公开审理的案件,其大数据算法的解释公开也并非直接具有可以不公开的理由。如若主张不应绝对公开,大数据运用者必须能够证明其大数据内容涉及国家机密,或者其大数据算法的解释公开会给涉及国家利益的犯罪带来更多的侦查困难。对于公权机关的大数据预测类应用,甚至应当在大数据技术使用之初即向社会公开相关的原理及使用范围,及时杜绝大数据技术的不合理适用。在民事诉讼中,对于涉及商业机密的大数据算法解释,则可以不对外公开,但仍应让法院获得足够的信息以进行审理判断。法院、对方当事人以及对大数据算法进行专业鉴定的第三方中立机构在获取相应的信息后,应当对此承担保密义务。

算法合理性的证明责任分配

大数据运用方和相对人之间在信息和专业上必然不平等,但这一现象并不意味着与大数据技术相关的所有证明责任均应转移给大数据运用方。值得注意的是,大数据技术牵扯到的权益损害最终应归于当前实体法的具体规定,而在实体法的这些规定下,通过大数据技术造成损害只属于形成请求权基础的原因之一。实体法不能以偏概全,仅因当中可能存在大数据技术应用的证据偏在问题而将调整整体情况的实体法规定为证明责任转移。

但就算法合理性的证明而言,其证明责任则可分配给大数据运用方。如上文所述,受害方只需对大数据算法的合理性提出合理质疑即可完成向大数据运用方作出的算法解释申请,而具体何为“合理质疑”,则应根据当事人的实际情况灵活把握。对于普通个体,该合理要求应该降低,只要当事人不具有明显的恶意动机即可认定其合理性质疑成立。对于具备竞争关系的其他公司企业,则合理性要求应当升高,避免企业利用司法资源打击竞争对手。对于同样具有大数据技术的企业而言,其有足够能力指出质疑大数据算法不合理的具体事项和理由,甚至可以提交佐证质疑的专业性材料,因此与对待自然人受害者不同,企业主体的合理性质疑与算法解释的申请,除了考察其质疑算法合理性的动机是否存在恶意之外,还须审查其申请的具体依据及相关佐证材料。

证明责任的分配转移应仅限于大数据算法的合理性问题,而不应不及于大数据设计者的初衷动机问题,以避免证明责任的过度转移导致当事人地位的逆向不平等化。尤其对于大数据的设计动机而言,能够证明这一内容的多为企业内部商业资料,如果转移证明责任加强证明负担,则可能反被利用为竞争企业窥探商业机密的工具。尽管证明责任没有转移,但是文书提出义务制度依然可以使用,对算法设计动机存在问题负有证明责任的受害方可以通过文书提出义务方式要求大数据运用方通过提交公司会议记录等证据来帮自己完成证明,也可通过申请法院依职权调查的方式调取公司文件。不过如果最终证明达到真伪不明状态时,仍应由大数据受害者一方承担不利后果。在申请相关的文书提出命令时,大数据被运用方需要提供相对具体的理由,来合理怀疑大数据设计者的不合理动机。例如,对于网约车平台的大数据杀熟问题,大数据被运用方可以提交自己与另一个平台新用户就同样距离的约车所出现的不同价格记录,来提出对大数据设计者不合理意图的质疑。

往期精彩回顾

姜兴智|赋能型法治:破解营销号问题的体系性框架

张祖增  邸卫佳|ChatGPT模型在数字图书馆建设中的嵌入:风险挑战与法律防范

仇欣欣|新型互联网不正当竞争司法审查范式构建

李超  李旭颖|算法司法的扩张:基本框架、制度逻辑与权力调适

黄春晓  胡蓉|算法(智能)时代的司法筹谋——基于革新命题视野下的思维导向与图景架构

唐国峰  黄俊杰|司法大数据视野下执行“衍生案件”的治理进路

上海市法学会官网