由于法律专家对人工智能技术掌握不够,因此并不清楚如何用技术上合适的方式来表达、显示法律,甚至法律专家本身也没有充分地基于法律数据和裁判文书等信息来把握、认识法律的现状和规律性的裁判因素。
首先,法律人工智能应适用于简单、明确的案件。这意味着,如果没有人类为数据打标签,机器无法主动进行学习。
在行政案件领域,法律人工智能可以适用于案件事实清楚、争议不大、可以适用简易程序审理的行政诉讼类案件,如应当以不属于行政诉讼受案范围、不具有原告主体资格、超过法定起诉期限以及不符合其他受理条件等理由裁定驳回起诉的案件。所以,认为初审法院‘认定的事实是主观的一点也不过分。[41] 〔美〕弗兰克:《初审法院——美国司法中的神话与现实》,赵承寿译,中国政法大学出版社2007年版,第8页。但在笔者看来,法律人工智能在中国未来可期的中短期内只可能是一种有限的辅助办案手段,难以应用于核心的司法工作——裁判。从某种意义上讲,传统手工作业式的法律行业走向现代的机器化作业似乎不可避免,法律作业方式的工业革命已经正在展开,并逐步向纵深延展。
[53]恰恰是在此关键问题上,无论是目前的法律界还是人工智能界,都没有做好充分投入的准备。由于法律专家对人工智能技术掌握不够,因此并不清楚如何用技术上合适的方式来表达、显示法律,甚至法律专家本身也没有充分地基于法律数据和裁判文书等信息来把握、认识法律的现状和规律性的裁判因素。既不是全样本,也不是部分样本中的优秀样本。
[14]这种风险评估工具是在参考了数十年的量刑案例后所设计的一种算法,该算法结合了十几个参数,进而转化为被告在一定时期内重新犯罪的可能性。我们更缺少好的人工筛选优秀的裁判文书,分析正确的裁判推理、裁判结果,并在此之上思考判断、正确归纳相应的裁判模式。这使得很多法律人工智能产品无法达到法律人所设想的预期,实际产生的作用较为有限,目前,法律人工智能的发展表面上轰轰烈烈,但真正了解、掌握人工智能技术、机器学习算法的人才其实寥寥可数,有些甚至并未投身于法律人工智能这一专业领域。[27]最高人民法院与最高人民检察院提出了智慧法院与智慧检务建设的行动规划。
恰恰相反,法律人工智能在中国的运用将是一个长期的过程,并将面临艰巨的挑战。之所以如此,一个很重要同时也很现实的原因就是我们的研究者自身对数据统计与分析的技术并不了解,更谈不上熟练运用。
从某种意义上讲,法律人与技术人的结合程度决定法律人工智能的运用深度。其二,人类法官优秀经验的归纳尚待时日,更不要说超越了。人工智能依赖机器学习展开分析预测,其与以回归分析为中心的统计方法不完全一致。对于外人或者机器而言,识别自然语言已属不易,识别法律专业术语更是难上加难。
很多时候,我们只能获取极为有限的信息。[30] 参见丁国锋:江苏‘智慧法院建设为司法能力现代化注入新动力,载《法制日报》2017年3月20日,第1版。周斌:苏州法院刑案简易判决一键生成,载《法制日报》2017年6月19日,第1版。[44]另一方面,出于宣传的需要。
对于任何人工智能而言,算法都处于异常关键的位置,法律人工智能同样如此。在刑事法律领域,人工智能主要运用于一般的警务活动、羁押必要性审查以及量刑后假释等活动中。
总之,面对着法律信息这一掺杂着主体性、主观性、特殊性的意识形态混合体,要想通过人工智能发现规律、提炼标准、形成模式,进而预测未来判决,是一项极具挑战性与困难性的工作。最终,AI不仅能够更好地发现不同大法官的裁判立场与观点,预测其未来投票趋势,还可以更清楚地表明谁是裁判决策中的摇摆者与妥协者,甚至大法官们在哪些问题上更容易妥协也一清二楚。
[25] 何帆:我们离‘阿尔法法官还有多远?,《浙江人大》2017年第5期,第47页。[3] See Mohammad Raihanul Islam, K.S.M.Tozammel Hossain, Siddharth Krishnan, What AI can tell us about the U.S.Supreme Court?载https://theconversation.com/what-ai-can-tell-us-about-the-u-s-supreme-court-55352,最后访问时间:2018年3月3日。第三,缺乏优秀、适格的法律与计算机人才。但面对海量、巨大的数据流,这种算法已经不可能准确把握法律现象与司法运行规律,而是需要更为精细与技术化的算法。[20] 那么,在中国,法律人工智能又呈现出何种景象,社会各界对其前景抱以怎样的希冀呢? 从理论界来看,法律人工智能受到了广泛关注,并展开了初步研究与讨论,其大致可分为以下几类:一是关注人工智能作为新兴工具对既有法学理论所带来的问题与挑战。基于此,AI可以预测最高法院未来的裁判,其准确率达到了79.46%。
那么,我们当下法律数据的质与量如何呢?笔者的基本判断是,我们处于数据严重匮乏的状态,且可能在中短期内依然如此。就此而言,在当下技术开发者对人类法官经验的选择尚无力区分时,我们无法判别何为优秀的裁判文书、何为优秀的裁判标准。
在人工智能迅速勃发的背景下,越来越多的法律人开始关注人工智能,也勤于学习、研究相关知识、技术,但目前仍缺乏对法律人工智能的客观认知。(一)匮乏且低质的法律数据 毫无疑义,人工智能兴起的重要原因在于大数据爆炸式的增长,这为人工智能的发展提供了必须的燃料。
而要想寻求真实的数据、信息与模式,没有人类的帮助将很难完成。在理想状态下,法律人工智能或许是一种类推学派中的知识图谱与联结学派中的深度学习相结合的机器学习方法,知识图谱与深度学习结合的算法意味着需要将法律分解为一个个小的逻辑模型,方便机器识别的同时通过专业人员给各个数据打上标签而为深度学习提供训练数据集。
[43]需要指出的是,人工智能的发展是这五种派别各领风骚、起起伏伏的过程,然而每种派别的算法均与人工智能画上等号。[46]在汽车业,特斯拉吸引了大量的人工智能人才。其次,法律界对大数据算法几乎完全外行。这是因为,相对非诉讼事务而言,诉讼是一个开放的过程,信息众多繁杂且真假难辨,在这样的场景中,呈现于法庭之上的案件事实只是真实客观事实的一角,法官需要通过残缺的信息做出判断、决策。
4.法律数据结构化不足 数据为人工智能所识别的重要前提是数据具备结构化特征。如苏州法院的人工智能系统不仅能够统计类案的裁判模式与结果,还能对当下案件根据历史裁判模型模拟裁判,如果法官制作的裁判文书判决结果与之发生重大偏离,系统予以自动预警,方便院庭长行使审判监督管理职权。
虽然我们一直强调司法公开,但也仅限于庭审过程与裁判结果的公开,对包括审前程序、决策讨论、法官心证过程的公开是极为有限的。【中文关键词】 法律人工智能。
以丧葬费为例,在起诉状中丧葬可能被称为安葬、殡葬,停尸的其他表达有拉尸、抬尸、存尸、运尸、收尸,保存尸体的同义词有冷冻尸体、冷藏尸体等。并且,在机器学习的对象、所被喂养的数据上,也没有解决数据质量不佳的问题。
法律大数据以一种前所未有的方式,通过对海量法律数据进行分析,对法律问题进行预判,获得巨大价值的产品和服务,或得出新的认知、深刻的观点和主张。由于影响司法公开与法律信息记录的制度性因素与结构性条件将会长期存在,因而法律领域尤其是司法领域的数据信息在很长的时间内都将呈现有限性、片段化的特征。机器需要充分挖掘法律文本,仔细分析文本中有法律意义的话语,将之标签化并在此基础上分析、建模。[14] See Christopher Slobogin, Risk Assessment, The Oxford Handbook Of Sentencing And Corrections, Oxford Universiry Press, pp.196,203~205(Joan Petersilia Kevin R.Reitz eds.,2012).at 200. [15] 同上,at 204。
[40] 关于意识形态对司法裁判影响的详细分析可参见〔美〕弗兰克•克罗斯:《美国联邦上诉法院的裁判之道》,曹斐译,北京大学出版社2011年版,第4~45页。从人才层面看,法律界、人工智能界互有疏离、隔阂。
在其中79%的案子里,人工智能提出的判决与当时的法庭判决一致。又如,最高人民法院委托苏州中院研发的庭审语音识别系统,可以将语音自动转化为文字,并能自动区分庭审发言对象及发言内容,法官、当事人和其他参与人均能实时看见转录文字。
其次,公权力的行使要求一定透明性,而法律人工智能的算法却具有相当的黑箱性,其或者因为深度学习算法的运用而无法言明计算的过程与内容,或者由于算法商业机密与知识产权的考虑而不对外公开,这天然地与公权力行使的透明性与规则的公开性相悖。笔者的这一判断可以从以下三个方面论析:第一,法律领域并不拥有优质且海量的法律数据资源。
上一篇:CIME2021中国矿业展靠实力出圈!看新一轮矿山设备需求到来
下一篇:下一轮煤价上涨要到四、五月份