东南大学

2018-03-31
报刊:东南大学报

内容搜索

标题导航

放大 缩小 默认

站在法律和科技的交汇点———记“全球法律科技黑客松”大赛参赛经历蔡燊

   期次:第1365期   



  “2018年2月25日晚,由全球顶级人工智能平台IBMWatson、微软、法律区块链平台Integra等发起的‘全球法律科技黑客松’(GlobalLegalHackathon)上海分赛区比赛正式落幕,由东南大学司法大数据研究基地计算机学院毕胜同学带队,法学院蔡燊、计算机学院陈佳敏、程茜雅同学组成的东南大学‘TEEMO’团队经过51个小时的激烈角逐,提出‘基于机器学习和知识图谱的个性化量刑辅助系统’,从12支队伍中脱颖而出,一举赢得上海分赛区冠军。”
  这则消息简短、扼要,却不能囊括我们作为主体在“全球法律黑客松”大赛参赛中所有的所思、所感、所想。
  初相识一拍即合所有的相识、相遇、相知缘于2016年,这一年我们作为新生进入东南大学攻读硕士研究生,恰逢最高人民法院在该年下发法[2016]240号文件,正式批准东南大学成立全国首家“人民法院司法大数据研究基地”。自此,我校法学院与计算机学院基于基地的平台,就人工智能、司法大数据领域展开了深度合作。毕胜来自计算机学院,是著名知识图谱专家漆桂林教授团队的成员,而我来自法学院,是著名刑事法学专家刘艳红院长团队的成员,我和毕胜在两个学院间的各种调研、会议、研讨中慢慢熟络起来。毕胜的思维极其清晰,我作为计算机小白,很多复杂的技术都是从毕胜的讲解中逐渐掌握起来的,从基于司法大数据的同案不同判预警系统、法律文书检索系统到案件权重系统,我们一起讨论的时候越来越多,对各自的领域也越来越熟悉,那时毕胜常常说的一句话是“这个技术其实做起来不难”,每当这时候我都会笑———“你什么都不难”。在我看来,毕胜不仅才华横溢,还对自己所学的专业有着极其深厚的热爱,我有时会暗自想:“如果再多一点野心,这家伙也许是一个可以成为比尔盖茨、乔布斯的人物啊”。
  研二上学期临近放寒假时,有天我在回湖区的地铁上,接到毕胜打来的电话,他说:“想参加一个比赛,要不要去?”我想都没想就答应了,甚至当时连具体是什么比赛都不清楚。与其说是对比赛有兴趣,其实是对毕胜放心,无论什么比赛需要我,去就是了。后来比赛前全球组委会把所有比赛资料发给我们时,我们才认真讨论要不要去,因为如资料所写———全球40多个赛区,10000多人的比赛规模,IBM、微软主办,产品有融资可能,我们几个学生资历尚浅,这样大型的比赛恐怕不是适合我们的舞台,更何况比赛日期就在年后,我们队伍里还有佳敏、茜雅两个本科生,参赛会剥夺他们难得的假期,未免也太残忍了些。于是,最终团队商议决定由我和毕胜先去现场,佳敏和茜雅远程协助。
  赴赛场千磨万击我和毕胜纯粹是抱着学习的态度去上海参赛的。第一天是晚上见面环节,我们见到了比赛对手,12支队伍只有我们是纯学生队伍,其他队伍基本不是律所就是法律科技公司、企业,我们也是人数最少的,仅有四个人,现场还只来了两个。因为主要是企业和律所,常常出现交换名片的商务场合,这时我跟毕胜两个人会感到有些局促,看着前辈们谈笑风生,自己却插不上话。当然,后来的事实证明,虽然是对手但大家都非常和气,我们互相参与了对方的很多次讨论,在这些密集的讨论中,所有的参赛者都受益匪浅,可以说我们学习的目的已经超标了———不仅看到了他们“做什么”,还基本知道了他们“想怎么做”。
  说到我们的创意,我们最终决定做的是“基于机器学习和知识图谱的个性化量刑辅助系统”,这个创意是直到比赛结束前四个小时我们才决定下来的,之前我们俩一直就做什么不停地在争论,我们最初的想法是,拼技术能力、人力、物力、财力我们都是完全没有胜算的,但高校科研机构的优势就在于我们是知识集中地,可以尝试打破学科之间的壁垒。世界迎来多元化的同时,学科知识的壁垒被强化,知识从一个领域传递到另一个领域的周期相对延长,知识融合的滞后期延长了,我们要做的就是把最前沿的计算机技术应用到司法实践上。大致的方向虽然确定了,但具体要做什么呢?这样的比赛,不精准地抓住一个切面,解决实践中的痛点,是绝对不会赢的,而且只有51个小时,我们几个人怎么可能做得出来。整整第二天我们都是在争论中度过的,由于我和毕胜所接受的专业教育完全不同,所以关注的点也完全不同。比赛规则中没有禁止外援,因此我们打视频电话给了一直带我们的王禄生老师、冯煜清老师,向他们请教我们应该做什么。两位老师非常热心,针对我们的想法提供了宝贵的建议,也给予了我们很多的支持和鼓励。但这通电话并没有统一我跟毕胜的关注点,直到睡觉前我们还在尝试互相说服对方。到了第三天,实在不能够再拖下去了,晚上就要现场展示了,我们各自做了妥协,把主题定为刑事案件的量刑辅助系统,但是不同于以往的量刑辅助系统的是,我们应用了计算机科学领域最前沿的知识图谱技术,让整个量刑的过程更加透明化、结构化和智能化。
  熟悉司法实践的人对量刑辅助系统一定不会陌生,我国自上世纪80年代起伴随着法院信息化建设1.0版的浪潮,也诞生了基于专家系统的量刑辅助系统。这一系统最大的特点是量刑函数规则是准确根据量刑文件而预先定义的,所以实现了法官机械劳动量的减轻。但是,这一系统最大的问题在于量刑函数规则可拓展性差,量刑文件更改,系统就要重置,而且智能化程度太低,常常被称为“计算器”。
  伴随着法院信息化建设2.0版的浪潮,我国又诞生了基于机器学习的量刑辅助系统,这一系统应用了当时最前沿的机器学习技术,但这一系统完全是基于机器逻辑,法官只负责给出输入,输出自动完成,中间的过程完全是黑匣操作,对案件的解释力差。出于这样的原因,虽然我国有量刑辅助系统,但真正在实践中,适用率并不高,也并没有达到预期的减轻法官劳动量的目标。更加严峻的大背景是,我国的刑事案件数量逐年递增,而法官员额制改革后,一线法官却有所减少,还有刑事速裁案件推行后,现实中一个速裁案件往往几分钟就判决完成,公正性完全无法保障。
  基于这样的思考,并且参照法院信息化建设3.0版本———司法大数据驱动的审判体系和审判能力现代化的背景,我们提出“基于机器学习和知识图谱的个性化量刑辅助系统”,这套系统以机器学习技术为基础,应用了知识图谱技术,让海量的案件信息形成案件知识图谱,使案件信息结构化、知识库的可拓展性增强、解决了机器学习解释力差的问题。这一系统的开发,可以实现诸多应用,比如可以给法官个性化的知识图谱平台,在这一平台上,除了法定的量刑情节外,法官可以自主决定酌定量刑情节,在做出解释的同时后台会记录,并且法官可以访问同一地区的其他法官的量刑知识图谱,这对减轻法官劳动量和实现法官迅速成长是非常有帮助的。在我看来,基于知识图谱的量刑辅助系统可以说兼有成文法和判例法的优势,让大陆法系和英美法系通过技术媒介更加快速地融合起来。同时,这一系统,不仅对于法官更加准确、便捷地量刑,也对律师、当事人、社会大众基于法律法规准确预判案件、确定辩护策略有着非常大的帮助。
  获佳绩行稳致远到了现场展示的时候,不出意外,对手们都拿出了非常成熟的作品和非常棒的PPT,到了我们展示的时候,我和毕胜只好调侃我们的demo和PPT做得比较朴素,本来我俩都不抱希望,但没想到几个评委对我们的idea非常上心,不知不觉间我们竟和评委来来回回辩论了几个回合。
  这场比赛历经51个小时,虽然场地内随时都有食物和饮料供我们自取,但长时间的高强度劳动让我们非常疲倦,当听到台上宣布冠军是东南大学的时候,我们都愣了一下,没想到我们竟然真的做到了!那一刻,真的有种想哭的冲动!
  我们之所以能够在那么短的时间内想到这么多东西,和我们一年在司法大数据基地的学习经验是分不开的,在司法大数据基地,主要是青年老师,王禄生老师、冯煜清老师、徐珉川老师、杨洁老师都是非常年轻,非常有亲和力和活力的老师,我们和他们一起工作非常放松、开心、愉快,在这样宽松却高效的环境下,我们亲身经历了很多司法大数据实践,所以才会比较熟悉,也比较知道现在的技术怎么样,我们想要达到怎样的效果。
  我的老师刘艳红院长常说,专注、认真和努力比所有一切都重要,怀之专一,可通鬼神。这一次我是真的感受到了。站在法律和科技的交汇点上,我们真切地体会到了科学技术与法学知识的平衡、国家战略和本位优势的平衡、通用技术和专有研发的平衡。或许不是每个人都有这样的机会,但每个人都可以努力成为用心做事的人,用自己的才能、热情和专注,以及背后的自律、勤勉和坚韧,去让这个世界变得更加美好。
  再次感谢黑客松组委会,感谢东南大学司法大数据基地。未来的法律科技,我们来了。
放大 缩小 默认

版权所有 东南大学 Copyright @2011-2023 All rights reserved.

   技术支持:华文融媒云