点击上方图片回顾专栏往期内容
自建40余个模型
取得3项场景认证证书
1项获评优秀场景
她积累了怎样的技术心得
今天让我们来听一听
上海数字法院工作先进个人、
上海市闵行区人民法院
(以下简称闵行区人民法院)
司法行政装备科(信息管理科)
司法技术人员林城茜
与数字法院之间的故事
从法官提出业务规则,到最后建成场景模型,你认为这中间最重要的一步是什么?
林城茜:作为一名技术人员,我觉得是编写算法。因为场景模型无法直接读懂法官提出的业务规则,它必须按照预设的算法逻辑才能有效运行。因此,想要得到预期的数据结果,编写合理的算法就成为了建模的关键一步。
那什么是算法呢?能否通俗地为我们介绍一下?
林城茜:简单地说,算法就是一步一步地判断。我们会在业务规则梳理初期,提前对接模型申报人员,了解他们的构建思路和预期效果,并拆解成一个个条件,推动模型判断出最后结果。其中有两点对于技术人员是非常重要的:一是真正听清和弄明白场景要的是什么,这是算法最核心的来源;二是有效引导、推动申报人员总结出一个个“条件”,我们称之为对比点。
比如,在建设上海法院“受理破产后发放执行款提示预警”应用场景的过程中,申报人员会先向我们科普什么是执行程序和破产程序,以及二者的关联。随后说明目前办案中面临的困境:如果承办法院没有及时发现企业进入破产程序,管理人、破产法院也没有及时通知承办法院停止执行程序,将导致个别企业即使进入破产程序,仍可以通过执行程序收到执行款,这样就无法做到公平清偿债权。在此基础上,申报人员还会向我们解释场景建设的目的,即通过嵌入办案系统,拦截此类发款情况,做好事前提示防范。这样一来,我们基本上就弄明白场景想要做什么了。
同样的,我也会向申报人员科普规则和算法,引导他们理顺场景的算法逻辑。比如,在前述场景算法确定时,首先要框定执行案件,并明确被执行人不是自然人。其次,框定破产案件,通过执行案件的被执行人与破产案件的债务人将两者进行勾连。最后在执行案件开具案款处理单的时候,将处理单的开单日期、领款人账号名称、领款当事人等信息与破产案件进行比对,从中找到该场景想要的线索。
上述过程,往往需要我们与申报人员共同完成。实际上,算法里涉及的很多信息点,也都是在我们一次次互相沟通、一遍遍验证中总结出来的,这样才能梳理出最准确的算法。
确定算法后,就是搭建模型了吧?
林城茜:是的。搭建模型的本质,其实就是通过模型平台,根据前期梳理的算法,寻找适用的库表、选择有效的字段、运用数据预处理,实现场景建设的目标。而在这个过程中,我个人觉得比较有挑战的就是数据库表的选择和勾连问题。
我记得有一个名为“12368热线当事人重复来电及网络工单提示预警”的应用场景。它的目的是通过分析重复来电等的原因,提升热线、工单的处理效果,推动切实解决当事人诉求。如此一来,我们在建设场景时,首先要做的就是甄别出“重复来电”。
最初,我们根据申报人员设想,将来电号码与来电人进行匹配,但第一轮建模数据显示,来电人留下的并不一定是完整的姓名,这显然会降低“重复”的概率,从而影响准确率。我们与申报人员研判后,在第二轮建模里加入了承办法院、案号、来电类型等可定位“重复”的规则,进一步框定了范围。
这样就万事俱备了?其实不然。我们在数据分析时发现,当事人联系法院不只是打电话,还存在提交工单、后台留言等多种渠道,这能否算做“重复”呢?我们讨论后,将其纳入了“重复”的范围。随后将不同平台的字段进行梳理、数据库表进行整合、算法逻辑进行合并,同时研判历史数据,对重复的次数也进行了科学的划定,最终才框定好“重复”的规则。
可以说,从0到1完成每一个模型建立,从1到多逐步推进应用场景建设工作,这其中会经历很多的反复和来回,但我们都秉持着“每一步都要走得踏实”的信念坚持了下来。我们所期待的,始终是场景线索数的精准度、实效分析的有帮助率、申报人员的满意度。
你刚才多次提到申报人员与技术人员的沟通配合,你们在这方面有什么经验心得吗?
林城茜:我们闵行区人民法院组建了数字法院建设专班,构建了专门的申报人员、技术人员沟通交流机制。这其中就包括,每建设一个应用场景,就会组织一个小型的讨论会,邀请申报人员上台讲一讲对于场景建设的想法和效果预期。我们技术人员会在台下认真旁听,如果有疑问就现场提问交流。双方从“效果”倒推“条件”,通常当场就能把算法逻辑确定下来。
你还参与设计了“物业费支付型物业服务合同纠纷要素式审判辅助模型”复杂大场景(以下简称物业费大场景),你认为,大场景的建设与小场景的建设有什么不同?
林城茜:我觉得工作的重点不一样。在小场景建设中,我们更加聚焦“精准度”问题。因为小场景是问题导向的,申报人员对于场景建设规则路径、预期效果有初步的想法,我们要做的就是如何更精准地将其落实到数字模型中。
但是,在复杂大场景中,我们更多地聚焦“探索实现方式”上。比如物业费大场景,申报人员会提出解决物业批量案件当事人诉请和事实整理问题,但是如何实现,需要技术人员发挥更多的作用。
很高兴的是,当时,上海市高级人民法院信息技术部门给予了我们很大支持,为我们提供了低代码平台。我们可以根据业务需求,自主配置要素点,制作各式各样的交互式表单、文书模板,奠定了大场景建设快速落地的技术基础。当然,兄弟法院的前期建设,也为我们提供了宝贵的经验。
而在“摸着石头过河”的过程中,我们也逐渐培养出了“逢山开路、遇河架桥”的精神。我记得,在建设物业费大场景时,申报人员总结设计出9项关键要素,但系统抓取效果并不理想。我们沟通反思后,对这9项关键要素进行了逻辑上的层次分离,收获了很好的效果。比如,我们将“事实与理由”中的“诉争房屋情况”要素分层分级后,细化为“房屋坐落位置”“产权人姓名”“面积”等,不仅有利于系统的自动抓取,也方便后续精准地辅助生成文书。
另外,为查明房屋的权利归属事实,过去,一般需要当事人到不动产交易中心调取相关证据。后来,有申报人员提出,能否将外部协查融入至模型中,减轻当事人诉累。我们通过查阅市大数据中心共享库表、比对多份产权登记信息表,在上海市高级人民法院相关部门的支持与指导下,从数据安全、个人隐私、校验方式、呈现效果等多方面考虑,通过算法和流程的设计,最终实现了首批与外部数据联动的复杂大场景。
如果对数字法院建设说一句话,你想说什么?
林城茜:技术人员要跟得上时代。从最初的信息化阶段到现在的数字化阶段,上海法院已经实现从“可视化展示”到“数据深度应用”的跨越。而随着人工智能、垂类大模型等技术的兴起,如何将其与数字法院建设更好地融合起来,继续赋能司法、建用并进,给更多的人带来帮助,这是我们所有技术人需要面对和解决的新课题。
来源丨上海市闵行区人民法院
高院供稿部门:立案庭(诉讼服务中心、诉调对接中心、信访办公室)、审判管理办公室、信息管理处
文字:林城茜
责任编辑:沈芳、吕曼菲、郭燕
编辑:左雨欣
声明丨转载请注明来自“上海高院”公众号
▴ 点击上方卡片关注“上海高院”公众号 ▴