Redian新闻
>
华为云盘古大模型团队获中国法律智能技术评测类案检索赛道第一名

华为云盘古大模型团队获中国法律智能技术评测类案检索赛道第一名

公众号新闻


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 咸宁新闻网

近日,中国法律智能技术评测CAIL (Challenge of AI in Law) 公布大赛结果。 华为云盘古大模型团队以NDCG@30分值0.943的总成绩夺得类案检索赛道第一名,从100多支参赛队伍中脱颖而出。

中国法律智能技术评测由最高人民法院司改办和中国中文信息学会指导,旨在促进智能技术赋能司法,实现更高水平的数字正义,从2018年起已连续举办了四届,先后吸引了来自海内外高校、企业和组织的近5000支队伍参赛,成为中国法律智能技术评测的重要平台。

本次大赛共吸引了全球学术界和工业界的众多研究者和开发者参加,其中既有来自北大、清华等国内外顶尖学术机构的科研人员,也有来自微软、谷歌的优秀工程师。

华为云盘古大模型团队获中国法律智能技术评测类案检索赛道第一名

类案检索,即从海量裁判文书当中快速定位和查询与某一案件最为接近的案例、法条、法规。 作为人工智能支持司法审判的重要内容,类案检索技术对于提升法院整体裁判水平、实现类案适法统一、促进司法公正有极其重要的积极意义,其应用场景涵盖公检法司、律所、公司法务等。

CAIL 2022类案检索赛道任务设置为刑事类案搜索,具体任务为给定若干查询案例,每一个查询案例均对应一个大小为100的候选案例池,要求参赛团队从候选案例池中筛选出与每一个查询案例相关的类案。 每个查询案例最终的提交形式为对应的100个候选案例的排序,预测越相似的案例排名越靠前。

类案检索存在三个任务难点:

(1) 首先,类案检索 任务中的相关性判别机制与传统检索任务有较大差异 ,不仅需要判断文本的相似性,更需要识别案件在法律问题和法律程序方法的相似性,同时也存在着“大量文本相同但不是相关案例”的场景,如酒驾和醉驾、交通肇事和危险驾驶、故意伤害罪中的“不同伤残等级”等。

(2) 其次,人工标注的高质量 类案数据 量稀少 ,其主要原因是标注门槛高,需要有法律专业知识的人来标注,并且标注速度很慢。

(3) 第三,司法文书的长度平均几千字,远超 一般 预训练 模型处理上限 。

为了解决类案相关性判别的难点,华为云盘古大模型团队在向量检索模型学习时针对类案判别机制设计了新的预测函数,可以有效地识别出司法文书中的“要件事实”和“案情事实”;针对标注数据少的难点,华为云利用盘古大模型的小样本学习能力,在中文预训练模型(即NLP大模型)的基础上进行微调;此外,华为云利用相似案例之间的传递性,设计了数据增强的方案,并进一步设计了根据学习情况对训练正样本和负样本动态采样的策略。 针对原始超长文书,华为云采用窗口化分块处理,并在处理后进行表示聚合增强模型效果。 最终,华为云盘古大模型团队 以 NDCG@30 分值 0.943 的 总 成绩大幅领先其余队伍,在1 00 多支队伍中名列第一 。

近年来,国务院发布《新一代人工智能发展规划》,明确提出建设“智慧法院”,“促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用,实现法院审判系统和审判能力智能化”。 同时,大量司法公开数据,为法律大数据的开发和人工智能的应用提供了可能。 如何将人工智能技术应用在司法领域,辅助司法工作者提升案件处理的效率和公正性,逐渐成为法律智能研究的热点。

华为云盘古大模型团队正在基于盘古NLP大模型构建司法领域大模型,面向公检法、律所和公司法务,赋能一系列下游应用,包括类案检索、法条推荐、司法信息抽取、罪名匹配等等。 欢迎感兴趣的专家交流讨论,一起促进人工智能技术在智慧司法领域的发展。


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Chat GPT等人工智能技术 对美国大学申请及本科专业选择的影响水滴公司:已在内测类ChatGPT应用,主要用于保险营销和服务ChatGPT 带火大模型!深度解读人工智能大模型在产业中的服务新态势红圈所HR:不会法律检索?对不起,你被pass了...北京内推 | 国家电网智能电网研究院招聘电力设备认知智能技术研发实习生荣膺2022年中小企业精选产品/方案11项大奖,华为收获中小企业市场认可决策智能技术浪潮袭来,数智商业领域如何变革?来听听三位专家怎么说阿里巴巴达摩院-机器智能技术-基础视觉智能团队招聘|2023 校园/实习嘶…出道第一年就这么狂???谷歌大模型团队并入DeepMind!誓要赶上ChatGPT进度STM丨“一个都不落”——李炜、Robert Siliciano团队获得消灭潜伏HIV病毒的新药物靶点和药物组合昨晚,英国法律留学圈炸了...七彩文鸟,又称七彩神鸟中国法律对员工的保障,远远超过美国。。。爸爸,我不用读书了(小小说)君合实习生悄悄透露,拿offer全靠法律检索……美股IPO市场回暖!太阳能技术公司Nextracker(NXT.US)上市首日涨近27%《山居续忆》:第十七章:回忆就我所知的上海古典音乐市场 兼谈我的听乐经历 (下)陪伴北京近七十年的它,要关门了,那里也曾留下过我青春时的脚步EMNLP 2022 | 稠密检索新突破:华为提出掩码自编码预训练模型期待对“北京天通苑南街道第二居委会”的调查结果数据上线!首届6G智能无线通信系统大赛OPPO赛道评测正式开启!同是诈骗类案件,年创百万的刑事律师,是这样找辩点的专访礼达先导丨获中科院院士加盟,带动化学蛋白质组学技术落地本土,将通过自动化、智能化平台破解「难成药」靶点发现难题中国队获大冬会女子冰壶金牌;漠河-53℃低温刷新历史极值丨科技早新闻招聘 | 国家电网-北京-2024电力设备认知智能技术研发实习生AAAI 2023 | 让人工智能技术变得有理论意义与负责任的新思考NeurIPS 2022 | 四分钟内就能训练目标检测器,商汤基模型团队是怎么做到的?慢镜头下的神奇杭州/北京内推 | 阿里达摩院AliceMind语言模型团队招聘算法实习生中国云办公市场头部效应显现!华为云拿下云会议和云桌面市场双第一2023中国法律服务市场:内生力的复现与升格上海/北京内推 | 百度商业研发部模型团队招募机器学习算法工程师/实习生稠密检索新突破:华为提出掩码自编码预训练模型,大幅刷新多项基准Chat GPT等人工智能技术 对未来职业及大学专业选择的影响
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。