Redian新闻
>
法律界的AI革命:大模型将如何颠覆游戏规则?

法律界的AI革命:大模型将如何颠覆游戏规则?

公众号新闻
来源 | 创投小恐龙

法律行业自古有之,是一个相对保守且精英化的行业,不论在对新科技的采用还是整体的线上化,都相对较慢;LegalTech(法律科技)也一直是一个相对价值较“薄”的行业,虽然也支撑起诸如LegalZoom、DocuSign等上市公司,但相比Martech(营销科技)、Fintech(金融科技)等行业,发展较为缓慢。


然而我们发现,生成式AI大模型,如GPT-4、Claude、GLM,基于其较好的复杂推理能力与非结构化信息处理上,拥有前所未有的能力;而法律恰恰有大量非结构化文本沉淀且对推理能力要求较高、是智力密集型行业,以律师的billing hours为核心的价值提供,因此新科技如生成式AI或将为行业大幅降本增效,提供足够显性且有破坏性的价值,而迅速成为Legaltech的重要一部分。


本文,我们深度聚焦AI法律领域,结合海外的最新动向,以发掘出潜在的创业与投资机会,Enjoy~


(图绘制自Midjourney)




行业引爆点 Hook


1.知识和推理能力上的爆发:美国伊利诺伊理工大学-芝加哥肯特法学院宣布,GPT-4通过了美国律师资格考试、并且成绩排名上超过90%的考生,而上一代GPT-3.5参加该考试还排在倒数10%,意味着LLM在法律垂类知识和推理能力上正式完成从零到一的跃迁。



2. 投融资的爆发Harvey拿到OpenAI Startup Fund的首轮融资500万美元,以及红杉资本领投、OpenAI Startup Fund跟投的2100万美元,正式引爆AI法律的创投行业热潮。




行业Overview


法律行业原有状况:LegalTech在LLM爆火之前,主要有2波浪潮


1. 2000-2011年,包括Docusign和Clio等传统SaaS工作流产品,以及Avvo和LegalZoom等,主要关注执业管理、文档自动化、文件存储、财务管理等方面。


2. 2012-2020年,AI开始更多介入LegelTech领域,带来平台级的提升,一些典型的公司包括 ContractPod AI 和 DISCO 等,通过LegalTech产品直接为客户提供法律服务,初步减少了咨询律师的需求并降低了律师与客户双边匹配的成本。


虽然之前已有两波浪潮,但整体来看,法律行业依旧处在技术渗透率和在线化率低的情况,仅8%;我们判断有以下两点核心原因:


1. 法律行业的工作流定义明确+价值高,但对幻觉的容忍度/准确率要求高,因此难以做出generalized tools - 甚至律所及律师的工作习惯还停留在用word和email等传统工具上。


2. 受传统规则(工作方式传统)和商业模式(按照小时付费)约束较大,因此技术渗透率和在线化率低。



后验来看,的确如此。之前LegalTech的核心价值来自电子签名和合同管理等细分领域,聚焦法律服务细分环节的深挖,以捕捉尽可能高比例的价值,如于2018年上市的DocuSign,拥有140万个客户和27亿美元的营收,占据了70%的电子签名市场,但天花板依旧受限于市场规模

  • 目前LegalTech上市公司共8家,分别是最早上市的DocuSign(2018年上市,电子签名业务为主)、2021年上市的Nuix、LegalZoom、CS Disco、Intapp四家、之后Evisort、Ironclad、Elevate三家宣布上市计划;LegalZoom是法律电商平台,Elevate是综合性法律服务提供商,其余6家均为软件公司。


法律行业能够

被生成式AI颠覆的原因



核心逻辑:有降本增效的需求+中长尾未被满足的c端需求,二者相加可能有十倍以上的增量价值

1. 降本增效的强烈需求来自于巨大的行业规模以及行业的昂贵人力成本以及routine paperwork被AI替代的潜力

  • a. 行业规模巨大:从钱上看,全球法律行业的市场规模将于2030年成长为万亿美金的规模,CAGR在6%+;从人上看,美国有135万律师,中国有近60万(中国所有法律从业人员在300万以上),全球共2000万名律师。
  • b. 行业很贵、律师行业的人力成本非常高(培养律师很贵、billing hours也很贵):而律师的工作环节中大量存在重复性的paperwork,具体可分为客户诉求的沟通和拆分、法律研究、客户方案设计、合同、诉讼文书及其他文件的处理;法律行业有大量的paperwork可以被AI替代。



2. 中长尾有大量未被满足的需求(access to justice):法律专业服务的门槛被降低(AI带来的供给增加以及成本降低)、因此更多c端用户可以access到优质法律服务


  • 具体到AI法律上,行业处在爆发前夜,通过破坏性技术创新,快速渗透到行业全价值链,仅仅2023年,AI法律行业就将从9.4亿美元,上涨到23.9亿美元,增速超过250%。
  • 核心驱动力为LLM的能力:拥有复杂推理能力+非结构化信息的处理能力,以至于能够在text-in text-out等情况下,边际成本近乎于零的输出准确率较高的答案,比如当一个普通用户提问一些关于婚姻法的具体案例,被微调过的法律专家模型可以一秒给出相对置信度较高的判罚讲解;因此能够大幅降本增效,让律师专注于提供client-facing和核心高价值提供(如诉讼)。



3. 高标准化+本身价值高的的需求将先被serve,比如诉讼业务

  • 高精尖 vs 基础简单业务:高精尖包括诉讼业务、知识产权、并购、重大商业谈判等cases(通常是专项服务),劳动争议/交通事故、保险索赔等相对简单;常年顾问一般是相对简单的通用知识服务(可代替性超过70%)




海内外法律服务市场的核心差异


市场差异

1. 海内外的TO-B/To-L市场上,海外更成熟、中国相对初期:1)海外的SaaS更成熟、云化好/线上化成熟;因此To-B更可能做出东西 2)国内的SaaS一直存在天花板低,付费意愿差,头部客户以央国企的定制化需求为主,因此更难scale。

2. 海内外的To-C市场的差异:中国在To-C上可能更有增量机会国内有更成熟的To-C引流玩法,并且由于To-B市场的天花板问题,在To-C可能有动作,比如从抖音引流。3. 中国有To-G特色:To-G是重要订单来源,如何把握很重要智慧化政府、智慧法院等需求在国内较为蓬勃,大厂如腾讯、阿里等对此均有介入。

法律体系差异

1.判例法 vs 成文法:美国对判例查询,以及判例的积累作为数据壁垒的意义更:美国及海洋法系国家是判例法,倚重于大量的过往的判罚案例;而中国的判案更多依据法律条文本身,过往判例更多起到辅助作用。

2. 人力成本问题:美国律师的人力成本非常高、美国的律师行业一直是诸多上中产阶级的理想工作,高收入且体面;因此采用AI来替代人工降本增效有更强的动力;而中国则有更多青年律师、实习生提供来满足简单、高重复性的paperwork。



海外市场竞争格局


核心分为三类:三者均有AI法律的头部产品跑出

  • 1.传统法律服务公司:增加了LLM驱动的功能,如LexisNexis、Disco、WestLaw、Aderant
  • 2. 相对成熟的LegalTech公司:加入了最新的LLM功能,如DoNotPay、Robin、Gavel、Spellbook等
  • 3. LLM原生的AI法律公司:如Harvey、E-Legal、AI Lawyer等




核心公司分析


1. Harvey:拥有LLM专家和资深律师的顶级复合背景,以及OpenAI的官方背书,通过为客户构建定制模型,以提供效果更优的通用律师Copilot,在LLM法律行业中处在头部领先地位



公司简介:2022年1月成立于美国华盛顿特区,专注于为通过法律Copilot的形式,为律所和律师提升工作效率,包括使用AI替代研究、起草、分析等paperwork。


创始团队:「Harvey」由Winston Weinberg和Gabriel Pereyra两人联合创立,前者曾是O’Melveny & Myers律师事务所的证券和反垄断诉讼律师,后者曾是DeepMind、Google Brain和Meta AI的研究人员。两人在接触到OpenAI的GPT-3文本生成系统后,意识到可以利用这一技术改善法律工作流程


产品情况:通过fine-tune过的法律专家大模型,帮助律师完成合同分析、监管合规、索赔管理、尽职调查及更广泛的法律咨询服务;专注于为客户构建定制模型,以达到更好的效果。技术路线基于GPT-4进行fine-tune,为最早接入GPT-4大模型的公司之一;最终输出需要经由律师的审查,以保证产出结果及隐私保护。


业务数据:客户主要为大律所和其他有强法律需求的专业机构,如国际律所Allen & Overy和头部会计师事务所普华永道,其中一半的应用来自于北美;目前已经有超过1.5万家机构在其waitlist上。


融资情况:Harvey累计融资2600万美元,目前估值为1.5亿美元。在获得OpenAI领投的500万美元天使轮融资后,Harvey又获得了红杉资本领投的2100万美元A轮融资,其他投资方包括OpenAI Startup Fund、SV Angel和Elad Gil等。


竞争优势:1)OpenAI资源扶持优势:由于较早拿到了OpenAI的投资,在大模型fine-tune和使用上有先发和协同优势 2)创始团队拥有法律和大模型的复合背景:在大模型在垂类的应用上有显著knowhow优势。



2. Casetext - CoCounsel:团队拥有较强的AI和法律复合背景,同时拥有资深的法律行业资源和来自汤森路透(WestLaw)的协同效应,聚焦通用律师Copilot,和Harvey是直接竞争关系

公司简介:Casetext于2013年成立于美国旧金山湾区,CoCounsel是Casetext的一款基于GPT-4的AI法律助理产品,于2023年推出;目前Casetext已经被汤森路透(知名媒体路透社的母公司,本身拥有LegalTech产品WestLaw)收购。

创始团队:公司的CEO为Jake Heller,曾在R&G做助理律师;技术Heads:CTO为Ryan Walker,Head of Machine Learning为Martin Gajek,都曾在Insight Data science担任核心技术岗位

产品情况:CoCounsel推出了两款AI法律产品,分别为AI案例分析助理CARA(Case Analysis Research Assistant)及AI  法律搜索工具Parallel,致力于帮助律师查询法律文件、准备证词、生成法律memo、总结内容和提取法律合同数据功能。技术路线:Casetext同样是第一批接入GPT-4大模型API的公司,并基于GPT-4模型进行了fine-tune,将大约3000个法律问题进行了大约4000个小时的训练,以提高其专业能力与准确性。

业务数据:CoCounsel已经在全球范围内的顶尖律师事务所、内部法律部门和法律援助组织中进行了beta测试,测试人员超过400名律师,已知的客户包括Fisher Phillips、Eversheds Sutherland、Bowman and Brooke LLP和Orrick, Herrington & Sutcliffe LLP等。

融资情况2023年6月,汤森路透以6.5亿美元现金收购了Casetext;2022年1月完成2500万美元的C轮融资,由BuildGroup领投,Union Square Ventures、Canvas Ventures、Y Combinator和Touchdown Ventures等跟投。

竞争优势1)数据积累优势:Casetext本身就有10年的服务律所的经验,与汤森路透的强强联手意味着其拥有世界级的专业法律知识库 2)客户资源沉淀:Casetext已经与全球范围内的顶尖律师事务所、内部法律部门和法律援助组织建立了合作关系,有利于快速获取客户 3)加密保护:使用专属服务器访问GPT-4并采用了银行级AES-256进行数据加密保护,以保护客户数据安全。


3. LexisNexis - Lexis AI+:老牌服务商切入AI法律领域,核心优势为海量的法律数据以及定制化的LLM全栈,旨在基于其对行业的深度洞察更好的为头部律所提供AI服务

公司简介:LexisNexis(律师联讯)是一家老牌的英国法律服务提供商,为励讯集团(RELX Group PLC )的子公司,于今年五月推出了基于LLM的法律AI平台,Lexis+ AI™,旨在提供合同生成、法律内容总结于搜索的便捷功能,提高工作效率。

创始团队:Jake Nelson为Lexis AI+的核心产品负责人,曾任Omnificent的CEO,精通于语义搜索和预测等机器学习技术的同时,对搜索产品较为了解。产品情况:聚焦于法律行业的AI搜索,同时提供生成摘要、法律文件等能力,并会对相应的内容进行引用标注,以帮助律师和客户得到可验证、也引用的权威认证。

技术路线没有使用单一模型、而是根据特定任务选择不同LLM(包括GPT-4等),已形成更有针对性且成本效益更好的LLM全栈

业务数据:公司客户主要为头部国际律所,如全球Top 1的Baker McKenzie和Reed Smith LLP

竞争优势1)数据积累优势:拥有2500TB的巨量数据,几乎掌握了全球法律界所有核心数据,包括1440亿份文件和记录、拥有2.93亿份法庭案卷和文件、超过 1.59 亿份专利文件等 2)基于行业knowhow定制的LLM全栈:而不是单一的LLM,以更好的满足场景的准确性及效率需求 3)私有部署解决安全疑虑:公司针对每一个客户,都采用1v1私有部署模式,不会与任何第三方共享数据



4. Donotpay:另辟蹊径的B2C法律Chatbot,通过创新性的产品和流量牵引力为法律服务降低门槛以更好满足中长尾的法律诉求

公司简介:Donotpay于2015年推出便聚焦于为C端提供服务,定位为“RoboLawyer",旨在满足普通C端用户的中长尾法律需求,如为难民申请庇护、为流浪人员申请住房等;DoNotPay平台最初是为了帮助英美客户对于违规停车罚单进行上诉,后来服务内容逐渐扩展。

创始团队:Joshua Browder为公司的创始人兼CEO,创立公司时刚刚加入斯坦福(随后Dropout),年仅18岁,父亲为著名的金融家Bill Browder;目前也是美国头部VC Greylock的EIR(Entrepreneur in Residence)。

产品情况:Donotpay的核心产品形态是一个具有法律专业知识的AI Chatbot,只需要订阅即可获取其智能化的法律服务,如各类法律建议和解决方案,具体场景包括挑战违章停车罚单、申请航班退款、取消健身房会员等。

业务数据:Donotpay平台直接向来自英美的C端客户提供订阅制服务,一个月的价格仅为2.4英镑;虽然现在没有明确的营收数据,但仅仅是取消健身房会员方面的起诉需求上(由于疫情,许多健身房关门)就有了30倍以上的飙升。融资情况:2021年8月,公司完成了由Crew Capital领头的1000万美元B轮融资,估值达到了2.1亿美元;此前公司已经融资超过1600万美元,包括由Coatue领投的1200万美元A轮融资,以及更早来自Andreessen Horowitz、Lux Capital等的种子轮。

竞争优势1)直接To-C的产品具有创新性:通过法律服务帮助用户满足法律需求并节省各类开支,因此用户由很高的付费意愿与粘性 2)创始人为“小天才”画像:Joshua Browder是Stanford Dropout,擅长洞察C端需求与产品创新。




核心成功因素 KSF


结合以上四家以及Spellbook、Evenup、Robin AI等其他海外LLM法律头部公司,以及国内的幂律智能、语炎智能等获得融资的LLM法律公司,我们发现,公司最为核心的能力主要包括以下五点


1. 垂类大模型的训练能力:虽然在各个垂直领域中,准确性最优解可能来源于从0开始预训练大模型,如BloombergGPT,然而多数LLM法律公司依旧选择了对已经相对成熟的LLM,如GPT-4、Claude,国内的GLM等进行fine-tune,通过高质量法律数据的训练,以提高其准确性和实用效果;而如何更好的进行fine-tune以达到更好的效果,则需要创始团队在LLM训练上的knowhow,包括如何选择LLM(如Harvey选择独一使用GPT-4)更好的清洗处理数据、如何工程化以至于达到更好训练效果、如何尽可能好的满足成本效益等。



2. 行业专业数据:对于LLM法律公司来说,能够训练出优质专业LLM的前提是能够更好积累较为优质的垂类数据,否则会Garbage in, Garbage out;同样,如果想积累优质的专业向量数据库用于AI检索,也依赖于优质的数据积累,如Lexis AI+借助母公司LexisNexis的帮助能够更好的获取和使用数据、Casetext借助其之前的客户资源和汤森路透的产业协同也能获得大量优质的垂类数据



3. 创始团队画像LLM法律的创业对创始团队的要求极高,需要同时拥有LLM和法律垂类知识的顶级复合背景,而其中Harvey通过Winston Weinberg和Gabriel Pereyra两位的顶级AI专家+顶级律师的复合背景,拥有目前LLM法律创业项目中最顶级的团队配置之一,拥有领先的LLM和法律knowhow,从而能更好满足律所和企业客户的需求。



4. 产品化及Go-to-Market的能力产品化能力为目前所有LLM+垂类行业的重中之重,如何在大模型提供民主化的核心智能、以及数据壁垒不明显的情况下,做出产品来更好且快的满足客户需求成为了公司的核心能力;不论是还在内测的Harvey,还是国内的几家公司,都拥有做出优秀产品的潜质;而如何更好的Go-to-Market也至关重要,不论是早期冷启动获得头部订单以快速转动数据和业务飞轮,还是选择整条法律服务价值链的切入点(如诉讼业务通常更复杂、有更高价值,如果消耗资源类似,应该优先选择)。



5. 数据安全问题的解决由于法律行业本身数据非常敏感,聘请律所提供法律服务的企业客户通常会担心自己的隐私数据泄漏,甚至成为LLM训练数据的一部分,LLM法律公司会使用人为最终审查(由律师)、高级别加密保护、服务器隔离、私有化部署等方式以消除客户疑虑,谁能在数据安全与隐私上赢得客户信任也将成为重要的竞争因素。



潜在风险


1. 数据隐私问题(privacy laws):客户担心自己的隐私数据变成训练LLM的一部分,因此如何通过人为最终审查(由律师)、高级别加密保护、服务器隔离、私有化部署等方式,以及对客户的教育,成为能否获得头部标杆客户及广泛市场认可的关键。


2. LLM幻觉问题:生成新text上,出现幻觉概率更高;解决方案包括用大量法律数据集进行fine-tune,使用向量数据库等,但目前依旧没有特别完美的解决方案。


3. 国内特有的海外模型使用限制及相应的大模型与产品备案:目前来看,中国to-B的GPT应用依旧属于灰色地带,如果在国内提供服务的AI法律公司需要认真审视相应风险;而关于备案,则应该紧跟新增的法规,如8月15日新出的大模型备案规则。



一点未来推演...


AI Tools - AI Copilot - AI Agent - AI everything的发展趋势


1. AI Tools阶段:LLM爆发之前的LegalTech属于这个阶段,如DocuSign:在这个阶段,技术主要是作为工具存在,例如文本编辑器、数据库搜索引擎等,这些工具在律师的日常工作中起到辅助作用。这些工具没有智能,只是简化了信息检索和文档编辑等任务。


2. AI Copilot阶段:LLM爆发之际的AI LegalTech属于此,包括Harvey、 Cocounsel、Donotpay:目前,我们正处于这个阶段,其中包括像Harvey和Casetext/CoCounsel这样的产品。这些产品使用AI和大型语言模型(如GPT-4)来进行更复杂的任务,例如法律研究、合同分析和证词准备。这些产品不仅仅是工具,它们更像是“副驾驶员”,能够理解复杂的法律问题并给出专业建议。


3. AI Agent阶段:诸多创业公司在朝着这个方向前进,旨在高比例替代律师的原有工作流:在这个阶段,AI将更加智能和自主,能够作为一个独立的“代理”执行更复杂的任务。例如,AI可能会自动与客户进行初步咨询,收集案件相关信息,甚至进行初步的法律分析和建议。这将极大地提高律师的工作效率,并可能改变律师事务所的运营模式。


4. AI Everything阶段:甚至包括本来高价值的诉讼环节,都可能被法律专家LLM+人形机器人所替代:在这个极端的阶段,AI将足够智能,以至于可以替代大多数律师的工作。从咨询、起草、分析到出庭,所有这些都可以由AI完成。这将引发一系列伦理和法律问题,例如谁应该对AI的错误负责,以及如何确保AI的决策是公平和透明的。


【智合论坛2023·勇敢者归来】“法律前沿科技”分论坛,将汇聚一群行业领先者,共同探讨生成式AI给行业带来的影响。在这里,你将现场见证行业领先者的思想交锋,和优秀同行共同探索法律行业的未来。


2023年11月18日,我们不见不散!





责编 / 吴梦奇Scott
编辑 / 李媛媛Yoyo
分类 / 转载

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
法律界人士解读中山二院“患癌”风波:怎样通过法律维权与索赔?人形机器人革命:探索 Embodiment 技术的最新进展与商业化机会|活动报名“高息时代”的第一波冲击,市场的新“游戏规则”华南华中地区,谁将夺得律界奥斯卡?讯飞高管解读财报:星火大模型将实现对标ChatGPT 不受英伟达影响全球首创糖免疫疗法,诺奖得主的biotech如何颠覆癌症治疗?吾爱吾园(中)周末飞到巴塞罗那帝都传来重要信号!二手房的游戏规则,变了!开源大模型将“杀死”闭源模型?赠香港亚洲文化公司 总经理苏春霖战友Gen-2颠覆AI生成视频!一句话秒出4K高清大片,网友:彻底改变游戏规则谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱法律翻译 | 处于迷宫层叠:联合国税收公约能否改变游戏规则?You can fail at what you don\'t want, so you might as well takeOpenAI 用45分钟重塑游戏规则!干掉 MJ、LangChain,创造“不会编程的应用开发者”新职业大模型将如何改变互联网广告的全链路?你抢到首批 iPhone15 了吗 / 花西子事件后老牌国货销量暴涨 / 腾讯混元大模型将陆续对公众开放 | 未来周报中东危局或「重置」原油市场游戏规则小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大奎芯科技王晓阳:大模型游戏规则下,内存互联+Chiplet新方案推动国产化丨GACS 2023全文 | 国务院《上海自贸区方案》:率先实施高标准数字贸易规则!涉及数据跨境规则、数据开放共享和治理规则西游记里也有职场潜规则?北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型大模型infra专场:大模型系统层工作 | 第16届中国R会议暨2023X-AGI大会Keras 3.0正式发布!一统TF/PyTorch/Jax三大后端框架,网友:改变游戏规则无需剧本和设计,智能NPC如何颠覆游戏业?Midjourney大更新:开放自定义风格新功能!网友:最改变游戏规则的一集能跟「猫主子」聊天了!生成式AI带来的全面革命:最快5年内破译第一种动物语言李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型一个人的午餐免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!毁三观!加拿大的小费也有潜规则?原来我们都给错了!!GPT-4版微软Win11下周二见;千亿参数生物医药大模型面世;DALL·E 3模型将接入Bing丨AIGC大事日报智慧城区,将如何颠覆产业互联网?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。