法律界的AI革命:大模型将如何颠覆游戏规则?
法律行业自古有之,是一个相对保守且精英化的行业,不论在对新科技的采用还是整体的线上化,都相对较慢;LegalTech(法律科技)也一直是一个相对价值较“薄”的行业,虽然也支撑起诸如LegalZoom、DocuSign等上市公司,但相比Martech(营销科技)、Fintech(金融科技)等行业,发展较为缓慢。
然而我们发现,生成式AI大模型,如GPT-4、Claude、GLM,基于其较好的复杂推理能力与非结构化信息处理上,拥有前所未有的能力;而法律恰恰有大量非结构化文本沉淀且对推理能力要求较高、是智力密集型行业,以律师的billing hours为核心的价值提供,因此新科技如生成式AI或将为行业大幅降本增效,提供足够显性且有破坏性的价值,而迅速成为Legaltech的重要一部分。
本文,我们深度聚焦AI法律领域,结合海外的最新动向,以发掘出潜在的创业与投资机会,Enjoy~
(图绘制自Midjourney)
行业引爆点 Hook
1.知识和推理能力上的爆发:美国伊利诺伊理工大学-芝加哥肯特法学院宣布,GPT-4通过了美国律师资格考试、并且成绩排名上超过90%的考生,而上一代GPT-3.5参加该考试还排在倒数10%,意味着LLM在法律垂类知识和推理能力上正式完成从零到一的跃迁。
2. 投融资的爆发:Harvey拿到OpenAI Startup Fund的首轮融资500万美元,以及红杉资本领投、OpenAI Startup Fund跟投的2100万美元,正式引爆AI法律的创投行业热潮。
行业Overview
法律行业原有状况:LegalTech在LLM爆火之前,主要有2波浪潮
1. 2000-2011年,包括Docusign和Clio等传统SaaS工作流产品,以及Avvo和LegalZoom等,主要关注执业管理、文档自动化、文件存储、财务管理等方面。
2. 2012-2020年,AI开始更多介入LegelTech领域,带来平台级的提升,一些典型的公司包括 ContractPod AI 和 DISCO 等,通过LegalTech产品直接为客户提供法律服务,初步减少了咨询律师的需求并降低了律师与客户双边匹配的成本。
虽然之前已有两波浪潮,但整体来看,法律行业依旧处在技术渗透率和在线化率低的情况,仅8%;我们判断有以下两点核心原因:
1. 法律行业的工作流定义明确+价值高,但对幻觉的容忍度/准确率要求高,因此难以做出generalized tools - 甚至律所及律师的工作习惯还停留在用word和email等传统工具上。
2. 受传统规则(工作方式传统)和商业模式(按照小时付费)约束较大,因此技术渗透率和在线化率低。
后验来看,的确如此。之前LegalTech的核心价值来自电子签名和合同管理等细分领域,聚焦法律服务细分环节的深挖,以捕捉尽可能高比例的价值,如于2018年上市的DocuSign,拥有140万个客户和27亿美元的营收,占据了70%的电子签名市场,但天花板依旧受限于市场规模
目前LegalTech上市公司共8家,分别是最早上市的DocuSign(2018年上市,电子签名业务为主)、2021年上市的Nuix、LegalZoom、CS Disco、Intapp四家、之后Evisort、Ironclad、Elevate三家宣布上市计划;LegalZoom是法律电商平台,Elevate是综合性法律服务提供商,其余6家均为软件公司。
法律行业能够
被生成式AI颠覆的原因
核心逻辑:有降本增效的需求+中长尾未被满足的c端需求,二者相加可能有十倍以上的增量价值
1. 降本增效的强烈需求来自于巨大的行业规模以及行业的昂贵人力成本以及routine paperwork被AI替代的潜力
a. 行业规模巨大:从钱上看,全球法律行业的市场规模将于2030年成长为万亿美金的规模,CAGR在6%+;从人上看,美国有135万律师,中国有近60万(中国所有法律从业人员在300万以上),全球共2000万名律师。 b. 行业很贵、律师行业的人力成本非常高(培养律师很贵、billing hours也很贵):而律师的工作环节中大量存在重复性的paperwork,具体可分为客户诉求的沟通和拆分、法律研究、客户方案设计、合同、诉讼文书及其他文件的处理;法律行业有大量的paperwork可以被AI替代。
2. 中长尾有大量未被满足的需求(access to justice):法律专业服务的门槛被降低(AI带来的供给增加以及成本降低)、因此更多c端用户可以access到优质法律服务
具体到AI法律上,行业处在爆发前夜,通过破坏性技术创新,快速渗透到行业全价值链,仅仅2023年,AI法律行业就将从9.4亿美元,上涨到23.9亿美元,增速超过250%。 核心驱动力为LLM的能力:拥有复杂推理能力+非结构化信息的处理能力,以至于能够在text-in text-out等情况下,边际成本近乎于零的输出准确率较高的答案,比如当一个普通用户提问一些关于婚姻法的具体案例,被微调过的法律专家模型可以一秒给出相对置信度较高的判罚讲解;因此能够大幅降本增效,让律师专注于提供client-facing和核心高价值提供(如诉讼)。
3. 高标准化+本身价值高的的需求将先被serve,比如诉讼业务
高精尖 vs 基础简单业务:高精尖包括诉讼业务、知识产权、并购、重大商业谈判等cases(通常是专项服务),劳动争议/交通事故、保险索赔等相对简单;常年顾问一般是相对简单的通用知识服务(可代替性超过70%)
海内外法律服务市场的核心差异
市场差异
1. 海内外的TO-B/To-L市场上,海外更成熟、中国相对初期:1)海外的SaaS更成熟、云化好/线上化成熟;因此To-B更可能做出东西 2)国内的SaaS一直存在天花板低,付费意愿差,头部客户以央国企的定制化需求为主,因此更难scale。
海外市场竞争格局
核心分为三类:三者均有AI法律的头部产品跑出
1.传统法律服务公司:增加了LLM驱动的功能,如LexisNexis、Disco、WestLaw、Aderant 2. 相对成熟的LegalTech公司:加入了最新的LLM功能,如DoNotPay、Robin、Gavel、Spellbook等 3. LLM原生的AI法律公司:如Harvey、E-Legal、AI Lawyer等
核心公司分析
1. Harvey:拥有LLM专家和资深律师的顶级复合背景,以及OpenAI的官方背书,通过为客户构建定制模型,以提供效果更优的通用律师Copilot,在LLM法律行业中处在头部领先地位
公司简介:2022年1月成立于美国华盛顿特区,专注于为通过法律Copilot的形式,为律所和律师提升工作效率,包括使用AI替代研究、起草、分析等paperwork。
创始团队:「Harvey」由Winston Weinberg和Gabriel Pereyra两人联合创立,前者曾是O’Melveny & Myers律师事务所的证券和反垄断诉讼律师,后者曾是DeepMind、Google Brain和Meta AI的研究人员。两人在接触到OpenAI的GPT-3文本生成系统后,意识到可以利用这一技术改善法律工作流程。
产品情况:通过fine-tune过的法律专家大模型,帮助律师完成合同分析、监管合规、索赔管理、尽职调查及更广泛的法律咨询服务;专注于为客户构建定制模型,以达到更好的效果。技术路线:基于GPT-4进行fine-tune,为最早接入GPT-4大模型的公司之一;最终输出需要经由律师的审查,以保证产出结果及隐私保护。
业务数据:客户主要为大律所和其他有强法律需求的专业机构,如国际律所Allen & Overy和头部会计师事务所普华永道,其中一半的应用来自于北美;目前已经有超过1.5万家机构在其waitlist上。
融资情况:Harvey累计融资2600万美元,目前估值为1.5亿美元。在获得OpenAI领投的500万美元天使轮融资后,Harvey又获得了红杉资本领投的2100万美元A轮融资,其他投资方包括OpenAI Startup Fund、SV Angel和Elad Gil等。
竞争优势:1)OpenAI资源扶持优势:由于较早拿到了OpenAI的投资,在大模型fine-tune和使用上有先发和协同优势 2)创始团队拥有法律和大模型的复合背景:在大模型在垂类的应用上有显著knowhow优势。
核心成功因素 KSF
结合以上四家以及Spellbook、Evenup、Robin AI等其他海外LLM法律头部公司,以及国内的幂律智能、语炎智能等获得融资的LLM法律公司,我们发现,公司最为核心的能力主要包括以下五点
1. 垂类大模型的训练能力:虽然在各个垂直领域中,准确性最优解可能来源于从0开始预训练大模型,如BloombergGPT,然而多数LLM法律公司依旧选择了对已经相对成熟的LLM,如GPT-4、Claude,国内的GLM等进行fine-tune,通过高质量法律数据的训练,以提高其准确性和实用效果;而如何更好的进行fine-tune以达到更好的效果,则需要创始团队在LLM训练上的knowhow,包括如何选择LLM(如Harvey选择独一使用GPT-4),更好的清洗处理数据、如何工程化以至于达到更好训练效果、如何尽可能好的满足成本效益等。
2. 行业专业数据:对于LLM法律公司来说,能够训练出优质专业LLM的前提是能够更好积累较为优质的垂类数据,否则会Garbage in, Garbage out;同样,如果想积累优质的专业向量数据库用于AI检索,也依赖于优质的数据积累,如Lexis AI+借助母公司LexisNexis的帮助能够更好的获取和使用数据、Casetext借助其之前的客户资源和汤森路透的产业协同也能获得大量优质的垂类数据
潜在风险
1. 数据隐私问题(privacy laws):客户担心自己的隐私数据变成训练LLM的一部分,因此如何通过人为最终审查(由律师)、高级别加密保护、服务器隔离、私有化部署等方式,以及对客户的教育,成为能否获得头部标杆客户及广泛市场认可的关键。
2. LLM幻觉问题:生成新text上,出现幻觉概率更高;解决方案包括用大量法律数据集进行fine-tune,使用向量数据库等,但目前依旧没有特别完美的解决方案。
3. 国内特有的海外模型使用限制及相应的大模型与产品备案:目前来看,中国to-B的GPT应用依旧属于灰色地带,如果在国内提供服务的AI法律公司需要认真审视相应风险;而关于备案,则应该紧跟新增的法规,如8月15日新出的大模型备案规则。
一点未来推演...
AI Tools - AI Copilot - AI Agent - AI everything的发展趋势
1. AI Tools阶段:LLM爆发之前的LegalTech属于这个阶段,如DocuSign:在这个阶段,技术主要是作为工具存在,例如文本编辑器、数据库搜索引擎等,这些工具在律师的日常工作中起到辅助作用。这些工具没有智能,只是简化了信息检索和文档编辑等任务。
2. AI Copilot阶段:LLM爆发之际的AI LegalTech属于此,包括Harvey、 Cocounsel、Donotpay:目前,我们正处于这个阶段,其中包括像Harvey和Casetext/CoCounsel这样的产品。这些产品使用AI和大型语言模型(如GPT-4)来进行更复杂的任务,例如法律研究、合同分析和证词准备。这些产品不仅仅是工具,它们更像是“副驾驶员”,能够理解复杂的法律问题并给出专业建议。
3. AI Agent阶段:诸多创业公司在朝着这个方向前进,旨在高比例替代律师的原有工作流:在这个阶段,AI将更加智能和自主,能够作为一个独立的“代理”执行更复杂的任务。例如,AI可能会自动与客户进行初步咨询,收集案件相关信息,甚至进行初步的法律分析和建议。这将极大地提高律师的工作效率,并可能改变律师事务所的运营模式。
4. AI Everything阶段:甚至包括本来高价值的诉讼环节,都可能被法律专家LLM+人形机器人所替代:在这个极端的阶段,AI将足够智能,以至于可以替代大多数律师的工作。从咨询、起草、分析到出庭,所有这些都可以由AI完成。这将引发一系列伦理和法律问题,例如谁应该对AI的错误负责,以及如何确保AI的决策是公平和透明的。
【智合论坛2023·勇敢者归来】“法律前沿科技”分论坛,将汇聚一群行业领先者,共同探讨生成式AI给行业带来的影响。在这里,你将现场见证行业领先者的思想交锋,和优秀同行共同探索法律行业的未来。
2023年11月18日,我们不见不散!
微信扫码关注该文公众号作者