昨天,杭州大裁员了。。。
大家好,我是 Jack。
大模型 fine-tune,在各个领域百花齐放。
上两天发过一篇文章,介绍了一个基于 LLaMA 训练得到的 AI 医生咨询助手。
看不少小伙伴都感兴趣,咱今天再介绍一个法律领域的 LaWGPT。
LaWGPT
昨天,都在传,杭州互联网大厂裁员,消息铺天盖地,搞得人心惶惶。
合法裁员,给个 N+3 赔偿,那都还挺舒服。碰到非法裁员的,那咱就得拿起法律武器刚到底了。
比如问一问 LaWGPT,非法裁员咋么办?或者加班工资都怎么算?
输入:请问加班工资怎么算?
输入: 你能否写一段抢劫罪罪名的案情描述?
输入: 酒驾撞人怎么判刑?
效果还是可以的吧?
LaWGPT 的名字起得有些奇怪,因为看名字,第一眼以为是基于 GPT 训练的模型,结果一看内容发现是 LLaMA 训练的。
不过这都不重要,效果还是可以的。
项目地址:
https://github.com/pengxiao-song/LaWGPT
接下来,说下怎么运行算法。
不过这都不重要,我们先看下效果:
首先,创建虚拟环境,安装依赖。
# 下载代码
git clone [email protected]:pengxiao-song/LaWGPT.git
cd LaWGPT
# 创建环境
conda create -n lawgpt python=3.10 -y
conda activate lawgpt
pip install -r requirements.txt
其次,下载模型权重,这个项目获取权重的方法,需要自己合并模型,合并方法:
下载 chinese-llama-7b-merged 模型权重:
https://huggingface.co/minlik/chinese-llama-7b-merged/tree/main
下载 legal-lora-7b 模型权重:
https://huggingface.co/entity303/legal-lora-7b/tree/main
前者放到项目的 models/base_models 目录下,后者放到项目的 models/lora_weights 目录下。
然后运行权重合并脚本:
sh scripts/merge.sh
最后,我们就可以直接启动 UI 了:
bash scripts/webui.sh
浏览器打开本地服务:
http://127.0.0.1:7860
就能看到 UI 界面了。
整个项目的目录结构,还是挺清晰的。
LaWGPT
├── assets # 静态资源
├── resources # 项目资源
├── models # 基座模型及 lora 权重
│ ├── base_models
│ └── lora_weights
├── outputs # 指令微调的输出权重
├── data # 实验数据
├── scripts # 脚本目录
│ ├── finetune.sh # 指令微调脚本
│ └── webui.sh # 启动服务脚本
├── templates # prompt 模板
├── tools # 工具包
├── utils
├── train_clm.py # 二次训练
├── finetune.py # 指令微调
├── webui.py # 启动服务
├── README.md
└── requirements.txt
可以看到,项目也提供了 finetune 的代码,也能自己训练。
指令微调模型训练的方法,后面计划再出一期视频讲解了。
总之,也衷心希望接下来类似的裁员事件能少点,打工仔们不容易啊!碰到非法裁员,记得要用法律武器保护好自己的合法权益!
好了,今天就聊这么多吧,我是 Jack,我们下期见!
微信扫码关注该文公众号作者