Redian新闻
>
OpenAI开放大模型微调功能!上传自己数据就可定制GPT-3.5Turbo,开发者狂喜

OpenAI开放大模型微调功能!上传自己数据就可定制GPT-3.5Turbo,开发者狂喜

公众号新闻
白交 发自 凹非寺
量子位 | 公众号 QbitAI

现在,GPT-3.5 Turbo支持自定义微调了!

只需上传自己的数据,就可以运行专属的定制大模型。

开发者狂喜!不少人惊呼:Awesome!

早期测试表明,经过微调的GPT-3.5 Turbo版本在某些任务中甚至可以超越GPT-4。

更新之余,OpenAI还直接明示了定价计划,微调费用主要分为初始训练费用和使用费用。

一个具有10万tokens训练数据集的微调工作(3个epoch训练)成本大概在2.40美元。

此外,OpenAI还透露了GPT-4微调将于今年秋天推出。

不过也有人不吃这套,吐槽微调成本太高,其生成成本是基础模型的8倍,必须要按照他们所说“将提示大小减小90%”,才能从中获取效益。

开发者自己进行监督微调

OpenAI首先给出了指南手册,微调可以用来改进这些模型性能。

  • 可操纵性的改进,模型能够更好地遵循指令。比如输出简洁回答或始终以给定的语言响应。

  • 一致的格式化响应,开发人员可用微调将用户提示转换为高质量JSON代码片段,随后用于自己的系统。

  • 定制语气,微调可以更好磨炼模型输出的质感,比如语气,让它更适合企业品牌的声音。

除了提高性能之外,还能缩短提示时间,确保类似性能。另外,微调目前仅支持处理4000 tokens,这也是此前微调型号的两倍。16k tokens微调将于今年秋季推出。

早期测试人员通过对模型本身指令进行微调,加快了API调用还降低成本,让prompt减少了90%。

对函数调用结合和 gpt-3.5-turbo-16k的微调支持将在今年秋季晚些时候推出。

具体微调步骤,分为四步:

准备数据

{
  "messages": [
    { "role""system""content""You are an assistant that occasionally misspells words" },
    { "role""user""content""Tell me a story." },
    { "role""assistant""content""One day a student went to schoool." }
  ]

上传文件

curl -https://api.openai.com/v1/files \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F "purpose=fine-tune" \
  -F "file=@path_to_your_file" 

创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "training_file""TRAINING_FILE_ID",
  "model""gpt-3.5-turbo-0613",
}'

使用微调模型

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "model""ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role""system",
      "content""You are an assistant that occasionally misspells words"
    },
    {
      "role""user",
      "content""Hello! What is fine-tuning?"
    }
  ]
}'

OpenAI透露,未来他们将推出微调UI,这样轻松访问正在进行中的工作。

定价方面,分为训练成本和使用成本。

  • 训练:0.008美元/1000 tokens;

  • 使用输入:0.012美元/1000 tokens;

  • 使用输出:0.016 美元/1000 tokens。

不过可以看到的是,价格确实比基础模型高了不少。

更新了GPT-3模型

与此同时,OpenAI还在API端口更新了GPT-3模型:babbage-002 和 davinci-002。

这些模型都可以用新的API端点进行微调。

原始基础模型 (ada, babbage, curie, 和 davinci)将于明年*(2024年)1月4日关闭。

好了,感兴趣的朋友可以开始定制自己的GPT-3.5Turbo了。

参考链接:
[1]https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates

[2]https://news.ycombinator.com/item?id=37227139

「量子位智库·仿生机器人沙龙」招募中

9月6日,「量子位智库·仿生机器人沙龙」将在北京中关村举办,欢迎全行业仿生机器人玩家参与 ~

点击图片了解详情,企业报名可联系活动负责人王琳玉(微信:iris_wang17,请备注企业+姓名)。沙龙观众通道后续开放,敬请期待 ~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
米兰时装周:胶囊衣橱爱好者狂喜吉利将推自研大模型;OpenAI提交GPT-5商标申请;谷歌助手拟引入大模型丨AIGC大事日报将混合专家推向极限:只需更新0.32%的参数就能完成模型微调Hugging Face获 2.35亿美元D轮融资 | OpenAI推出定制化微调功能 | 英伟达财报逆天 | 那个男人回归X0.2美元微调就能让ChatGPT彻底破防!普林斯顿、斯坦福发布LLM风险预警:普通用户微调也影响LLM安全性《月光下的诉说》&《你可听见我这颗心》GPT-3.5 Turbo支持微调了,打造专属ChatGPT,但价格小贵小米一开源项目被批“三无”,项目导师回应;Ruby on Rails之父将TypeScript从Turbo框架中移除 | Q资讯英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报见过最舒爽的做家务视频,强迫症患者狂喜!2023 樱花之约(五)雨中涉成园腾讯混元大模型正式亮相;OpenAI首届开发者大会定档;苹果扩大AI预算|AIGC周观察第十八期OpenAI发布给ChatGPT定制人格角色的新功能;苹果已悄悄开发Apple GPT|AIGC周观察第十一期既然永不相见,何不一拍两散 ?开发成本降至5%!OpenAI计划推出新功能吸引开发者,也稳住用他们模型亏损的“大冤种”客户OpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南极少数据就能微调大模型,一文详解LoRA等方法的运作原理硬核观察 #1052 libjpeg-turbo 3.0 发布,开发者表示无力继续OpenAI不藏着了,开放微调功能,不用其他工具就能搞一个你自己的ChatGPTGPT-3.5 Turbo推出微调功能;昆仑万维天工AI搜索引擎内测;阿里云等联合发布教育大模型智能周报|OpenAI发布ChatGPT企业版,预计今年营收10亿美元;首批11家国产大模型「获批」,不包括阿里巴巴通义大模型ChatGPT 新增六项功能,GPT-4 成默认模型,可上传文件、用快捷键重磅!OpenAI 开放 GPT-3.5 Turbo 微调,网友:要提示词减少8倍才实惠不要予人有大恩,不要非奸即盗OpenAI 开放 GPT-3.5 Turbo 微调,网友:将prompt减少90%才实惠在微信上和朋友打坐澳洲各地本周末天气一览!悉尼将迎85年来最干燥冬季,滑雪爱好者狂喜!GPT-5不远了!OpenAI推出网络爬虫GPTBot,自动抓取数据,可选择性关闭数码爱好者狂喜!亚马逊这次打折太狠了...上传自己照片到伦敦巨幕?伦敦2大最好玩巨幕占尽风头,免费看展/沉浸式体验!华裔妹子上传自己头像后引起网络轰动...ChatGPT增六项功能,GPT-4成默认模型,可上传文件、用快捷键大模型微调样本构造的trick携程回应李彦宏辞任董事;OpenAI新功能:可以给ChatGPT定制人格角色;上海将暂停受理网约车运输证相关业务丨邦早报几张照片即可定制自己的3D化身,还能换装!南京大学发布AvatarBooth:3D模型的制作门槛被打下来了!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。