Redian新闻
>
OpenAI开放大模型微调功能!上传自己数据就可定制GPT-3.5Turbo,开发者狂喜

OpenAI开放大模型微调功能!上传自己数据就可定制GPT-3.5Turbo,开发者狂喜

公众号新闻
白交 发自 凹非寺
量子位 | 公众号 QbitAI

现在,GPT-3.5 Turbo支持自定义微调了!

只需上传自己的数据,就可以运行专属的定制大模型。

开发者狂喜!不少人惊呼:Awesome!

早期测试表明,经过微调的GPT-3.5 Turbo版本在某些任务中甚至可以超越GPT-4。

更新之余,OpenAI还直接明示了定价计划,微调费用主要分为初始训练费用和使用费用。

一个具有10万tokens训练数据集的微调工作(3个epoch训练)成本大概在2.40美元。

此外,OpenAI还透露了GPT-4微调将于今年秋天推出。

不过也有人不吃这套,吐槽微调成本太高,其生成成本是基础模型的8倍,必须要按照他们所说“将提示大小减小90%”,才能从中获取效益。

开发者自己进行监督微调

OpenAI首先给出了指南手册,微调可以用来改进这些模型性能。

  • 可操纵性的改进,模型能够更好地遵循指令。比如输出简洁回答或始终以给定的语言响应。

  • 一致的格式化响应,开发人员可用微调将用户提示转换为高质量JSON代码片段,随后用于自己的系统。

  • 定制语气,微调可以更好磨炼模型输出的质感,比如语气,让它更适合企业品牌的声音。

除了提高性能之外,还能缩短提示时间,确保类似性能。另外,微调目前仅支持处理4000 tokens,这也是此前微调型号的两倍。16k tokens微调将于今年秋季推出。

早期测试人员通过对模型本身指令进行微调,加快了API调用还降低成本,让prompt减少了90%。

对函数调用结合和 gpt-3.5-turbo-16k的微调支持将在今年秋季晚些时候推出。

具体微调步骤,分为四步:

准备数据

{
  "messages": [
    { "role""system""content""You are an assistant that occasionally misspells words" },
    { "role""user""content""Tell me a story." },
    { "role""assistant""content""One day a student went to schoool." }
  ]

上传文件

curl -https://api.openai.com/v1/files \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F "purpose=fine-tune" \
  -F "file=@path_to_your_file" 

创建微调作业

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "training_file""TRAINING_FILE_ID",
  "model""gpt-3.5-turbo-0613",
}'

使用微调模型

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "model""ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role""system",
      "content""You are an assistant that occasionally misspells words"
    },
    {
      "role""user",
      "content""Hello! What is fine-tuning?"
    }
  ]
}'

OpenAI透露,未来他们将推出微调UI,这样轻松访问正在进行中的工作。

定价方面,分为训练成本和使用成本。

  • 训练:0.008美元/1000 tokens;

  • 使用输入:0.012美元/1000 tokens;

  • 使用输出:0.016 美元/1000 tokens。

不过可以看到的是,价格确实比基础模型高了不少。

更新了GPT-3模型

与此同时,OpenAI还在API端口更新了GPT-3模型:babbage-002 和 davinci-002。

这些模型都可以用新的API端点进行微调。

原始基础模型 (ada, babbage, curie, 和 davinci)将于明年*(2024年)1月4日关闭。

好了,感兴趣的朋友可以开始定制自己的GPT-3.5Turbo了。

参考链接:
[1]https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates

[2]https://news.ycombinator.com/item?id=37227139

「量子位智库·仿生机器人沙龙」招募中

9月6日,「量子位智库·仿生机器人沙龙」将在北京中关村举办,欢迎全行业仿生机器人玩家参与 ~

点击图片了解详情,企业报名可联系活动负责人王琳玉(微信:iris_wang17,请备注企业+姓名)。沙龙观众通道后续开放,敬请期待 ~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报上传自己照片到伦敦巨幕?伦敦2大最好玩巨幕占尽风头,免费看展/沉浸式体验!智能周报|OpenAI发布ChatGPT企业版,预计今年营收10亿美元;首批11家国产大模型「获批」,不包括阿里巴巴通义大模型OpenAI不藏着了,开放微调功能,不用其他工具就能搞一个你自己的ChatGPTHugging Face获 2.35亿美元D轮融资 | OpenAI推出定制化微调功能 | 英伟达财报逆天 | 那个男人回归XChatGPT增六项功能,GPT-4成默认模型,可上传文件、用快捷键小米一开源项目被批“三无”,项目导师回应;Ruby on Rails之父将TypeScript从Turbo框架中移除 | Q资讯将混合专家推向极限:只需更新0.32%的参数就能完成模型微调2023 樱花之约(五)雨中涉成园GPT-3.5 Turbo支持微调了,打造专属ChatGPT,但价格小贵一行代码提高大模型10%性能,开发者:免费午餐极少数据就能微调大模型,一文详解LoRA等方法的运作原理OpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南英伟达推出大模型加速包;Meta将训练对标GPT-4的大模型;ChatGPT等成费水大户丨AIGC大事日报华裔妹子上传自己头像后引起网络轰动...不要予人有大恩,不要非奸即盗在微信上和朋友打坐0.2美元微调就能让ChatGPT彻底破防!普林斯顿、斯坦福发布LLM风险预警:普通用户微调也影响LLM安全性吉利将推自研大模型;OpenAI提交GPT-5商标申请;谷歌助手拟引入大模型丨AIGC大事日报硬核观察 #1052 libjpeg-turbo 3.0 发布,开发者表示无力继续GPT-5不远了!OpenAI推出网络爬虫GPTBot,自动抓取数据,可选择性关闭携程回应李彦宏辞任董事;OpenAI新功能:可以给ChatGPT定制人格角色;上海将暂停受理网约车运输证相关业务丨邦早报重磅!OpenAI 开放 GPT-3.5 Turbo 微调,网友:要提示词减少8倍才实惠几张照片即可定制自己的3D化身,还能换装!南京大学发布AvatarBooth:3D模型的制作门槛被打下来了!大模型微调样本构造的trickOpenAI 开放 GPT-3.5 Turbo 微调,网友:将prompt减少90%才实惠趣图:初级开发者 VS 高级开发者《月光下的诉说》&《你可听见我这颗心》ChatGPT 新增六项功能,GPT-4 成默认模型,可上传文件、用快捷键腾讯混元大模型正式亮相;OpenAI首届开发者大会定档;苹果扩大AI预算|AIGC周观察第十八期OpenAI发布给ChatGPT定制人格角色的新功能;苹果已悄悄开发Apple GPT|AIGC周观察第十一期无GPT-5或4.5,两月后OpenAI首届开发者大会要发的新东西,引热猜GPT-3.5 Turbo推出微调功能;昆仑万维天工AI搜索引擎内测;阿里云等联合发布教育大模型开发成本降至5%!OpenAI计划推出新功能吸引开发者,也稳住用他们模型亏损的“大冤种”客户既然永不相见,何不一拍两散 ?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。