Redian新闻
>
大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

公众号新闻
Jiaxi 投稿自 凹非寺
量子位 | 公众号 QbitAI

北大团队新作,让大模型拥有个性!

而且还是自定义那种,16种MBTI都能选。

这样一来,即便是同一个大模型,不同性格下的回答都不一样。

比如提问:你周末喜欢干什么?

ENFP的大模型会说:喜欢参加社交活动,结识新朋友。

INFJ的大模型则回答:喜欢独自读过。

这样能干啥呢?北大的童鞋们列出来了一些情景

  • 在特殊节日,给你的男/女朋友寻找心仪的礼物

  • 了解你关注的那个Ta在不同情境下的反应。

  • 深入理解大模型的定制化、个性化的方式及可能性。

  • 在做出重大决策时,考虑不同情境下的个性特征。

  • 通过深入了解人性的复杂性,促进个人成长和相互理解。

这项工作由FarReel AI Lab(前身是ChatLaw项目)和北大深研院合作研发,支持给开源模型赋予性格。

目前已开源32个模型和数据集。

具体如何实现?一起来看原理~

已开放32个有个性模型

在此之前,想让大模型具备一定个性,最常用的方法是利用提示工程

比如Character.ai上不同性格的对话bot,就是用户通过提示工程调教出来的。

不过这种方式带来的效果不完全稳定。

所以北大团队提出了一种方法,他们自主构建了十万条大规模MBTI数据,然后通过多阶段预训练、微调、DPO训练方法为它注入性格。

数据集方面,主要分为两种,行为数据集自我意识数据集

行为数据集的目的是为了让大模型可以表现出不同性格的回应,这部分是对Alpaca数据集进行个性化修改实现。

行为数据集中MBTI四个维度的比例如下:

自我意识数据集是为了让大模型能够意识到自己的个性特征。

通过一个两阶段的有监督训练微调过程,最后可以得到对应人格的大模型。

以训练一个INFP大模型为例,在第一阶段的有监督微调中利用行为数据集中“I”、“N”、“F”、“P”四个数据集,在第二阶段的有监督微调中,再使用一个额外的自我意识数据集。

研究团队表示,这种方法成功使Baichuan、Qwen、LLaMA、Mistral等模型完成不同MBTI类型的性格对齐任务。

首先开放的是基于Baichuan-7b-chat的16个中文模型以及基于LLaMA2-7b的16个英文模型。后续还将做更多补充。

最后得到的训练结果如下。

ENFP问答结果

ENTJ问答结果

INFP问答结果

ISTJ问答结果

数据集方面,团队开源了MBTI训练数据集

数据集涵盖了丰富多样的场景,旨在帮助研究者和开发者训练出能够理解和模拟不同 MBTI 性格的基座模型。这些模型不仅能够提供更加人性化的互动体验,还能够在多种情境下提供精准的心理学洞察。

对于这项工作的思考,研究团队认为人类的思维就像从出生就拥有的一个预训练模型,每个人的参数、训练数据可能不尽相同,这也导致我们的一些抽象思维和能力不同,长大后有人擅长数理逻辑、有人擅长情感演绎。

而之后从小到大的学习、环境、经历的事情都相当于是在对我们的预训练大脑进行微调和人类反馈对齐,这样来看,所谓的MBTI性格基本都是后天环境因素影响下形成的,这也导致每个人都独具特色。

也就是说可以尝试用微调人类反馈对齐(DPO),去对各种预训练的基座LLM进行分阶段的训练,从而让模型拥有不同的MBTI属性。

团队的目标不仅是使这些模型拥有不同的MBTI属性,还要模拟人类形成不同MBTI性格的过程。

他们相信,这一独特的方法将为我们在人格心理学领域理解和利用大语言模型开辟新的途径。请继续关注更多的发展,因为我们继续探索语言模型和人类个性的令人着迷的交汇点。

GitHub:https://github.com/PKU-YuanGroup/Machine-Mindset

数据集:https://huggingface.co/datasets/FarReelAILab/Machine_Mindset

HuggingFace试用链接:https://huggingface.co/spaces/FarReelAILab/Machine_Mindset

ModelScope试用链接:https://modelscope.cn/studios/FarReelAILab/Machine_Mindset


—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【暖冬神器1】真正的暖脚、暖腿神器!夏婳:两情难相知(完结篇)头像|𝐒𝐡𝐚𝐫𝐞·招桃花头像今天送 notitle x adidas Samba,聊聊#最好的一双SambaMBTA维修绿线地铁,1月清除16个减速区!2月下旬施工继续90后团队出海,用二次元滤镜霸榜日韩鸿发超市「2000 万美元」买下82街前Walmart超市!开设第4家Hông Phát分店!法律ChatLaw、金融度小满轩辕大模型实战课程来袭!专家教你搭建 AI 原生应用,更有百度智能云千帆 SDK 加速应用创新中国内容团队出海的秘密,藏在这支PV里免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解过冬必备神器!1秒速热,3D动态火焰,一台让你暖如初夏专注图表理解,腾讯、南洋理工等开源图表羊驼大模型ChartLlama大模型RAG问答技术架构及核心模块回顾:从Embedding、prompt-embedding到Reranker今日Arxiv最热NLP大模型论文:Meta自我奖励模型超越人类反馈限制,刷新AlpacaEval 2.0排行榜2023创业家年会关键词是“AI”;百度发布Q3财报;拼多多成立大模型团队;字节飞书接入大模型;比尔·盖茨最新分享川 普副手人选 欧洲网络博弈赌盘最看好斯特凡尼克 拜 登贸易政策受挫 团队出走 戴琪被指领导不力《英语900句》主持人何丽达去世人脸编辑神器!浙大&腾讯提出FaceX:统一面部表征建立通用人脸编辑模型法律 ChatLaw、金融度小满轩辕大模型实战课程来袭!专家教你搭建 AI 原生应用,百度智能云千帆 SDK 加速应用创新7B开源数学模型干翻千亿GPT-4,中国团队出品《推开这扇门》&《又是一年冬天》6048 血壮山河 卢沟桥之变 17AI机器人做满汉全席?! 斯坦福华人团队出品,做饭洗碗家务包干!免费《大模型应用实践》实训营第二周课程来啦!这次百度算法工程师团队手把手教你构建大模型应用,另有第一周干货回顾!AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报Memory of this dayHow Chinese Officials Are Subtly Promoting Having ChildrenAI早知道|北大团队推出MBTI神器;OpenAI取消AI模型对军用应用的禁令AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 DebugChatGPT危险了!大批留学生转用新AI神器!翻译润色、文献综述、数据分析、讲解公式,啥都行!今日arXiv最热NLP大模型论文:北京大学警惕ChatGPT等大模型遏制人类的创新能力AI早知道|自定义ChatGPT商店下周上线;腾讯推出语音识别大模型;美图大模型上线无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。