Redian新闻
>
一份来自政治学研究者的大模型“实用指南”

一份来自政治学研究者的大模型“实用指南”

科技
 夕小瑶科技说 原创
 作者 | 小戏、python

大模型,对一个社会科学的研究者意味着什么?

如果抛开一些为了追新打快蹭热点而进行的类似大模型+万物的“交叉科学”与“跨界研究”,只是将大模型视为一个“强大的工具”,那么这种“智能工具”如何赋能社会科学研究呢?

最近,一些政治学领域的研究学者们从文本分析中的“数据标注”为切入点,为众多社会科学研究者提供了一份在文本分析研究中使用大模型的“实用指南”,论文作者发现,在文本分析的数据标注中使用大模型,不仅可以做到与人类标注者标注质量相当,而且还可以将标注成本降低 60%,标注时间降低近百倍。

论文题目:
How to Use Large Language Models for Text Coding: The Case of Fatherhood Roles in Public Policy

论文链接:
https://arxiv.org/pdf/2311.11844.pdf

早在深度学习的浪潮之初,许多社会科学研究者们就已经开始寻求使用譬如自然语言处理的技术扩展自己研究的范围以及降低自己的研究成本。计算机与相应文本分析、统计模型的引入可以使得研究者广泛无偏的挖掘与分析蕴藏在大量非结构化信息中的“社会议题”

举个例子,如果一个政治学研究者需要分析在公共政治话语中“父亲”这一语词的角色变化,以服务自己构建的政治分析理论,那么在使用相应这种计算机技术之前,从大量公共政策文件中抽丝剥茧对包含父亲的语词进行提取判断事实上是一种重复的体力劳动,并且受限于人力成本以及不可避免的分析者的个人判断选择,结论总是将会带有主观性与偶然性

在引入计算机技术之后,无疑借助计算机的信息处理能力使得政治学研究者们可以极大的扩展自己的研究边界与研究范围,以更广泛的数据支持自己的研究结论。但是,在进行文本分析尤其是文本编码任务之时,在垂直领域缺乏高质量的专用数据以及高昂的标注成本又成为了研究者们的拦路虎。

而大模型的出现,恰恰就可以在“数据标注”这一小任务中极大的解放研究者们的双手,甚至从这一步骤出发,大模型未来可能将会带来研究们进行文本分析的潜在规划、成本效率等等方面的巨大改变。那么到底如何才能高效的将大模型嵌入到社会科学学者们进行文本分析的工作流之中呢?这篇论文便以作者自己的一个研究课题“瑞典政治话语中的‘父亲角色’研究”来展示大模型如何赋能政治学研究。

首先,让我们先来介绍一些研究背景,这篇论文的作者们主要针对从 1993年到 2021 年间瑞典政府的政策文件,包含政府提案、报告、立法、调研文件等等,研究公共政治话语中传统的父亲角色如何转变为所谓的“New Father”

面对大量语料,作者首先将原始文本中含有“父亲(瑞典语中pappa、pappor、fader、fader、far)”的文本提取出来,通过使用词性标注器完成过滤后获得 1911 个句子,在得到初步的文本后,遵循这样一个研究步骤对问题进行分析:

  1. 根据理论分析,确定研究对象在文本中的类别种类;
  2. 手动构建一个包含数百示例的分类验证集以评估模型效果;
  3. 构建初始的 Prompt;
  4. 进行 Prompt 工程对提示进行微调;
  5. 依据最佳 Prompt 效果完成数据标注。

对应到父亲角色分析之中,作者从三个研究方面确定了父亲角色的分类标签,分别是:

  1. 父亲在家庭中的角色
    • 消极正向(PASSIVE):不参与家庭生活,不与孩子接触,仅仅作为家庭经济来源的提供者或家庭的保护者;
    • 积极负向(ACTIVE NEGATIVE):家庭生活中具有严厉、压迫、暴力、具有攻击性、体罚等的危险特征;
    • 关怀正向(ACTIVE POS CARING):家庭生活中具有关怀、温暖、培育、理解、同理心、倾听、安慰等温柔特征;
    • 冒险正向(ACTIVE POSITIVE DARING):家庭生活中具有冒险、大胆、挑战、运动、外向等积极特征;
    • 其他积极(ACTIVE POSITIVE OTHER):家庭生活中具有正向引领作用,譬如可靠、责任、信任等等能力但又部署于上述其他标签的角色;
    • 不适用(NOT APPLICABLE):文本中体现不出父亲的角色信息。
  2. 描述的明确性
    • 显式(EXPLICIT):正面介绍了父亲的角色;
    • 隐式(IMPLICIT):对父亲角色的描述包含在暗示之中。
  3. 描述的规范性
    • 事实(DESCRIPTIVE):描述性的介绍父亲角色的事实;
    • 理想(IDEAL):介绍父亲角色的理想状态。

基于确定好的分类标注,作者手动构建了 350 个句子分类作为模型的验证集,使用 OpenAI 的 GPT-3 与 GPT-4 模型进行实验。在构建 Prompt 的部分,作者使用英语(文本是瑞典语)书写指令,从语料库中,作者选择了 15 个例句,对模型进行 few-shot learning,并且组合三种任务下不同的标签与示例尝试了不同的 Prompt,针对上述三个任务,作者使用的 Instruction 分别为

  1. 父亲在家庭中的角色
  1. 描述的明确性
  1. 描述的规范性

从数据标注质量、速度与成本三个方面,作者对大模型应用于文本分析中的数据标注进行了评价,在质量上,作者发现大模型首先通过调整 temperature 参数获得比人类标注更加具有“一致性”的回答,而对于这个有时经过训练的人类标注者也会出错的任务而言,大模型,尤其是 GPT-4 获得了最佳的效果,全面优于 GPT-3 以及单个的人类标注者

而从速度上来看,大模型“标注” 1911 个句子的时间约为 16 分钟,而人类标注者每小时只能标注约 100 条句子,速度高过人类标注者百倍。从成本而言,调用 OpenAI 模型的成本是 94 美元,而人类标注者每小时工资为 12.35 美元,工作 19 个小时成本为 234.65 美元,是模型成本的 2.5 倍。当然,效果之外,作者也表示了对大模型的机器幻觉问题的担忧,当不可控的模型给出“不道德”的标注并以此用于政治学分析中,将有可能导致许多额外的问题。

最后的最后,作者讲到这篇别致的论文只是他们针对公共政治话语中“父亲”这一语词的角色变化研究的前置工作,更加理论性的分析将在后面的问题中进行,只是将这种“新方法”作为指南进行分享,期望开启在社会科学研究中从“亲自动手”到“LLM来做”的转变

尽管这篇论文提供的还仅仅是一个大模型最基础不过的应用,但是作为一个开始,我想大模型未来不仅仅将会变革计算机、生物、材料等等理工科学,也一定会成为政治、社会、心理等诸多人文社会科学研究者的最重要的工具与助手吧

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
年终岁末大清扫,干干净净迎新年!实用指南来了,一天干完三天活NECAA喜讯 | 主席王华、会长俞国梁 获颁麻州政治学校成立20周年20位杰出校友奖从0开始的青年律师成长实用指南叮,您有一份来自财神的祝福,请注意查收!今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS美国公民长期在中国,为配偶递交IR1/CR1移民申请的实用指南!为什么要给孩子读神话?《东方有神兽》——一份来自中国神话的邀请函!一份来自20余位LP的行业开年指南一份来自飞鹤的脑科学未来答卷地缘政治学的起源及演进科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新史上最“实用”的MBA新鲜出炉!LinkedIn的官方MBA排名NUS、NTU团队发布医疗大模型综述,全面介绍大模型在医疗领域的最新研究进展小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大从OpenAI宫斗狗血剧,看硅谷的“政治学”AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 DebugAI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布百度何俊杰:大模型向“实 ”, 以智能体商业重构营销秋日 风美中军方在悄悄重建沟通机制北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型探访全球5大百岁老人聚集区,一份“快乐长寿”秘笈,堪称最全“抗衰指南”!百川智能获阿里腾讯等3亿美元投资;vivo AI助手Jovi Copilot曝光;商汤推医疗健康大模型“大医”丨AIGC大事日报“眼泪政治学”?母亲大会上金正恩又哭了曝光!姚期智带领团队突破大模型“思维”框架,让机器思考更接近人类...今年德绒保暖内衣专场来了!这份来自深秋的温暖请查收~CAII香港科技大学:2023中国AI大模型工业应用指数报告《又见洛阳》第48集说明和节选红色日记 路线教育 7.27-31全面超越 AutoGPT,面壁智能联合清华 NLP 实验室打造大模型“超级英雄”—— XAgent以色列总理《对哈玛斯的最后通牒》赏读免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型精选书单丨三本政治学入门通识
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。