Redian新闻
>
腾讯安全推出大模型隐私保护脱敏技术

腾讯安全推出大模型隐私保护脱敏技术

公众号新闻

作者 | Tina

大模型已经被广泛应用在各类场景,帮助人们进行报告摘要、文本翻译、数据分析、业务风控等各项工作,极大地提升了工作效率,但同时公众对于大模型带来的数据泄露的隐忧也从未停止。

近日,腾讯安全玄武实验室披露了一项关于大模型隐私保护的安全脱敏与还原(Hide and Seek, HaS)技术,有望帮助大模型产品使用者从本地终端侧防范隐私数据泄露。

HaS 为业内首个支持信息还原的自由文本脱敏技术,通过对用户上传给大模型的 prompt(提示词)进行隐私信息脱敏,并在大模型返回计算结果后进行恢复,该方案兼顾了隐私安全和计算资源消耗:脱敏与还原算法经过 4bit 量化后权重文件仅 500MB,可在手机、 PC 等终端上部署。

这是业内首个公开发布的、能被大模型用户部署于终端侧的隐私保护脱敏技术。借助这一技术,用户可以从“源头”免除使用云端大模型带来的数据泄露方面的担忧。

据悉,这个模型主要适用于典型的 NLP 任务场景,例如机器翻译、文本摘要,文本润色、阅读理解、文本分类、情感分析等,其主要的技术难点在于如何解决实体识别与替换、实体指代消解、多义词识别、自纠错鲁棒性还原、实体翻译等。此前,不少大模型提供方以及专业安全厂商均在积极进行相关的尝试,但目前尚未有理想的解决方案。

“在大模型应用中提示词是一种自由文本,而针对自由文本的隐私保护问题,一种全密态的解决方案是通过安全多方计算(Multi-Party Computation, MPC)协议实现安全推理。然而,MPC 协议在计算成本和通信量上的高需求严重限制了其在大模型应用中的落地。”腾讯安全玄武实验室高级安全工程师陈昱表示,“实际上,多数场景下用户并不需要保护整句的信息不泄漏,而仅需要保护其中的隐私实体不泄漏。”玄武实验室经过正则匹配、近义词向量、BERT NER+CR 等方法的不断探索试错后,最终提出了这项技术。

实验表明,HaS 的数据脱敏处理并不会对任务造成影响。在使用模型进行隐私保护与直接调用大模型相比“分类任务”与“翻译任务”两个场景的性能对比,在使用 560M 生成式方案下,文本分类任务的性能不仅没有下降,反而增加了 0.14%;在 1.7B 标签式方案下,机器翻译任务性能仅下降了 0.85%。

腾讯安全玄武实验室将上述研究发现以论文形式发布,更多技术细节可参考玄武官方博客(https://xlab.tencent.com/cn/2023/12/05/hide_and_seek/)。

“一些企业或者个人用户开发者通过部署本地大模型来规避隐私数据泄露,但这要求一定的技术门槛,对于重度隐私需求的用户来说,通过本地安全模型 / 算法来实现数据保护,可能是更可行的办法。”玄武实验室正在逐步丰富这一模型的应用覆盖面,并完善其部署和交付方式,以供企业用户和个人用户在未来能够便捷使用。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

互联网大厂“组团”宕机,都怪降本增“笑”?

软件开发“食物链”:运维竟高于开发,最顶端该是用户还是管理层?

滴滴 P0 事故,K8s 背锅?拼多多正式登顶中国电商巨头,马云阿里内网罕见发言;学霸女儿创业AI项目火了,老爸公司涨停|Q资讯

ChatGPT 一周年:生成式 AI 出现后,我决定以后砸锅卖铁都不让后代当程序员了

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
开源中国将在年末推出大模型托管平台,大量人才招募中腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法与其被爱弹劾,不如卸甲归田微软推出首款自研大模型AI芯片;英伟达合作微软推出AI代工服务;WPS AI开启公测丨AIGC日报站上大模型制高点:我们给不输GPT-4的文心大模型4.0,来了一场技术揭秘AI早知道|自定义ChatGPT商店下周上线;腾讯推出语音识别大模型;美图大模型上线AI早知道|同花顺推出问财大模型;Midjourney将推文本转视频模型;谷歌即将推出Bard Assistant夏婳:两情难相知(二十二)锐捷与腾讯安全携手构建数字安全免疫力,共拓威胁情报新格局Cloudflare 推出免费的隐私保护工具 Turnstile,替代传统 CAPTCHA腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型跟着大厨,做几个家常菜小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大SpringBoot 采用 JsonSerializer 和 Aop 实现可控制的数据脱敏冬日恋歌精英社交|市中心高尔夫桌球麻将顶配KTV掼蛋狼人染poker!保护隐私安全满足单身非单不同需求!大模型隐蔽后门震惊马斯克:平时人畜无害,提到关键字瞬间“破防”NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS腾讯:大模型安全与伦理研究报告2024科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug翩翩AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布4k窗口长度就能读长文,陈丹琦高徒联手Meta推出大模型记忆力增强新方法免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!中科加禾崔慧敏:AI芯片+编译器才是王道!性能提升2~3倍,将推出大模型推理引擎丨GACS 2023他山之石,从周海媚的急诊记录被无良泄露回顾美国患者患者的隐私保护AI早知道|小度首创大模型AI互动大语文体系;钉钉将推出AI助理市场;微软在印度推出AI新计划北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型AI公司第四范式IPO上市;雷军王小川联手搞小米大模型;百度发布量子领域大模型;AI新技术90秒识别癌;苹果疯狂购买AI初创公司5分钟搞出大模型应用!阿里云通义“全家桶”来了,从基础设施到应用平台全栈技术UPWPS承诺用户文档不会被用于AI训练!隐私政策为何要写“脱敏后作为AI训练”?双11派对|市中心室内高尔夫桌球麻将+顶配KTV掼蛋狼人染阿瓦poker!保护隐私安全!满足单身非单不同需求!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。