Redian新闻
>
国内首个网络安全大模型评测平台 SecBench 发布

国内首个网络安全大模型评测平台 SecBench 发布

公众号新闻

作者 | Tina

2024 年 1 月 19 日,业界首个网络安全大模型评测平台 SecBench 正式发布,该平台由腾讯朱雀实验室和腾讯安全科恩实验室,联合腾讯混元大模型、清华大学江勇教授 / 夏树涛教授团队、香港理工大学罗夏朴教授研究团队、上海人工智能实验室 OpenCompass 团队共同建设,主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的落地应用选择基座模型提供参考,加速大模型落地进程。同时,通过建设安全大模型评测基准,为安全大模型研发提供公平、公正、客观、全面的评测能力,推动安全大模型建设。

行业首发,弥补大模型在网络安全垂类领域评测空白自 2022 年 11 月 ChatGPT 发布以来,AI 大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮,大模型的落地进程也随之加速。然而,在网络安全应用中,大模型研发人员如何选择合适的基座模型,当前大模型的安全能力是否已经达到业务应用需求,都成为亟待解决的问题。SecBench 网络安全大模型评测平台,将重点从能力、语言、领域、安全证书考试四个维度对大模型在网络安全领域的各方面能力进行评估,为大模型研发人员、学术研究者提供高效、公正的基座模型选型工具和研究参考。

图 1. SecBench 网络安全大模型评测整体设计架构

图 2. GPT-4 在能力维度、语言维度以及安全领域能力的评估结果

图 3. GPT-4 在各类安全证书考试中的评估结果 (绿色为通过考试)

SecBench 设计架构图 1. 为 SecBench 网络安全大模型评测初期规划的架构,主要围绕三个维度进行构建:一是积累行业独有的网络安全评测数据集。评测数据是评测基准建设的基础,也是大模型能力评测最关键的部分。目前行业内还没有专门针对大模型在网络安全垂类领域的评测基准 / 框架,主要原因也是由于评测收据缺失的问题。因此,构建网络安全大模型评测基准的首要目标是积累行业内独有的网络安全评测数据集,覆盖多语言、多题型、多能力、多领域,以全面地评测大模型安全能力。二是搭建方便快捷的网络安全大模型评测框架。“百模大战”下,大模型的形态各异,有 HuggingFace 上不断涌现的开源大模型,有类似 GPT-4、腾讯混元、文心一言等大模型 API 服务,以及自研本地部署的大模型。评测框架如何支持各类大模型的快速接入、快速评测也很关键。此外,评测数据的多样性也挑战着评测框架的灵活性,例如,选择题和问答题往往需要不同的 prompt 和评估指标,如何快速对比 few shot 和 zero shot 的差异。因此,需要搭建方便快捷的网络安全大模型评测框架,以支持不同模型、不同数据、不同评测指标的灵活接入、快速评测。三是输出全面、清晰的评测结果。网络安全大模型研发的不同阶段其实对评测的需求不同。例如,在研发初期进行基座模型选型阶段,通常只需要了解各类基座模型的能力排名、对比不同模型能力差异;而在网络安全大模型研发阶段,就需要了解每次迭代模型能力的变化,仔细分析评估结果等。因此,网络大模型评测需要输出全面、清晰的评测结果,如评测榜单、能力对比、中间结果等,以支持不同研发阶段的需求。SecBench 除了围绕上述三个目标进行建设外,还设计了两个网络安全特色能力:安全领域评测和安全证书考试评估。安全领域评测从垂类安全视角,评测大模型在九个安全领域的能力;安全证书考试评估支持经典证书考试评估,评测大模型通过安全证书考试的能力。

SecBench 评测框架 SecBench 网络安全评测框架可以分为数据接入、模型接入、模型评测、结果输出四个部分,通过配置文件配置数据源、评测模型、评估指标,即可快速输出模型评测结果。数据接入:在数据接入上,SecBench 支持多类型数据接入,如选择题、判断题、问答题等,同时支持自定义数据接入及评测 prompt 模板定制化。模型接入:在模型接入上,SecBench 同时支持 HuggingFace 开源模型、大模型 API 服务、本地部署大模型自由接入,还支持用户自定义模型。模型评测:在模型评测上,SecBench 支持多任务并行,加快评测速度。此外,SecBench 已内置多个评估指标以支持常规任务结果评估,也支持自定义评估指标满足特殊需求。结果输出:在结果输出上,SecBench 不仅可以将评测结果进行前端页面展示,还可以输出模型评测中间结果,如配置文件、输入输出、评测结果文件等,支持网络安全大模型研发人员数据分析需求。

图 4. SecBench 网络安全大模型评测框架

SecBench 评测数据网络安全大模型的能力难以评测,主要原因之一还是网络安全垂类数据的缺失。为了解决这一问题,SecBench 目前已经收集整理了 12 个安全评测数据集,累计数据 10000 余条。语言维度:覆盖中文、英文两类常见语言的评测。能力维度:从安全视角,支持大模型对安全知识的知识记忆能力、逻辑推理能力、理解表达能力的评估。领域维度:支持大模型在不同安全领域能力的评测,包括数据安全、应用安全、端点与主机安全、网络与基础架构安全、身份与访问控制、基础软硬件与技术、安全管理等。证书考试:SecBench 还积累了各类安全证书模拟试题,可支持大模型安全证书等级考试评估。

图 5. SecBench 网络安全大模型评测数据分布

当前 SecBench 评测数据仍然存在多样性不足、分布不均匀等问题,当前正在持续补充建设多题型、多能力、多维度的评测数据。

SecBench 评测结果 SecBench 正在逐步接入大模型进行网络安全能力评测,目前主要针对经典 GPT 模型以及小规模开源模型进行评测榜单输出。展示模型在能力、语言、安全领域不同能力维度的结果,同时支持安全等级证书考试结果输出。后续将持续接入商用大模型、安全大模型,支持模型能力对比等能力。

图 6. SecBench 网络安全大模型评测榜单

随着大模型在网络安全领域的落地应用加速,网络安全大模型的评测变得尤为关键。SecBecnch 已初步建立起围绕网络安全垂类领域的评测能力,以更好地支持网络安全大模型的研发及落地应用。此外为评估大模型在 Prompt 安全方面的表现,腾讯朱雀实验室已联合清华大学深圳国际研究生院,发布了《大语言模型 (LLM) 安全性测评基准》。

未来展望 SecBecnch 初步建立起围绕网络安全垂类领域的评测能力,然而还有许多需要优化迭代的地方:一是仍需持续补充构建高质量的网络安全评测数据,覆盖多领域、多题型,以更好地支持模型在网络安全领域的全面评测;二是快速跟进大模型评测,对于新发布的大模型,能够及时输出评测结果;三是丰富模型结果呈现方式,支持模型对比、结果分析等功能,以满足不同用户的使用需求。SecBench 也希望能够引入更多的合作伙伴,包括学术界、工业界相关从业者,共创共赢,共同推动网络安全大模型的发展。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

“印度 CEO 毁了谷歌!”大裁员引发谷歌元老集体怀旧:20 年前为梦想而战,20 年后混口饭吃

中国开源,又一次让人失望了

TikTok 员工加速“出海”,薪资翻倍;老外控诉中国科技巨头抄袭:反正官司打不赢,不费那个劲了;快手上市后首次整体盈利|Q资讯

你当初被谁“忽悠”上了云,现在又在被谁“忽悠”下云?

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
对标OpenAI GPT-4,MiniMax 国内首个 MoE 大语言模型全量上线业内首个代码大模型标准正式发布《爱就一个字》大庆观感大语言模型评测是怎么被玩儿烂的?我们跟知情人聊了一个下午大模型在开放智能体场景中能意识到风险威胁吗?上海交大发布R-Judge安全评测360安全大模型3.0来了!垂直大模型,他们这么训对标 OpenAI GPT-4,MiniMax 国内首个 MoE 大语言模型全量上线榜单首发!三大阵营/TOP10供应商「领跑」汽车网络安全赛道欧盟推出首个数字产品网络安全认证计划破解大模型安全难题,360推出大模型安全能力框架百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4无题传微软OpenAI领投人形机器人;OpenAI一键调用GPTs功能上线;年度大模型评测榜单公布丨AIGC大事日报年度回顾|锐捷网络安全2023年大事记麦进嘉:手握国内首个核酸药技术平台,获津药集团、施维雅等产业伙伴认可AI早知道|360安全大模型3.0发布;通义听悟上线音视频问答助手;腾讯混元大模型参数规模扩展至万亿高端车盗窃案数量抬头,网络安全给车企带来新威胁AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 DebugACS NANO: 基于离子浓度极化的超低浓度ctDNA富集检测平台五漢廢言中国移动研究院:中国移动“弈衡”大模型评测体系AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布hé bàng?hé bèng?打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训幻方量化开源国内首个MoE大模型,全新架构、免费商用墙倒众人推,破鼓万人捶,树倒猢狲散阿里云欧阳欣:阿里云安全大模型正式投入使用浓人,nèng死淡人宇宙人(1428期)世界首个!突破400万件;Quectel认证Skylo卫星网络物联网芯片;美公司为关岛海军提供专有5G网络斯里兰卡|拟议的网络安全法案,"惊动"了国际人权组织,认为"严重威胁言论自由"Meta 宣布改组旗下 AI 部门,正训练自家下一代大语言模型 Llama 3;国内首个网络安全大模型评测平台发布丨AIGC日报号称中文评测超越 GPT-4,百川智能发布超千亿参数大模型 Baichuan 3AI早知道|工信部发首个国内个人信息保护AI大模型;魅族发布首款开放式AI终端;微软发布金融版Copilot百度大模型这一年:文心一言国内首个用户破亿,飞桨开发者超千万
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。