Redian新闻
>
大模型打擂台?竞技平台 Chatbot Arena已上线

大模型打擂台?竞技平台 Chatbot Arena已上线

公众号新闻
由伯克利大学主导团队 LMSYS Org 近日发布了一个针对大语言模型的基准平台 Chatbot Arena。
该平台采用匿名、随机的方式让不同的大模型产品进行对抗评测,基于国际象棋等竞技游戏中广泛使用的 埃洛等级分系统,通过用户投票产生,系统每次会随机选择两个不同的大模型机器人和用户聊天,并让用户在匿名的情况下选择哪款大模型产品的表现更好一些。
最后系统根据用户的选择判定大模型产品的积分,以排行榜的形式出现在首页中。在上线一周后, Chatbot Arena 便吸引了超过4700次匿名投票,并有越来越多人开始在该平台为不同的大模型产品投票。




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI智能体卷爆大模型!AutoGPT等4大Agent打擂,「西部世界」谁将成为软件2.0?BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」6月8-9日,智能驾驶行业开发者大会聚焦「科技平权与规模化」【热闹】推特大战脸书!马斯克与扎克伯格约打擂台 认真的!【城事】巴黎市长将重修Châtelet 广场以方便行人儿子见亲爹中国 2030 年前载人登月;英伟达推「AI」超算,专为大模型打造;南非发现最古老人类脚印 | 极客早知道OpenAI假设被推翻!给定计算量,较小模型打败大模型,Llama 2训练与GPU计算关联度现代移动开发哪家强:原生还是跨平台?JetBrains 专家:我选 Flutter百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报王小川的大模型打造秘籍首次曝光:五步走,两个月炼成《為人作嫁幾時休》跟風墨脈「及时语」获数千万元Pre-A+轮融资,大模型驱动的新版跨境AI客服产品已上线|36氪首发谷歌终于能与OpenAI 打擂台了!全新PaLM 2比肩GPT-4:一部手机就可运行,精通Python等20种语言两大超市巨头打擂台!Coles推出特别版南部风格热烤鸡!售价仅13澳元!「及时语」获数千万元Pre-A+轮融资,大模型驱动的新版跨境AI客服产品已上线|早起看早期Agustín Hernández:中美洲建筑背景下的未来主义巨构Workout log _ Apr. 2023接入Llama 2等33个大模型,上线Prompt模板,百度智能云千帆大模型平台重磅升级开源 AI 辅助编程工具 AutoDev 现已上架 Jetbrains 插件市场五一演出收入同比增长962.2%,Resso 关闭免费服务,AI音乐上不了平台?小说:兰欣与乌茶 17Hélène Binet:光的哲学家(古詩詞英譯) 禅诗 - 唐 龙牙脑阔疼!竞选广告未经允许就放家门口?竞选后不移除屋主还要被罚款!谷歌将推新版大模型;抖音发布AIGC平台规范;宇视推出行业大模型 | AIGC日报智源连甩多个开源王炸!悟道3.0大模型数弹齐发,大模型评测体系上线巴黎市长将重修Châtelet 广场以方便行人阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型6月16-17日,智能驾驶行业开发者大会聚焦「科技平权与规模化」王牌赛事来了!第三届东证杯"逐鹿东方"衍生品基金经理擂台赛盛大开启紫东太初全模态大模型来了,一个模型打通感知、认知、决策交互屏障黄仁勋发布全新GPU,专为大模型打造,微软谷歌Meta排队预定|GGView5月线上线下活动月历来啦!Zi体验开放日已上线!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。