UC伯克利LLM排行榜首次重磅更新!GPT-4稳居榜首,全新330亿参数「小羊驼」位列开源第一
新智元报道
新智元报道
【新智元导读】备受关注的UC伯克利LLM排位赛又更新了!GPT-4依然岿然不动稳居榜首,GPT-3.5紧随其后,团队自家新发布的330亿参数Vicuna则冲至第五,代表了一众开源模型的最好成绩。
全新评价机制:MT-bench
用LLM评判LLM
结果分析
MT-Bench有效地区分了LLM之间的性能差异
多轮对话能力的评估
LLM评判者的可解释性
下一步计划
发布对话数据
MT-bench-1K
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章