iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
新智元报道
新智元报道
【新智元导读】谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。
Gemma 2 2B:轻量级2B模型,在性能和效率之间实现了最大的平衡
ShieldGemma:基于Gemma 2构建的安全内容分类器模型,用于过滤AI模型的输入和输出,确保用户安全
Gemma Scope:一种可解释性工具,提供对模型内部运行机制的无与伦比的洞察
Gemma 2 2B:即刻在设备上使用
ShieldGemma:最先进的安全分类器
ShieldGemma的设计专门针对四个关键的有害领域:
- 仇恨言论
- 骚扰内容
- 露骨内容
Gemma Scope:通过开源稀疏自编码器揭示AI决策过程
开源SAEs:超过400个免费提供的SAEs,覆盖Gemma 2 2B和9B的所有层 互动演示:在Neuronpedia上无需编写代码,即可探索SAE功能,并分析模型行为 易于使用的资源库:提供与SAEs和Gemma 2交互的代码和示例
Gemma Scope有何独特之处?
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章