时隔一年Falcon回归！110亿参数5.5万亿token，性能超越Llama 3

2024-05-20 07:05

编辑：庸庸乔杨

这几天，全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引，与此同时，OpenAI的挑战者们也在同步创造历史。

就在5月14日，阿布扎比先进技术研究委员会（ATRC）下属的技术创新研究所（TII），发布了新一代的Falcon 2模型。

Falcon 2 11B已开启访问，Falcon 2 11B VLM将在5月14日中午12点开放

新一代「猎鹰」（Falcon意为猎鹰）重返竞技场，一经推出，迅速登上了HN热榜第一。

去年Falcon首次推出就技惊四座，以碾压性的优势超越了Llama。

根据Hugging Face排行榜，这次推出的Falcon 2 11B性能再次超越了Llama 3 8B，与领先的Gemma 7B性能相当，平均性得分仅差0.01。

Falcon 2包括两个版本：Falcon 2 11B和Falcon 2 11B VLM。

前者是在 5.5 万亿个token上训练出的大语言模型，后者则在此基础上开发的「视觉到语言」模型。

作为一款开源的大语言模型，Falcon 2不仅具备多语言能力，而且支持多模态，可以将视觉输入无缝转换为文本输出，这种功能是当今大模型市场中的首创。

只需要在用户界面上传一张图片并输入提示，就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力，可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。

Falcon 2 11B VLM 作为视觉语言模型，能够从环境中识别和解释各种视觉信息，因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。

比如用于文档管理、上下文索引等任务，而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。

此外，Falcon 2只需一个GPU就能高效运行，可以轻易部署在笔记本电脑上。

为了加快推进Falcon商业化的进程，去年11月，ATRC就成立了一家新公司——AI71

基于Falcon模型，AI71已经进军阿联酋的教育、医疗、法律等多个领域，并计划很快拓展到阿联酋以外。Falcon的本次升级，为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型，在全球范围内一直名列前茅，新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。

更重要的是，本次更新的两个模型版本均已开源，全世界的开发人员都可以不受限制地使用，并在此基础上进行开发和部署。模型展现出的优秀性能意味着TII有望与Meta竞争开源宇宙霸主的地位。

阿布扎比先进技术研究委员会（ATRC）秘书长 Faisal Al Bannai 承诺，将会坚持推动开源创新，帮助全世界的开发者们实现他们的AI之旅。

TII首席研究员Hakim Hacid博士也表示「开发人员正在认识到更小、更高效模型的无数好处······这是下一个新兴的大趋势。此外，Falcon 2的视觉转语言能力为人工智能的易用性开辟了新的前景，为用户提供了变革性的从图像到文本的交互方式。」

TII还透露其正在酝酿Falcon 2下一代模型，推出时间将在不久之后，这些模型的性能将通过专家混合（MoE）技术得到进一步增强。

开源与闭源之争，战局未定。但无论如何，TII已经成为AGI领域的一支劲旅，这背后是阿联酋自上而下形成的合力，他们正全力推动人工智能的发展，将这项技术视为继石油之后的下一个经济支柱。

Falcon不仅仅是作为「严肃的参与者」而存在，而是雄心勃勃振翅盘旋的「猎鹰」。

参考资料：

https://www.tii.ae/news/falcon-2-uaes-technology-innovation-institute-releases-new-ai-model-series-outperforming-metas

https://news.ycombinator.com/item?id=40344302

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq