Redian新闻
>
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

公众号新闻



  新智元报道  

编辑:庸庸 乔杨
【新智元导读】 5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?
这几天,全世界的目光仿佛都被OpenAI发布的GPT-4o所吸引,与此同时,OpenAI的挑战者们也在同步创造历史。
就在5月14日,阿布扎比先进技术研究委员会(ATRC)下属的技术创新研究所(TII),发布了新一代的Falcon 2模型。

Falcon 2 11B已开启访问,Falcon 2 11B VLM将在5月14日中午12点开放
新一代「猎鹰」(Falcon意为猎鹰)重返竞技场,一经推出,迅速登上了HN热榜第一。
去年Falcon首次推出就技惊四座,以碾压性的优势超越了Llama。
根据Hugging Face排行榜,这次推出的Falcon 2 11B性能再次超越了Llama 3 8B,与领先的Gemma 7B性能相当,平均性得分仅差0.01。
Falcon 2包括两个版本:Falcon 2 11B和Falcon 2 11B VLM。
前者是在 5.5 万亿个token上训练出的大语言模型,后者则在此基础上开发的「视觉到语言」模型。
作为一款开源的大语言模型,Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。

只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述

多语言+多模态

Falcon 2 11B 具有多语言能力,可以快速响应英语、法语、西班牙语、德语、葡萄牙语和其他各种语言的任务。
Falcon 2 11B VLM 作为视觉语言模型,能够从环境中识别和解释各种视觉信息,因此在医疗、金融、电子商务、教育和法律等领域有广泛的应用场景。
比如用于文档管理、上下文索引等任务,而且其「视觉到语言」的功能还有望在未来为视障人群提供帮助。
此外,Falcon 2只需一个GPU就能高效运行,可以轻易部署在笔记本电脑上。
为了加快推进Falcon商业化的进程,去年11月,ATRC就成立了一家新公司——AI71
基于Falcon模型,AI71已经进军阿联酋的教育、医疗、法律等多个领域,并计划很快拓展到阿联酋以外。Falcon的本次升级,为其商业化进程提供了有力支撑。

坚持开源的Falcon

TII发布的人工智能模型,在全球范围内一直名列前茅,新推出的Falcon 2 11B 模型让TII的地位再次得到稳固。
更重要的是,本次更新的两个模型版本均已开源,全世界的开发人员都可以不受限制地使用,并在此基础上进行开发和部署。模型展现出的优秀性能意味着TII有望与Meta竞争开源宇宙霸主的地位。
阿布扎比先进技术研究委员会(ATRC)秘书长 Faisal Al Bannai 承诺,将会坚持推动开源创新,帮助全世界的开发者们实现他们的AI之旅。
TII首席研究员Hakim Hacid博士也表示「开发人员正在认识到更小、更高效模型的无数好处······这是下一个新兴的大趋势。此外,Falcon 2的视觉转语言能力为人工智能的易用性开辟了新的前景,为用户提供了变革性的从图像到文本的交互方式。」
TII还透露其正在酝酿Falcon 2下一代模型,推出时间将在不久之后,这些模型的性能将通过专家混合(MoE)技术得到进一步增强。
开源与闭源之争,战局未定。但无论如何,TII已经成为AGI领域的一支劲旅,这背后是阿联酋自上而下形成的合力,他们正全力推动人工智能的发展,将这项技术视为继石油之后的下一个经济支柱。
Falcon不仅仅是作为「严肃的参与者」而存在,而是雄心勃勃振翅盘旋的「猎鹰」。
参考资料:

https://www.tii.ae/news/falcon-2-uaes-technology-innovation-institute-releases-new-ai-model-series-outperforming-metas

https://news.ycombinator.com/item?id=40344302


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
5亿参数“小模型”如何超越千亿级参数大模型GPT-3.5?面壁低调开源新模型:早于Llama 3、比肩Llama 3、推理超越Llama 3!字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑【七绝】黄水仙,步惜也君韵公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4革命新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2唯物辩证法是个好东西?最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍微软发布Phi-3,性能超Llama-3,可手机端运行超越Llama-2!微软新作Phi-3:手机上能跑的语言模型时隔一年回归,她这波猛料直接让人惊掉下巴!开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4少即是多!10亿参数「小巨人」击败ChatGPT微软拟与OpenAI投资1000亿美元建AI超算;Databricks 推出1320亿参数大语言模型 DBRX丨AIGC日报杀疯了!全面超越Llama3的强悍开源模型,仅9B,1000k上下文;GPT-4级别模型1年降价1万倍阿里云重磅发布开源模型Qwen2,性能超Llama3-70及国内众多闭源模型国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet新开源之王来了!1320亿参数,逻辑数理全面打赢Grok,还比Llama2-70B快1倍芝加哥大豆子时隔一年重磅回归!next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+美股基本面 - 2024_03_21 * 午报 * 美国2月份二手房销售创一年新高 库存激增。美国顶级资产管理公司Vangua一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGIGLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级ICML 2024 | 超越LoRA!港科大提出FourierFT:新型傅立叶微调!训练参数大幅减少人心叵测,不能不防从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗练字--道德经阿里云突然发布全球最强开源模型 Qwen2,性能超越美国最强开源模型0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练高通 X Plus 芯片发布,性能超越 M3,AI 能力是亮点面壁智能低调开源大模型“理科状元”!LeetCode 周赛超越80%人类选手,推理性能超 Llama3-70B70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。