Redian新闻
>
霸榜测评的开源大模型,为何是阿拉伯人搞出来的?

霸榜测评的开源大模型,为何是阿拉伯人搞出来的?

公众号新闻
为了确保您每日收到“阿尔法工场”优质的财经内容推送,请进入公众号主页,点击右上角“···”标志,点击第一行“设为星标⭐”。

作者 | 举大名耳
来源 | AI新智能

导语:搞大模型,光有钱可不行。

在当下的大模型赛道上,开源大模型已经成了一股愈发无法忽视的力量。


无论是Meta的LLMA2,还是国内的百川大模型,都在竞相迭代,渴望在这场AI浪潮中取得更多优势。

然而,就在中美AI企业角力之时,“评分最高开源大模型”的桂冠,却突然在一夜之间被阿拉伯人拿下了。


这个惊爆全网的开源大模型名为Falcon 180B,由阿联酋的技术创新研究所(TII)开发。

一经推出,Falcon 180B就在推理、编码、熟练度和知识测试各种任务中,一举击败了Llama 2。

于是,由3.5万亿token训练而成的Falcon 180B,迅速了登顶Hugging Face排行榜。


在HellaSwag、LAMBADA、WebQuestions等测试中,Falcon 180B已经能够与谷歌PaLM 2不差上下,性能直逼GPT-4。

同时,在Hugging Face开源大模型榜单上,Falcon 180B也是当前评分最高(68.74分)的开源大模型,超越了LlaMA 2(67.35)。


看到这儿,问题来了:在很多人的印象中,阿联酋是一片充满沙漠,以石油为主要收入的国家,那么,这么个往日的“石油大国”,怎么就突然在AI领域一飞冲天,惊诧中美,并在开源领域傲视群雄了呢?

这片遍地黄沙的地方,究竟有着怎样的科研优势?


软实力的重要性

这个“世界最强开源大模型”并非诞生在私营的科技企业,而是诞生在阿联酋正儿八经的国立科研机构TII,这是个很值得玩味的事。

身为由政府资助的科研机构,TII在论资金、资源、算力等方面,自然是不必发愁。

例如在算力方面,TII拥有阿联酋最大的超级计算机——阿布扎比超级计算机(Abu Dhabi Supercomputer),它拥有超过10万个处理器核心,能够实现每秒20亿次浮点运算(PFLOPS),是全球第15强的超级计算机之一。


然而,用举国体制砸资源、砸设备来“大力出奇迹”这种事儿,很多国家都会做,但为什么偏偏阿联酋却异军突起了?

实际上,除了算力、数据这些大模型必须的“标配”外,真正令TII脱颖而出的变量,就是人才、组织结构、政策等一系列“软实力”。

而在这方面,首先值得一提的,就是TII的领导者——法赫德·阿尔奥拉伊尼(Fahad Al-Olayan)。


身为国立科研机构的领导者,法赫德既不是科学院的院士,也不是知名大学的教授、专家,而是阿联酋最大的私营控股公司——奧拉伊尼集团 (Olayan Group).的创始人和董事会主席。

请私企的企业家来领导国立科研机构,这在世界上是非常罕见的。

那阿联酋为何这么剑走偏锋?实际上,这是由于阿联酋的副总理阿勒马克图姆酋长看中了法赫德“搞科技”的才能。

奧拉伊尼集团大楼


具体来说,在加入TII之前,法赫德先是在1997年创立了Axiom Telecom,这是阿联酋,也是中东地区最大的移动设备分销商之一。与苹果、三星、华为等多个国际品牌都有合作伙伴关系。

而在2014年时,法赫德又创立了阿联酋最大的网络安全公司DarkMatter,专为政府、企业和个人提供各种网络安全解决方案。

后来,法赫德加入了阿联酋人工智能委员会(UAE AI Council),在疫情期间,他与阿联酋国防部合作,开发了一种基于人工智能的新型冠状病毒检测方法,能在几秒钟内通过呼吸分析来诊断感染者。

法赫德创立的Axiom Telecom

正是由于这一系列亮眼的履历,副总理阿勒马克图姆心动了,产生了想将法赫德聘为TII总管的想法。

然而,这样大胆的举动,光凭政府领袖个人的意志还不行,得有相应的法律、政策保障。

在阿联酋的科研之路上,许多高层领导都认识到私营部门和公共部门之间的合作的重要性。于是,阿联酋便专门制定了一系列法律和规章,为私营和公共部门之间的合作提供了便利和保障,如《私营部门参与法》、《公私合作法》等。

TII研究大楼

而正是有了这样政策上的便利,法赫德才最终得以进入TII这个国立科研机构,并将自己过去经营企业所练就的一系列管理经验和技巧,应用在了科研项目的运作中。


组织结构

在法赫德担任TII的总管后,很快便用自己的方式,重塑了整个TII的组织结构。

可以说,现在的TII,虽然名义上是一个非盈利的国立科研机构,但实际上却是以一种企业的方式在运行的。

在管理TII时,法赫德采用了扁平化、集约化的组织管理模式,同时赋予项目负责人更大的自主权和决策权,实现资源的优化配置和利用。

具体来说,他将TII的组织结构简化为三个层次:首席执行官、首席研究员和项目负责人。



首席执行官是TII的最高决策者,负责制定TII的战略方向和发展目标,以及与政府、企业、学术机构等外部利益相关者的关系维护。

首席研究员是TII的核心领导团队,负责制定各自研究领域的研究计划和预算,以及监督和评估各个项目的进展和成果。

项目负责人是TII的基层管理者,负责执行各自项目的具体任务和活动,以及汇报和反馈项目的状态和问题。



在这样的管理模式下,下属科学家、研究员和工程师可以直接与首席研究员沟通和协作,无需经过多层的审批和汇报。

同时,TII赋予了基层员工一定的决策权和创新空间,让他们可以在项目过程中,根据实际情况或反馈结果,及时修改或优化项目方案,提高项目的成功率和影响力。

讲真,这样的管理模式,实际上已经比目前的一些科技巨头,如谷歌、Meta要高效、灵活多了。

而相较之下,一些从谷歌离职的研究者表示,现在的Google反而被笼罩在了类似学术或政府机构的企业文化之下,充斥官僚主义。



一些谷歌匿名高管曾表示,谷歌决策缓慢,是因为皮查伊在考虑决策时过于谨慎,拖延了行动,才在后来被OpenAI反超。

一家政府机构越来越像企业,而一个科技企业却越来越像官僚化的政府机构。

这不得不说是一个很讽刺的现象。

而这种反差的背后,则是两者截然不同的基本盘所致。

就目前来说,大模型,尤其是通用大模型,仍然是一种“技术先于应用”的研究。换句话说,很多研究团队,在研究通用大模型时,实际上并不知道大模型之后的具体应用场景。

但对谷歌、Meta这些商业版图庞大的巨头来说,其在推进具体的研究项目时,往往不能不优先考虑产品化和收益的问题。

而在商业化问题上的谨慎,则导致了其在决策层面的迟缓。



但TII则不同,由于其负责的主体是阿联酋的政府和王室,而非企业股东,因此在一些较为前沿,但产出却不明确的项目上,反而可以放开了手脚去干。

而阿联酋政府和王室,之所以如此不怕“烧钱”,除了自身确实土豪外,另一部分原因,则是出于对“后石油”时代的未雨绸缪。

毕竟,在全球能源结构变化、环境保护的呼声和经济形势变化的大背景下,石油资源的不可持续性,已经愈发明显。



因此,寻求经济多元化发展,就成了维持国家的持续繁荣的必要途径。

在此背景下,AI等新兴的科技产业,就成为了阿联酋等阿拉伯国家所仰赖的一个重要支柱。



总结

除了上述提到的因素外,阿联酋在AI方向上,至少还有两大优势性的政策,为大模型的发展铺好了路。

其一,是通过极其优渥的人才政策,吸引了全球各地的AI人才。

在这方面,阿联酋通过颁发长期的黄金签证和远程工作签证,留住了来自全球的AI人才。

这两种签证都是阿联酋政府在2019年推出的新型签证,旨在吸引全球的创新者、专业人士和企业家。

黄金签证是一种为期10年的长期居留签证,可以自动续签,适用于科学家、医生、工程师、艺术家等领域的杰出人才。


远程工作签证是一种为期一年的临时居留签证,可以延长或转换为其他类型的签证,适用于在其他国家有稳定收入的远程工作者。

这两种签证都为AI人才提供了一个灵活和便利的居住和工作环境。

其二,是在AI伦理方面走得早,比较远。

目前,生成式AI造成的伦理、法律问题,已经成了技术因素之外,另一大制约产业发展的因素。

很多时候,明明技术到位了,但却因为法律、合规方面的原因,导致很多应用和项目迟迟难以落地。

例如AI作图的版权问题,就是一个明显的例子。


而在阿联酋政府在2018年成立了AI伦理委员会,这是全球首个国家级的AI伦理机构,旨在监督和指导AI在阿联酋的发展和应用,保护个人和社会的权益和福祉。

阿联酋政府还在2019年发布了《阿联酋人工智能伦理原则》,这是全球首个国家级的AI伦理文件,旨在为AI的设计、开发和使用提供一个统一和明确的道德框架,涉及公平、透明、责任、隐私、安全等方面。

可以说,在当下的AI革命面前,阿联酋做出了一系列大胆的尝试。


而这样的尝试,都是为了破除各种横亘在AI发展之路上的壁垒。

这些壁垒有政府与私营企业之间的,有不同文化、国家之间的,也有伦理与法律方面的。

在这个科技变革的关口,人类的一系列制度、法律和文化等上层建筑,已经开始对新兴的AI技术表现出了不适和滞后。

而关于如何破除这种“不适”、“错位”,让人类通向AGI的道路更加平坦,阿联酋做出了一个较好的表率。


加入阿尔法工场投资者交流社群 | 添加微信:dlfxs2







微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
学霸到底是鸡出来的,还是生出来的?对不起,答案可能让你心头拔凉……为什么最终爆发科学革命的,是欧洲,而不是阿拉伯阿拉伯语AI大模型Jais正式开源,参数达130亿2023年诺贝尔生理学或医学奖,为何是mRNA技术,为何授予他们二人?微软 Office copilot 定价每月 30 美元;腾讯否认推公务员版微信;Meta 发布新一代开源大模型 | 极客早知道开源大模型领域最重要的玩家们,在关心/担心什么“金鸡奖给周冬雨于适P上衣服?看到对比图...”网友无语:这是阿拉伯的金鸡奖!阿拉伯人为什么这么不团结?浙江大学发布开源大模型知识编辑工具EasyEdit,效果超越传统微调方法国产开源大模型,首次实现代码解释开源大模型将“杀死”闭源模型?李开复官宣「全球最强」开源大模型:一次处理40万汉字、中英均霸榜阿拉伯人为啥这么恨以色列?美麗阿拉斯加(二)安克雷奇 (Anchorage)人手一个编程助手!北大最强代码大模型CodeShell-7B开源,性能霸榜,IDE插件全开源孔子,生命的觉醒20B跨级挑战70B性能!国产开源大模型打造大模型新标杆UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源开源大模型重击OpenAI!小扎放出LLaMA2炸裂科技圈,联手微软高通冲击市场格局韩国人搞出的大新闻“室温超导”是什么情况?斯洛文尼亚 卢布尔雅那金一南:以色列为何占领阿拉伯土地?击败Llama 2,抗衡GPT-3.5,Stability AI新模型登顶开源大模型排行榜她提升了你生命的價值 ——臥龍崗徜徉的啟迪如松:阿拉伯国家为何还不下场参战?太疯狂,GPTs上线:奥特曼表演手搓马斯克大模型,还有人已搞出第三方市场(附教程)10人俩月搞出大模型!一年16篇顶会论文加持:市面上做得好的都没有开源桃红柳緑,球场三伏北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型32k上下文可商用!羊驼进化成长颈鹿,“开源大模型之最”数学能力超ChatGPT,70B开源大模型火了:用AI微调AI,微软全华班出品小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大国内开源第一!百川开源大模型Baichuan-13B评测揭晓|SuperCLUEAI赛道陷入内卷,开源大模型纷纷商用免费开源大模型FLM-101B:训练成本最低的超100B参数大模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。