Redian新闻
>
北大学生优化清华系大模型,拿ASC全球超算大赛冠军

北大学生优化清华系大模型,拿ASC全球超算大赛冠军

公众号新闻
克雷西 发自 上海
量子位 | 公众号 QbitAI

北京大学再次卫冕

第十一届ASC世界大学生超算竞赛总决赛,在上海大学落下帷幕。

北京大学再次斩获决赛冠军,亚军则被中山大学拿下。

经过前期初赛的角逐,来自多个国家和地区的300多支队伍,有25支进入到了决赛现场,经过5天的激烈比拼,冠亚军和包括大模型在内的各单项奖纷纷揭晓。

此外比赛中还设置了“超级团队赛”,来自西南石油大学、齐鲁工业大学、南方科技大学、上海大学、香港理工大学的联合团队获得了这一奖项,其中西南石油大学是首次杀入ASC决赛

中国科学院钱德沛院士表示,通过参加ASC竞赛这样高水平的前沿科技竞赛,(学生们)跨入超算大门,以赛代学,以赛促练,激发兴趣,快速成长,来年必定会成为我国乃至全球超算事业的中坚力量,创造无限的可能。

那么,此次的ASC竞赛都设置了哪些题目呢?

超算竞赛,不只是超算

ASC世界大学生超级计算机竞赛,由中国在2012年发起,与美国SC、德国ISC并称全球三大超算竞赛,今年是第11届。

参加决赛的25支队伍需要用前两天的时间,设计安装小型超算集群,完成后便不能再对硬件进行改动。

后面的两天,他们需要解决包括大模型在内的7道题目,涉及人工智能、行星科学、渗流力学、材料科学等不同学科,对算力的需求也不尽相同。

但比赛设置了3000瓦的总功率限制,一旦爆表则成绩取消,这对选手们对各个题目的预判有着严苛的要求,他们需要对CPU和GPU进行合理分配,才能在有限的功率下尽可能取得更高的综合性能。

竞赛中的一道题目是进行“跑分”——通过超级计算机浮点性能基准测试程序(HPL)来评估超算系统的计算性能。

ASC竞赛规则要求各参赛队伍自行设计超算系统,在总功耗3000W约束下正确完成包括HPL计算性能基准测试在内的各项计算任务。

比赛中,来自浙江大学的队伍获得了该测试的单项第一名。

不过,要说超算竞赛,就不能只说超算——

ASC超算竞赛题目涉及交叉学科,关注科学界的多种热门话题,参赛选手也拥有不同的专业背景。

炙手可热的大模型当然也不例外——从去年大模型热潮涌现开始,ASC就已将相关内容收录成了赛题。

大模型依然炙手可热

初赛阶段,参赛队伍要使用FP16或BF16精度,为知名开源大模型Llama2-70B构建并优化推理引擎,在组委会提供的1万样本数据集上实现尽可能高的推理吞吐量。

决赛阶段,要求参赛队伍基于智源研究院的开源大模型AquilaChat2-34B,构建并优化推理引擎。

在组委会提供的样本数据集上,选手需要使用4bit及以下量化来进行推理,在保证精度的前提下提升推理速度。

要想在这道赛题中取得佳绩,各参赛队伍需要充分了解并掌握大模型常见的并行方法,并学习使用各种技术来优化推理过程。

除了大模型之外,大赛的题目还涉及石油开采、火星大气模拟等热门科技话题。

石油开采渗流数值模拟

这是一道实际工程计算难题,也是本届e Prize计算挑战奖的指定赛题。

这道题目中,他们要对一款渗流数值模拟软件进行并行计算优化,研究多相流体在多孔介质中的复杂流动规律与特征。

多相流体渗流问题主要研究的是在多孔介质中,多种不同流体(如油、水、气等)的流动和相互作用过程。

多相流体渗流问题是渗流数值模拟研究渗流理论中最困难的,已经成为推动渗流力学理论进一步发展的关键学科之一,对算力的需求非常大

例如在油气开发中,油田网络在水平方向上的分辨率基本上是十米至百米的量级,网格划分非常粗,要想精细化描述油藏特征,就会大幅增加计算量。

ASC24超算竞赛设置了渗流数值模拟赛题。要求各参赛队伍根据组委会提供的数据集,模拟石油开采场景中油、气、水等多相流体的渗流情况,并优化大规模并行计算过程,提升离散算法的计算性能和并行效率。

火星大气模拟

不仅“可下五洋捉鳖”,还要“可上九天揽月”,在比赛中,选手们还需要解决的,是一道太空探索计算难题。

他们需要以中科院大气物理所研制的新一代火星大气模模式(Global Open Planetary atmospheric model for Mars,简称GoMars)中的动力框架为基础,通过优化并行通信和提高计算负载均衡,尽可能提升程序运行效率,以实现对火星大气状态更加精细、高效的求解预测。

火星大气的直接观测数据很少,火星大气模式是研究火星大气环境的重要方法。

GoMars根据多个火星探测器的观测结果以及国际火星大气全球数据集构建,可以模拟火星大气环境中沙尘、水和二氧化碳三个关键气象元素的循环,对火星地表气压、地表温度、纬向风、极地冰和沙尘等进行较好的模拟。

其中用于流体计算的动力框架GMCORE基于经纬网格构建,面向高分辨率模拟设计,需要满足高效性和准确性的双重考验,其中极具挑战性的问题是如何优化并行通信和提高计算负载均衡

GoMars赛题对参赛大学生而言是一项艰巨的挑战。选手们需要在给定的动力框架标准测试算例约束下,在保证计算精度的同时尽量缩短程序运行时间,在模拟精度、效率等多个维度中进行合理的平衡,从而获得理想的结果。

前面的几道题目,参赛队伍在赛前就已知晓以上赛题的大致方向,以便能够安排队伍的人员构成,但也有一道神秘赛题,直到决赛过程中才被揭晓。

探索新型材料

“神秘应用”的赛题为新型材料非平庸电子结构计算。所使用的WannierTools是一款基于紧束缚模型研究材料拓扑物性的开源软件。

参赛学生在3000W功耗限制下正确运行全部算例,并尽可能地缩短应用的运行时间。

这道赛题考察参赛者对石墨烯的朗道能级计算及拓扑材料表面态计算方法的理解,以及代码编译运行与程序优化的能力。

总之,这些题目不仅能考验同学们在计算领域的知识积淀,更体现了科学研究与计算技术加速融合的时代,跨学科学习能力的重要性。

而与此同时,这场竞赛不仅是技术的较量,更是友谊与知识的交流

超算竞赛,亦不只是竞赛

除了前面常规的赛题,ASC竞赛还设置了颇具特色的“超级团队赛”,考验了不同团队间选手们的沟通协作。

本次超级团队赛的应用赛题是ParaSeis地震波模拟。ParaSeis地震模型能够清晰地模拟地震波在地球内部的传播过程,进而应用于地震预测和地震危险性分析等领域。

在超级团队赛中,通过抽签,25支队伍组成了5个超级团队,他们将使用ParaSeis模拟真实地形下地震波的传播,通过相互交流、合作优化ParaSeis的算法和扩展性,并执行应用程序的编译、调试、优化工作。

最终,“超级团队”中各队伍成绩平均分,将作为该组团队的最终成绩。

超级团队赛对参赛选手来说,是一场技术与协作的双重考验

他们面临的是计算量和并行策略设计的双重难题,不仅需要参赛者具备坚实的数学和物理基础,还需具备强大的计算机编程能力和算法优化能力;

团队协作层面,超级团队内的5支队伍完全依靠随机抽签进行组合,队员可能有着不同的语言、文化背景,需要高效的协作沟通能力才能在挑战者脱颖而出。

而除了超级团队赛,这种合作交流也贯穿了始终。

获得冠军的北京大学代表队代表徐天乐同学就为我们介绍了这样的一段经历:

澳门科技大学今年是第一次参赛,他们找不到足够有经验的同学,每队一般是有五位队员,但他们只有三位,参赛经验也不充足。
他们在跑benchmark基本测试的时候都会遇到问题,我们正好跟他们有过交流,比较熟悉,他也会和我们提问,我们会花一些时间帮他们。
我觉得比赛最重要的是友谊和大家的收获,而不是说你必须要超过他多少,而且我觉得也没有花太多时间,(比赛中)大家都会(像这样)交流。

通过这5天的比拼交流,同学们既考验了自己的综合能力,也收获了知识、收获了友谊、收获了成长。

组委会特邀嘉宾,Intersect 360首席研究官Dan Olds表示说,未来的年轻人,可能创造出的新成绩,也许会是我们现在根本无法想象的

最后,完整获奖名单附上~

冠军:北京大学
亚军:中山大学

超级团队奖:
上海大学 南方科技大学 齐鲁工业大学
西南石油大学 香港理工大学(中国香港)

e Prize计算挑战奖:台湾新竹清华大学(中国台湾)
最高计算性能奖:浙江大学
应用创新奖:山西大学 上海交通大学 北京航空航天大学
最佳人气奖:山西大学 国立科尔多瓦大学(阿根廷)

一等奖:
上海交通大学 浙江大学 国防科技大学 山西大学
暨南大学 北京航空航天大学 台湾新竹清华大学(中国台湾)
兰州大学 哈尔滨工业大学(深圳) 青海大学 华中科技大学
中国科学技术大学 香港理工大学(中国香港) 福州大学
南方科技大学 齐鲁工业大学 埃尔朗根-纽伦堡大学(德国)
西南石油大学 泰国农业大学(泰国) 国立科尔多瓦大学(阿根廷)
澳门科技大学(中国澳门) 上海大学 香港中文大学(中国香港)

倒计时1天 ⏰

4月17日,中国AIGC产业峰会

只需一天,感受AIGC新应用正在引领的科技新范式!

来自产品、技术、投资等领域最主流的“玩家”代表和投资人,将在4月17日中国AIGC产业峰会,与你共同探讨AIGC正在重塑的新世界。

峰会将全程线上下同步直播,欢迎预约直播 ⬇️


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
开源大模型火了!(附99个大模型微调模型/数据/工具)!大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事长篇小说《谷雨立夏间》64 直觉的救赎AI大模型之路 第三篇:从零实现词嵌入模型,加深理解!4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling野地梅香《尘封档案》拾遗之071:冒牌“英雄”落网记智谱再投AI Infra清华系公司!已在大模型生态投资超13家企业今日arXiv最热大模型论文:清华把大模型用于城市规划,回龙观和大红门地区成研究对象品茶小軒, 品的是心動瞬間/小说的本质是时间清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型郑旭光误以为只有自己有的权力苹果将在WWDC公布AI战略;曝智谱AI参投清华系AI创企;百度升级7款大模型应用丨AIGC大事日报中国版 Sora 来了!一键生成 16 秒 1080P 视频,清华系团队能对标 OpenAI 吗?清华系发布全新金融AI,数秒完成金融数据大海捞针!金融民工直呼要失业北大图灵班00后学子夺得五金!北大荣获国际大学生程序设计竞赛全球总冠军百亿tokens免费额度,清华系明星AI公司的羊毛薅起来Tomcat 调优总结(Tomcat自身优化、Linux内核优化、JVM优化)360安全大模型3.0来了!垂直大模型,他们这么训曝谷歌Python团队全员被裁;清华系团队“国产Sora”:视频突破16秒;“社恐”周鸿祎:喊话贾跃亭、雷军送自己车|AI周报国产 Sora 的秘密,藏在这个清华系大模型团队中今日arXiv最热NLP大模型论文:浙江大学:蒸一蒸,多Agent变成单一模型,效果更好清华系创业,这家企业携手腾讯攻克助听器关键技术难题!清华系出手,推出全面对标Sora的视频大模型今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMath英伟达新核弹B200发布,一台服务器顶一个超算,万亿参数大模型30倍推理加速|亮马桥小纪严选清华系创业新势力!把大模型塞进AR眼镜,高铁上能用10块大屏办公百度VS清华系独角兽对决IPO!估值数百亿,小米腾讯比亚迪都投了从北大附小到清华附中,虽然清华附中不能承诺我们可以一路直升到高中,但也比在北大附中温水煮青蛙要强|清华附中Ava妈妈今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法国产RISC-V狂奔:端侧能跑大模型,AI计算成重头戏
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。