Redian新闻
>
上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译

上海AI lab开源LLaMAX,用3.5万小时的A100训练让大模型掌握上百种语言翻译

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理看张手绘草图就能合成图形程序,加州伯克利让扩散模型掌握新技能开源仅 1 天就斩获近万星!超越 RAG、让大模型拥有超强记忆力的 Mem0 火了!马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源马斯克豪掷40亿购10万张H100训Grok 3!自曝Grok 2下月上线,巨额博弈剑指OpenAI这还咋过,美女对上百种食物过敏。公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4阿里开源语音处理模型 FunAudioLLM :50 种语言无缝翻译,还能识别语音情绪Meta新模型NLLB获Nature盛赞,200种濒危语言高质量翻译,「不让任何语言掉队」从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效字节跳动开源Linux内核网络抓包工具netcap英伟达又涨了!“中国特供”B20芯片被曝,马斯克豪掷10万块H100训Grok,算力是GPT-4的四倍!阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种贾佳亚团队新作:10k数据让大模型数学能力超GPT-4微软&清华提出全新预训练范式,指令预训练让8B模型实力暴涨!实力碾压70B模型开源仅 1 天就斩获近万星!超越 RAG、让大模型拥有超强记忆力的 Mem0 火了全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型10万奖金池!CCF开源创新大赛-大模型开源任务挑战赛,等你来战!阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型1.6万块H100训Llama 3.1,每3小时故障1次!罪魁祸首竟是GPU和HBM3显存苹果大模型新成果:GPT-4o扮演用户,在场景中考察大模型工具调用,网友:Siri也要努力 | 开源开源Llama 3.1一夜成最强大模型!超越闭源GPT-4o,OpenAI坐不住了谷歌翻译宣布新增110种语言:覆盖全球8%人口超ChatGPT-4o,国产大模型竟然更懂翻译,8款大模型深度测评|AI 横评Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效让大模型理解手机屏幕,苹果多模态Ferret-UI用自然语言操控手机对话南洋理工大学安波教授:如何让大语言模型适应动态环境?丨IJAIRR
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。