4、百川智能发超千亿参数大模型Baichuan 3
彭博社记者马克·古尔曼1月28日报道,苹果iOS 18将采用生成式AI技术,以提升Siri和Messages应用程序在问答和自动补全句子方面的能力。昨天,谷歌Bard在加州大学伯克利分校主导的lmsys大模型排名中,超过GPT-4,跃居第二名,仅次于OpenAI最新的GPT-4 Turbo模型。就在前一天,谷歌首席科学家Jeff Dean在社交平台X上提前透露了谷歌的最新版模型Gemini Pro-scale。上海AI实验室微信公众号昨天宣布推出全面升级的图文混合创作大模型书生·浦语灵笔2.0(InternLM-XComposer2),书生·浦语灵笔2.0是在书生·浦语2.0的基础上通过图文拓展训练获得的。基于InternLM2强大的语言建模能力,浦语灵笔2.0的图文理解和创作能力显著提升,可为用户提供图文创作体验,在12项图文能力评测中领先同量级开源模型。书生·浦语灵笔2.0开源了图文创作大模型(InternLM-XComposer2-7B)和它背后的图文理解与问答模型(InternLM-XComposer2-VL-7B),均提供免费商用。开源仓库(包括模型和代码):
https://github.com/InternLM/InternLM-XComposer
技术报告:
https://github.com/InternLM/InternLM-XComposer/blob/InternLM-XComposer2/InternLM-XComposer2-Report.pdf
4、百川智能发超千亿参数大模型Baichuan 3
今天,百川智能正式发布超千亿参数大语言模型Baichuan 3。Baichuan 3基础能力全面提升,在多项权威评测CMMLU、GAOKAO和AGI-Eval中,Baichuan 3中文任务成绩超越GPT-4。对逻辑推理能力及专业性要求较高的MCMLE、MedExam、CMExam等权威医疗评测上,Baichuan 3中文效果同样超过GPT-4。
https://www.baichuan-ai.com/据证券时报1月27日报道,近期又有新的一批国产大模型通过备案。经梳理,此批共有13家企业共计14款国产大模型入列。大模型产品通过备案的企业中,既有第四范式、零一万物、衔远科技、识因智能等AI企业,也有小米、智联招聘、Boss直聘、脉脉、什么值得买、步刻科技、新壹科技、创思远达、掌阅等垂直领域的厂商。据多位社交平台X上的网友发文,OpenAI此前重磅更新的5个新模型,其中两个新的文本嵌入模型的嵌入技术,与2022年5月一篇论文中提出的Matryoshka Representation Learning方法相同。论文链接:
https://arxiv.org/pdf/2205.13147.pdf
据钛媒体App今天报道,360集团全新升级的大模型搜索产品“360 AI搜索”移动App日前正式上架多个安卓应用商店中,版本为1.0.0。当用户在360AI搜索中输入任何问题时,都会触发一系列复杂的处理流程,包括进行问题分析、网页检索、重新匹配排序、提取内容等流程,最终会根据用户的问题生成逻辑清晰、有理有据、追根溯源的答案。据外媒1月27日报道,美国商务部长吉娜·雷蒙多近期在一次公开活动中透露,拜登政府提议要求美国云计算公司确定外国实体是否正在访问美国数据中心以训练AI模型。据彭博社1月29日报道,我国AI教育公司可之科技董事长王冠本月在世界经济论坛期间告诉彭博社,可之科技正在与投资者进行谈判,目标是筹集高达5亿元人民币资金。该公司的目标是开发AI来自动化“高考”的评分。马斯克昨天在社交平台X上发布推文,否认了此前外媒爆料xAI正在洽谈以200亿美元的估值融资至多60亿美元。马斯克称:“xAI没有筹集资金,我也没有就此与任何人进行过对话。”印度企业家、印度网约车平台Ola创始人巴维什·阿加瓦尔(Bhavish Aggarwal)1月26日在社交平台X发文,他创办的AI创企Krutrim宣布完成经纬印度牵头的5000万美元融资,公司估值达到10亿美元。Krutrim在梵语中意为“人工”,该公司还在开发数据中心,最终目标是为AI生态系统制造服务器和超级计算机。