Redian新闻
>
13亿美元!!!Databricks巨资收购大模型初创公司MosaicML!!!

13亿美元!!!Databricks巨资收购大模型初创公司MosaicML!!!

科技

本文首发微信公众号:飞总聊IT

Databricks官宣,自己花了13亿美元,买了一家叫做MosaicML的大语言模型初创公司。


大语言模型真的是越来越重要, 所以Databricks也坐不住了。毕竟自己号称是Data+AI的公司。这两年Data风风火火的搞了Lakehouse,AI连毛都没见到。


遇到大模型横空出世,Databricks自己做不出来,也就只能买买买了。反正Databricks不缺钱。最近的一次融资之后估值到了380亿美元,拿出13亿美元,那就是easy得很了。


MosaicML是OpenAI的竞争对手,做的事情就是建立一个平台,帮助企业训练大语言模型,然后部署大语言模型和相关的工具。


根据公开的信息,MosaicML上一轮的融资的估值,只有2.22亿美元。而它融资只融资了6400万美元左右。


我们知道,GPT-4这种模型,训练费用就几百几千万美元的,MosaicML这么一点融资,做大模型,只够洒洒水的,训练大语言模型的一根毛估计问题不大,训练个GPT-4什么的,考虑一下人工成本,那就不好说了。


但是不管怎么样,以6倍估值的溢价被收购,也是值了。当然,这要看和谁比,毕竟微软给OpenAI投资了100亿,OpenAI的估值有400亿,和Databricks差不多。


从这个角度来说,MosaicML显然也是Databricks更好的选择,毕竟OpenAI买不起。


那么这个MosaicML和OpenAI以及Bard之类的有什么区别呢?按照我查到的说法,主要有两点。


首先,MoSaicML的模型是开源的。它的MPT-7B开源模型,目前为止有300多万的下载,也是一个比较流行的开源大模型。


其次,也是最重要的,MosaicML的商业模式,或者说它们聚焦的点,是帮助每个企业,用自己的数据来训练自己的私有大模型。


这个做法,和OpenAI先用公域数据训练一个baseline model,然后通过finetune的方式来引入企业的专有知识,是不一样的。


飞总拍脑袋想了一下,最大的好处,其实就是“干净”。举个例子,如果我们想构建一个以中国法律为体系的专有大语言模型,那么OpenAI的模型拿过来finetune就很麻烦了。


因为OpenAI本身就用了很多带有美国法律的语料预先训练的。这个时候用中国法律的语料不管你怎么样去做finetune,最后出来的大模型,一定都会有问题。


我们可以看到的一个互联网上具体的例子是文心一格画图的时候,输入一只爱国的猫,最后画出来的猫带着美国国旗。后来百度修复这个bug的“办法”是把相关的关键词,比如爱国,猫,之类的直接在输入端禁止了。


百度为什么非要这样去修复呢?因为语料训练本身出了问题,导致这个大模型无法应对冲突的语料。


所以,一个企业如果想要训练出自己的专有大模型的话,语料的纯净很重要。不然的话,一旦基础模型和自己的专有数据之间有矛盾,那大模型就不知道怎么办了,仅仅通过finetune显然无法修复这样的问题。


这就是为什么很多人认为开源的和专有的大模型很有前途。当然,是不是真的有前途,还取决于模型到底是不是真的够智能,够聪明。而后者从目前来看,还很难打败GPT-4。


但是不管怎么样,MosaicML也算是一个非常有特色的创业公司,选择了有特色的创业方向。


Databricks的CEO表示两家公司都有相同的vision,相同的开源理念,相同的客户价值观等等。


Databricks还表示收购完成以后,整个MosaicML的团队都会加入Databricks。


不得不说,在大语言模型这件事情上,Databricks下手确实比竞争对手Snowflake快的多,狠的多。


从短期看,Databricks踩到了风口上,就可以趁着大语言模型的疯狂,再涨一波估值了。打败Snowflake指日可待啊。


长期的未来就取决于MosaicML和Databricks两家能不能够拿出业绩来了。

最后,再宣传一下飞总的ChatGPT朋友圈。飞总的朋友圈聚焦在大模型的技术和商业上,欢迎志同道合的人一起加入学习研究

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI初创公司,用英伟达GPU抵押融资23亿美金前端容易出神话?从高中辍学到价值 10 亿美元的初创公司2860元的垃圾桶火了;思科斥资1.5亿美元收购WG2;初创公司靠软件挑战NVIDIA的AI垄断 | AIoT情报天哪!!Databricks竟然这样。。。乌克兰曾与纳粹合作屠杀百万犹太人,许多犹太女子被当街脱衣侮辱 【转贴】OpenAI明年目标收入10亿美元,收购一家游戏初创公司老婆和炸弹AIGC 领域最大收购:Databricks 花费 13 亿美元买下只有 15 名研发的小公司!独家 | 多模态大模型初创企业“智子引擎”,近日完成千万元天使轮融资大模型让数据库行业撕起来了:Databricks和Snowflake让开发者选边站首款大模型杀进C-Eval榜单前三,这家仅成立两个月的初创公司凭什么?马斯克结束中国行/中国AI公司MiniMax获2.5亿美元投资/《黑镜》第六季放出全新预告数十家企业参编中国大模型标准;大模型创企获2.5亿美元投资;微软签署数十亿美元AI算力协议丨AIGC大事日报大模型让数据库行业先撕起来了,Databricks和Snowflake:开发者们你们现在必须选边站了最航运 | 刚刚达飞发布第一季度业绩报告!再赚20亿美元!收购收购收购!AIGC领域最大收购:Databricks花费13亿美元买下只有15名研发的小公司!一周全球十大并购:STG将以14亿美元收购艾维科技 诺和诺德近11亿美元收购代谢药公司Inversago一周全球十大并购:纳斯达克将以105亿美元收购Adenza 邦吉拟82亿美元收购维特拉华为将推盘古数字人大模型;搜狗原CMO加盟王小川公司;首个线性注意力Transformer大模型推出丨AIGC大事日报独家 | 多模态大模型初创企业「智子引擎」,近日完成千万元天使轮融资前哨速览:AI初创公司面对数据荒,Adobe收购Figma遇到监管阻碍62人大模型公司卖了93亿元!AIGC最大收购案诞生:华人联创,两年估值翻6倍又一批千万富翁!这家初创公司遭天价收购,每位员工价值$2100万火星乐园第三部《灰界》第十一章 死神祝福获米哈游投资后,AI大模型公司MiniMax再获腾讯投资、估值12亿美元股票暴涨!!!微软大模型脚踩两只船,Copilot收巨资!!!顺丰通报38万元劳力士手表遗失事件进展;多家物流公司回应北京降雨影响;京东辟谣全资收购永辉丨大公司动态制药公司MIRA美股上市:募资800万美元 市值1亿美元六月!!!来势汹汹!!!Databricks撕逼Snowflake!!!斥巨资收购领英,微软的这场“豪赌”值得么?又是一批千万富翁!湾区初创公司遭天价收购,每位员工价值$2100万世界几大文化和吵闹5 年内,人类程序员将不复存在?10亿美金AI初创公司CEO语出惊人宾州詹金斯植物园(Jenkins Arboretum),融入花海一周全球十大并购:Reata获百健73亿美元收购 阿斯利康斥资10亿美元收购辉瑞旗下罕见病基因治疗产品组合
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。