Meta生成式AI竞赛下一站:让开发者靠开源大模型挣钱!
知情人士透露,此举可能会引发AI相关开发人员的狂热支持,因为这些开发者希望获得谷歌、OpenAI出售的相关付费软件的替代品。同时,这也有助于Meta改进自己的AI模型。
今年2月,Meta发布了开源大型语言模型第一个版本LLaMA,可以帮助学术界的研究人员开发ChatGPT的替代品。
▲LLaMA相关研究论文
Meta的大型语言模型虽然只被授权用于研究,但仍然在业内产生了不小的影响。研究人员使用LLaMA来开发开源模型,例如130亿参数规模的开源模型Vicuna,其性能在某些指标上已接近OpenAI、谷歌的大型语言模型。
同时,这一开源大型语言模型在研究领域的应用也能帮助Meta改进自己的产品和模型。今年4月,扎克伯格在与股票分析师的电话会议上称,开发人员开始采用、改进这些模型或者修补安全漏洞,与此同时,Meta也可以将他们对模型的优化集成到自己的大型语言模型中,同时使自己的消费者或者广告产品的体验更好。
扎克伯格此前曾提到,他希望使用社交平台Facebook的小型企业和内容创作者都能拥有“AI agents(AI代理)”,这些代理可以帮助企业和内容创作者自动与客户或者粉丝沟通,代替他们完成工作。他在上周接受采访时说:“LLaMA或它背后的大型语言模型基本上将成为推动它的引擎。”
此前,Meta选择将LLaMA用于研究,所以目前其大型语言模型并不能用于商业目的,这也进一步限制了LLaMA的更广泛应用,同时决定了它被应用于商业应用程序的难度更大。
而特殊情况下,LLaMA也能用于商业用途,但会存在很多限制,比如应用程序访问的专用服务器供应量并不充足,并且这类服务器的成本会更高。
6月初,阿联酋阿布扎比科技创新研究所开发了开源大型语言模型Falcon,该模型已经受到众多开发者青睐。
5月初,The Information曾报道过,有知情人士透露,OpenAI正准备向公众发布一种新的开源大型语言模型。这一计划如果能被推进下去,OpenAI可能会进一步对AI行业产生重大影响。
还有一位直接知情的人士透露,OpenAI已经内部讨论过将大型语言模型用于商业用途。但值得注意的是,这一大型语言模型的性能可能与其最先进的GPT-4有一定差距。
上个月,Meta的首席AI科学家Yann LeCun在接受采访时也提到了为什么Meta迄今尚未许可LLaMA用于商业用途,他谈到两个原因,首先他并不是唯一参与此类决定的人,其次这一决定的执行可能存在法律责任问题。
不过,据一位直接了解情况的Meta前员工称,Meta在发布LLaMA第一个版本的时候就解决了法律问题,当时Meta的法律、产品、隐私部门的员工就如何将其授权给开发者进行了广泛的讨论。
Meta和OpenAI的发言人都拒绝就上述信息置评。
微信扫码关注该文公众号作者