人类数据告急,微软OpenAI开始用AI喂AI,Altman放话:未来所有数据都将变成合成数据
大AI合成数据,小AI吃
能从网上获取数据当然更好,但网络数据太杂乱了,完全无法满足需求。相比之下,合成数据已经非常多了,即使它还没被广泛传播。
背后产业链已出现
使用合成数据训练,会让模型出现不可逆转的缺陷: 忘记那些“不可能发生的事件”,最终被自己生成的数据毒害。
[1]https://www.ft.com/content/053ee253-820e-453a-a1d5-0f24985258de
[2]https://the-decoder.com/gpt-4-architecture-datasets-costs-and-more-leaked/
[3]https://arxiv.org/pdf/2306.11644.pdf
[4]https://arxiv.org/pdf/2305.17493v2.pdf
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章