微软、谷歌和Meta押注合成数据构建AI模型
聊天机器人每一个巧妙的应答背后都有海量数据作为支撑——在某些情况下,需要从文章、书籍和网上评论中摘取数万亿个词汇,以教会人工智能系统理解用户的查询。业界的传统观点是,创建下一代人工智能产品将会需要越来越多的信息。
然而,这个计划存在一个大问题:互联网上能够提供的高质量数据是有限的。为了得到这些数据,人工智能公司通常的做法是,要么向出版商支付数百万美元以获得内容许可,要么从网站上下载数据,使自己面临版权纠纷的风险……
继续阅读
全文共计2067字
点击文章底部「阅读原文」看全文
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章