数据更多更好还是质量更高更好?这项研究能帮你做出选择
当计算预算低时,重复使用高质量数据更好;当不差钱时,使用大量数据更有利。
论文标题:Scaling Laws for Data Filtering—Data Curation cannot be Compute Agnostic 论文地址:https://arxiv.org/pdf/2404.07177.pdf 代码地址:https://github.com/locuslab/scaling_laws_data_filtering
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章