Redian新闻
>
领英是如何利用机器学习解决内容相关威胁和滥用问题

领英是如何利用机器学习解决内容相关威胁和滥用问题

科技

作者|Sergio De Simone
译者|马可薇
策划 | 丁晓昀

领英工程师 Shubham Agarwal 及 Rishi Gupta 解释道,为协助发现并移除违反其标准政策的内容,领英一直在使用自研的 AutoML 框架,该框架可以并行地训练分类器且试验多个模型架构。

我们使用 AutoML 不断重新训练已有模型,将训练所需时间从数月缩短到数天,并减少开发新基线模型所需时间。这也让我们能积极主动地应对新出现的对抗性威胁。

内容审核的关键之一在于持续的执行和调整,以应对规避审核的新手段,除此之外还必须要能适应环境的变化。这些变化包括:数据漂移,即平台上发布的内容会随着对话的进行发生固有变化;全球事件,这类事件往往会在讨论中出现并产生不同观点,其中常充斥着错误信息;对抗性威胁,其中包括欺诈和欺瞒行为,如伪造档案、实施诈骗等。

为应对上述挑战,领英采用的方法目标为“主动检测”,该方法需要一个不断调整和发展其 ML 模型和系统的过程。AutoML 是领英内部研发的工具,全称为自动化机器学习(Automated Machine Learning),用于,通过不断在新数据上重新训练模型、使用假负和假正等数据修正模型、微调参数方式提升机器学习性能。

通过 AutoML,我们得以将过去冗长且复杂的流程转变为精简又高效的流程……在实现 AutoML 后,我们开发新基线模型和持续性重新训练已有模型的平均所需时间从两个月缩短直不到一周。

通过 AutoML,领英工程师实现了数据准备和特征转换过程的自动化,其中包括降噪、降维和特征工程,意在创建用于分类器训练的高质量训练数据集。

在第二阶段,AutoML 通过搜索一系列超参数和优化方式,对比不同分类器架构在一组已定的评估指标下生成的模型性能。

最后,AutoML 将新完成训练的模型供给生产服务器,实现部署过程的自动化。

Agarwal 和 Gupta 认为这套工具仍有一些方面不太成熟,具体来说是需要提高速度和效率,使其能够在更大范围内应用,最终提高对计算能力的要求。他们称,另一个颇具前景的领域是使用生成式 AI,减少标签噪声并生成用于模型训练的合成数据,从而提高数据集质量,

虽然并不是所有的组织都有领英的运营规模,或者能拥有自研 ML 自动化工具的资源,但 Agarwal 和 Gupta 所描述的方式仍可在小规模范围内进行复制,从而减轻机器学习工程师与重新训练已有模型相关的重复性工作量。

原文链接

How LinkedIn Uses Machine Learning to Address Content-Related Threats and Abuse (https://www.infoq.com/news/2024/01/linkedin-automl-content-filter/)

声明:本文为 InfoQ 翻译,未经许可禁止转载。

今日好文推荐

并发王座易主?Java 21 虚拟线程强势崛起,Go & Kotlin还稳得住吗 | 盘点

谷歌新年大裁员,引硅谷裁员潮!OpenAI正式推出GPT Store,但第一批应用已被像素级抄袭;腾讯服务器深夜崩溃 | Q资讯

纯向量数据库和向量插件都有局限,那未来发展有其他方向吗?

系统 bug 致百人入狱,砸了 2.8 亿元仍上云失败!二十年了,这家大企业被日本软件坑惨了

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
美国中小学家长向老师提的50个实用问题二月预告!数学建模、商业分析、量化金融、机器学习、经济管理项目实战开课!【招生】 伦斯勒理工(RPI)- 计算机系Yao Ma - 招收多名人工智能/机器学习/数据科学方向博士生,实习生2024年必读的20本机器学习书籍用问界M9打开《繁花》!一千万以内最好的SUV?博士申请 | 墨尔本大学Ting Dang老师招收机器学习等方向全奖博士生机器学习泰斗Michael Jordan最新报告:去中心化机器学习中的契约、不确定性和激励博后招募 | 南方科技大学荆炳义教授招收大语言模型/机器学习方向博士后Npj Comput. Mater.: 大规模电子结构计算—可迁移的机器学习加速方法博士申请 | 悉尼大学Hesham El Gamal教授招收多模态机器学习方向全奖博士生NTU吕教授1v1科研:基于机器学习的面部表情识别算法|收获一作论文与导师推荐信!思勰投资 | 机器学习研究员招聘(全职/实习)博士招生|香港理工大学 Poly U电子计算学系,机器学习/数据挖掘/人工智能,全奖 PhD/博士后/研究助理科研实习 | 北京大学国际机器学习研究中心张文涛教授招收科研实习生/RA百万offer这么近!机器学习集中热招!南洋理工大学招收机器学习方向博士后/博士生/研究助理奥斯丁芯片代工老厂-赢了日本输给了房东 (1)“留英是一场赌局,我选择德勤,大获全胜”研究没思路的看过来,这是可信机器学习的1000个创新idea2023年度精选论文汇总:股票策略、高频交易、机器学习等十二月预告!数学建模、商业分析、量化金融、机器学习、经济管理项目实战开课!24美高放榜!Top10录取暴跌,如何利用“倒推法”跑赢内卷?量子计算对机器学习算法的革命性影响南大周志华团队8年力作!「学件」系统解决机器学习复用难题,「模型融合」涌现科研新范式AI识别出地震先兆信号?机器学习发现数据神秘关联,人类有望预测地震41、长篇民国小说《永泰里》第九章 欢迎“友”军(3)博士招生|香港理工大学PolyU电子计算学系 机器学习/数据挖掘/人工智能 全奖PhD/博士后/研究助理留学生如何利用寒假高效实习机器学习与量子计算结合,将开出怎样的花朵?对机器学习感兴趣?不如先来实践一下!|《基于机器学习的智能机器狗巡检系统》那个曾经爱唱歌的女孩那个帝国理工女自曝:留英是一场赌局,我差点“满盘皆输”《歌德堡变奏曲1461》挤暖和科研实习 | 伊利诺伊大学香槟分校张潼教授招收机器学习/LLM方向科研实习生
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。