Redian新闻
>
大模型研究获最佳论文,WWW 2024奖项出炉

大模型研究获最佳论文,WWW 2024奖项出炉

公众号新闻

机器之心报道

编辑:陈萍
本次公布的获奖论文中,有多位华人作者。


The Web Conference(前身为 International World Wide Web Conference,WWW)会议是万维网领域的顶会,由图灵奖得主 Tim 创办,被中国计算机协会将其认证为 CCF-A 类会议,每年举办一次。


目前大会公布了最佳学生论文奖、最佳论文奖以及时间检验奖。



最佳论文奖


WWW 2024 最佳论文颁给了和大模型相关的研究。




  • 标题:Mechanism Design for Large Language Models

  • 论文地址:https://arxiv.org/pdf/2310.10826

  • 作者:Paul Dütting、Vahab Mirrokni、Renato Paes Leme、Haifeng Xu、Song Zuo

  • 机构:Google Research、芝加哥大学


这篇论文作者共有 5 位,包括两位华人。


Haifeng Xu 是芝加哥大学助理教授,并领导了 Sigma 实验室。在此之前,Haifeng Xu 在哈佛大学做过博士后,导师是 Yiling Chen 和 David Parkes,在南加州大学(USC)获得了计算机科学博士学位,导师是 Shaddin Dughmi 和 Milind Tambe(现任哈佛大学教授)。


图源:https://twitter.com/DSI_UChicago/status/1790839792906944650


Song Zuo 现在是谷歌研究科学家,此前,他在清华大学获得博士学位,本科毕业于清华姚班,主要研究方向为拍卖与机制设计,经济学与计算。



本文研究了拍卖机制(auction mechanisms),以支持人工智能生成内容的新兴格式。他们特别研究了如何以激励相容的方式聚合多个大型语言模型(LLM)。在这个问题中,每个智能体对随机生成内容的偏好被描述 / 编码为一个 LLM。这项研究的一个关键动机是设计一种 AI 生成广告创意的拍卖格式,以结合不同广告商的输入。研究者认为,尽管这个问题总体上属于机制设计的范畴,但它具有几个独特的特征。

本文提出了一种通用形式 ——  token auction 模型来进行研究。该模型的一个关键特征是,它以 token 为单位进行操作,并允许 LLM 智能体通过单维度出价的方式来影响生成的内容。


本文首先探索了一种稳健的拍卖设计方法,在这种方法中,本文假设智能体偏好比结果分布更具有部分顺序。他们提出了两种自然的激励属性,并证明这些属性等同于分布聚合的单调性条件。本文还证明,对于这种聚合函数,即使在没有竞标者估值函数的情况下,也可以设计出第二价格拍卖(second-price auction)。接下来,本文通过聚焦于基于 KL 散度(LLM 中常用的损失函数)的具体估值形式,设计了具体的聚合函数。结果表明,福利最大化(welfare-maximizing)的聚合规则是所有参与者目标分布的加权(对数空间)凸组合。最后,本文通过实验结果支持了 token 拍卖的形式化。


两个不同的聚合函数生成的文本


最佳学生论文奖


来自爱丁堡大学的研究者摘得了本届最佳学生论文奖。



  • 标题:Stable-Sketch: A Versatile Sketch for Accurate, Fast, Web-Scale Data Stream Processing

  • 论文地址:https://homepages.inf.ed.ac.uk/ppatras/pub/webconf24.pdf

  • 作者:Weihe Li、Paul Patras

  • 机构:爱丁堡大学


论文摘要:数据流处理在各种与网络相关的应用中起着关键作用,包括点击欺诈检测、异常识别和推荐系统。然而,在数据流中准确快速地检测与这些任务相关的项目(如热门项目、重大变化项目和持久项目)并非易事。这是由于当前系统中不断增加的流速、有限的快速内存(L1 缓存)以及实际遇到的高度偏斜的项目分布。


本文引入了 bucket 稳定性的概念,它量化了记录项目变化的程度,并证明这是识别不同项目类型的强大指标。


在此基础上,本文提出了 Stable-Sketch,它利用了多维信息,包括项目统计和 bucket 稳定性,并采用随机方法来驱动替换决策。研究者对 Stable-Sketch 的误差范围进行了理论分析,并进行了大量实验,证明本文的解决方案在各种项目检测任务中,即使在内存紧张的情况下,也能实现更高的准确性和更快的处理速度。


首尔时间检验奖(Seoul Test of Time Award)


来自斯坦福大学的 Taher H Haveliwala 获得了时间检验奖。



  • 标题:Topic-Sensitive PageRank

  • 论文地址:http://www-cs-students.stanford.edu/~taherh/papers/topic-sensitive-pagerank.pdf

  • 作者:Taher H Haveliwala

  • 机构:斯坦福大学


在原始的 PageRank 算法中,通过计算一个单一的 PageRank 向量,并利用网页的链接结构来捕捉网页的相对重要性,然而这一过程与任何特定的搜索查询无关。


为了产生更准确的搜索结果,本文建议计算一组 PageRank 向量,从而使用一组具有代表性主题的偏置向量,以更准确地捕获特定主题的重要概念。通过使用这些(预先计算的)偏置的 PageRank 向量,本文展示了这种方法可以比使用单一的通用 PageRank 向量生成更准确的排名。


参考链接:https://www2024.thewebconf.org/program/awards/





© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规WWW 2024 | 阿里等提出GraphTranslator,将图模型对齐大语言模型今日arXiv最热NLP大模型论文:NAACL24实锤语言学对大模型“负优化”,抽象语义表示+思维链有损表现今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器《出生的地方》&《听悲伤的情歌》大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事今日arXiv最热NLP大模型论文:Github万星!北航发布零代码大模型微调平台LlamaFactory今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力帝国理工刘教授1v1科研-基于数据驱动的电商定价模型研究|收获一作论文与导师推荐信!37岁离异女贷款17万找对象;王婆说媒:我爱你才会有机会改变今日arXiv最热NLP大模型论文:对指令太敏感?山东大学提出一致性对齐法,治好大模型敏感体质!NSR | 多糖基薄膜在湿态环境下的力学性能和稳定性研究获得新进展今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路AI大模型研究框架北京内推 | 微软亚洲研究院WWE大模型团队招聘大模型研究实习生今日arXiv最热大模型论文:COLING 2024: 复旦发布AoR,层级聚合推理突破大模型复杂推理上限今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力;阿里披露对月之暗面投资详情:8亿美元购入约36%股权丨AIGC日报1小时无痛写论文,巧用AI替自己打工,一键生成论文,开题报告和文献综述的秘诀!月之暗面杨植麟:互联网研发是「种树」,大模型研发是「承包森林」WWW 2024 | 通用可识别、可解释认知诊断框架:开创全新学习者能力建模范式CVPR最佳论文颁给自动驾驶大模型!LLM能突破行业技术“天花板”吗?今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法ICDE’24 | 中国企业首获最佳论文,详解PolarDB Serverless如何在0.5秒内实现跨机迁移2024春假伦敦邮轮行之汉堡AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力|36氪独家联合实验室&飞驳科技:2024医疗AI数字医生与健康科普大模型研究报告WWW 2024 | 港理工等联合提出线性时间图神经网络,适用于大规模推荐系统今日arXiv最热NLP大模型论文:天津大学发布大模型数学能力细粒度评价基准FineMath今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu北京内推 | 阿里通义实验室对话智能团队招聘大语言模型研究型实习生先秦●沧海一粟
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。