第 47 届国际计算机协会信息检索大会(ACM SIGIR) 于 2025 年 7 月 14 日至 18 日在美国华盛顿特区举行。该会议是信息检索领域的顶级学术会议。刚刚,大会公布了最佳论文奖、最佳论文亚军、最佳论文荣誉提名奖以及时间检验奖等奖项。其中,清华大学、中国人民大学高瓴人工智能学院、小红书团队获得了最佳论文;来自格拉斯哥大学、比萨大学的研究者摘得亚军;最佳论文荣誉提名奖颁给了山东大学(青岛)、莱顿大学、阿姆斯特丹大学的研究者;时间检验奖颁给了清华大学、加州大学圣克鲁斯分校的研究者。
- 论文:Scaling Laws For Dense Retrieval
- 论文作者:方言、Jingtao Zhan、艾清遥、毛佳昕、Weihang Su、Jia Chen、刘奕群
- 机构:清华大学、中国人民大学高瓴人工智能学院、小红书
- 论文链接:https://dl.acm.org/doi/abs/10.1145/3626772.3657743
论文简介:在广泛的任务中,特别是在语言生成中,研究人员都观察到了扩展定律。研究表明大型语言模型的性能遵循模型和数据集大小的可预测模式,这有助于有效且高效地设计训练策略,特别是在大规模训练变得越来越资源密集的情况下。然而,在密集检索中,扩展定律尚未得到充分探索。该研究探索了扩展如何影响密集检索模型的性能。具体来说,研究团队实现了具有不同数量参数的密集检索模型,并使用不同数量的注释数据对其进行训练。该研究使用对比熵(contrastive entropy )作为评估指标,与离散的排名指标相比,对比熵是连续的,因此可以准确地反映模型的性能。实验结果表明,密集检索模型的性能遵循与模型大小以及注释数量相关的精确幂律扩展。此外,该研究还表明,扩展定律有助于优化训练过程,例如解决预算约束下的资源分配问题。这项研究极大地有助于理解密集检索模型的扩展效应,为未来的研究提供了有意义的指导。本届 ACM SIGIR 最佳论文亚军颁给了论文「 A Reproducibility Study of PLAID 」。论文作者包括来自格拉斯哥大学的 Sean MacAvaney、以及来自比萨大学的 Nicola Tonellotto。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
论文地址:https://arxiv.org/pdf/2404.14989论文摘要:ColBERTv2 的 PLAID 算法使用聚类术语表示来检索和逐步剪枝文档,以获得最终的文档评分。本文复制并填补了原文中缺失的空白。通过研究 PLAID 引入的参数,研究者发现它的帕累托边界是由三个参数之间的平衡形成的。超出建议设置的偏差可能会大大增加延迟,而不一定会提高其有效性。基于这一发现,本文将 PLAID 与论文中缺失的一个重要基线进行比较:对词汇系统进行重新排序。发现在初始 BM25 结果池之上应用 ColBERTv2 作为重新排序器,在低延迟设置中提供了更好的效率 - 有效性权衡。这项工作强调了在评估检索引擎效率时仔细选择相关基线的重要性。此次会议的最佳论文荣誉提名奖由山东大学(青岛)、莱顿大学、阿姆斯特丹大学的研究者摘得。获奖论文为「 Generative Retrieval as Multi-Vector Dense Retrieval 」。
- 论文作者:吴世广,魏闻达,张孟奇,陈竹敏,马军,任昭春,Maarten de Rijke,任鹏杰
- 论文地址:https://arxiv.org/pdf/2404.00684
论文摘要:本文通过证明生成检索和多向量密集检索共享相同的框架来衡量文档查询的相关性。具体来说,他们研究了生成检索的注意
力层和预测头,揭示了生成检索可以理解为多向量密集检索的一个特例。这两种方法都通过计算查询向量和文档向量与对齐矩阵的乘积之和来计算相关性。 然后,研究者探讨了生成检索如何应用此框架,他们采用不同的策略来计算文档 token 向量和对齐矩阵。并进行了实验来验证结论,表明这两种范式在其对齐矩阵中都表现出术语匹配的共性。本届 ACM SIGIR 时间检验奖颁给了 10 年前在 SIGIR 2014 上发表的关于可解释推荐的研究,论文为「 Explicit Factor Models for Explainable Recommendation based on Phrase-level Sentiment Analysis 」。
- 论文作者:张永锋、 赖国堃 、 张敏 、 Yi Zhang 、 刘奕群 、马少平
- 论文链接:https://www.cs.cmu.edu/~glai1/papers/yongfeng-guokun-sigir14.pdf
该研究首次定义了「可解释性推荐」问题,并提出了相应的情感分析方法用于解决这一技术挑战,在相关领域一直发挥着引领作用。论文摘要:基于协同过滤(CF)的推荐算法,例如潜在因子模型(LFM),在预测准确率方面表现良好。然而,潜在特征使得向用户解释推荐结果变得困难。幸运的是,随着在线用户评论的不断增长,可用于训练推荐系统的信息不再仅限于数字星级评分或用户 / 商品特征。通过从评论中提取用户对产品各个方面的明确意见,可以更详细地了解用户关心的方面,这进一步揭示了做出可解释推荐的可能性。本文提出了 EFM(Explicit Factor Model )来生成可解释的推荐,同时保持较高的预测准确率。研究者首先通过对用户评论进行短语级情感分析来提取显性产品特征和用户意见,然后根据用户兴趣的特定产品特征和学习到的隐藏特征生成推荐和不推荐。此外,从模型中还生成了关于为什么推荐或不推荐某件商品的直观特征级解释。在多个真实数据集上的离线实验结果表明,该研究提出的框架在评分预测和 top-K 推荐任务上均优于竞争基线算法。在线实验表明,详细的解释使推荐和不推荐对用户的购买行为更具影响力。ACM SIGIR 青年学者奖旨在表彰在信息检索研究、学者社区建设、推进学术公平等方面发挥重要作用的研究人员,要求授予获得博士学位 7 年以内的青年研究学者。来自清华大学计算机系的助理教授艾清遥、来自中国科学技术大学网络空间安全学院、大数据学院教授、博士生导师王翔获得了 SIGIR 2025 青年学者奖。艾清遥是清华大学计算机系助理教授,主要研究领域集中在信息检索、机器学习以及自然语言处理研究方面。重点研究方向为智能信息检索系统的研究与设计,包括信息表示学习、排序优化理论、大语言模型在互联网搜推和智慧司法上的应用等。王翔是中国科学技术大学网络空间安全学院、大数据学院教授、博士生导师。王翔教授的研究兴趣包括信息检索、数据挖掘以及可信、可解释人工智能,特别是推荐系统、图学习和社交媒体分析。
相关推荐:
AI写文配图怎么做?让创作更加高效与精彩
AI缩写在线:让人工智能助力你行业前沿技术,ai uhrehara
ChatGPT昨晚突然不能使用,背后真相令人意想不到!,edga ai
免费网站优化平台,助你轻松提升网站流量与排名
轻松获取知乎精华内容,知乎文章采集器助你一键收集优质知识
ChatGPT模型进化历程:人工智能的智慧革命,ai 喷枪星空
ChatGPTApp怎么调大字体?提升阅读体验,让文字更清晰,推荐ai音频
AI智能工具的无限可能:未来已来,你准备好了吗?
ChatGPT异常了:人工智能的极限与突破,ai and ethics
智能AI生成文章释放创作新可能
AI缩写文本:助力智能生活的革新力量,ai智能写作生成神器下载
摘要AI生成:高效工作的新时代利器
推荐SEO网站排名:如何提升您网站的曝光率与排名?
AI创作出来的文章作品著作权归谁?人工智能时代的法律与伦理
AI在线写作免费一键生成,轻松实现高效创作
AI写作一键生成免费:开启智能写作的新时代
AI网页效果生成:开启网站设计的新纪元,ai画线祥云
AI写文章机器人:开启智能写作新时代
深度市场的利器DeepSeek软件,你不可错过的智能助手
打造高效创作体验,写文章AI软件重塑内容生产力
网站推广优化多少钱?了解价格与服务,打造高效营销策略
为什么新手做seo好做,为什么要懂seo ,ai变医院
seo网站代码是什么,网站专业术语中seo意思是什么 ,类ai写作
如何做好外贸网站SEO,提升全球曝光率
用AI写科普文章:科技改变写作的未来
AI写作,每个人生成的一样吗?
好用的AI写作工具免费,提升创作效率不容错过!
新开网站SEO优化:如何让你的新网站脱颖而出,吸引大量流量
AI帮写文章,让写作变得更高效、轻松!
目前最火的AI软件有哪些?深度解析必备工具
SEO问答推广价格,如何让您的品牌轻松脱颖而出
SEO网站关键词优化怎么做,轻松提高网站排名
文章AI思维导图自动生成助力创作的智慧之源
AI写文章生成器内容创作的新高度
seo网络上什么意思,seo表示什么 ,ai换透视
AI写作会出现同一篇文章吗?AI创作的无限可能
提升网站曝光,搜狗SEO优化排名的秘诀
如何免费优化网站,提高排名与流量
AI写原创文章创作新高度,赋能你的内容营销
AI写作稿子:如何用人工智能助力创作,提升写作效率与质量
seo是什么化学元素,seo表示什么 ,小熊 ai
哪个作文软件好用?从此告别写作困扰!
亚马逊的seo是什么阿,亚马逊seo项目 ,能写作文的软件ai
seo经验是什么,seo进阶 ,ai练字笔 杭州
ChatGPT崩一次多久修复?揭秘背后的技术与保障,ai1818818
如何通过SEO引擎优化提升网站关键词排名,助力网站流量增长
可以数作文字数的软件有哪些?轻松统计,提高写作效率!
Bing学术搜索结果不显示时间?如何解决这一问题,提升学术研究效率!,ai怎么参考线
SEO是什么粉底液,seo是什么seo怎么做 ,ai文字设计 价格
内容创作新时代:自动生成文章的AI如何改变写作生态