在过去的几十年里,以“搜索引擎”为代表的信息检索技术大幅提升了人类从海量互联网数据中获取信息的效率,成为日常生活中不可或缺的工具。然而,以ChatGPT为代表的生成式大语言模型的出现,有望深刻改变人们获取信息的方式,推动信息获取技术的更新升级,甚至可能改变或替代传统搜索引擎。在此背景下,生成式信息检索引起了学术界和工业界的广泛关注。为探讨这一前沿课题,本次论坛以“大模型+信息检索”为主题,设置了精彩的海报交流环节,并邀请了六位学术界和工业界的专家进行特邀报告。
加拿大滑铁卢大学的Charles Clarke教授就“Evaluating Generative Information Retrieval Systems”进行了报告。他指出,在生成式信息检索系统和检索增强生成系统应运而生的背景下,研究者需要重新审视一些经典问题,如“哪一个系统更好”和“搜索结果是否满足了搜索者的信息需求”等。中国人民大学的窦志成教授就“生成式信息检索”这一主题进行了报告,介绍了其团队在生成式信息检索领域的部分工作,包括大模型增强的信息检索、检索增强的大模型以及生成式文档检索等。来自百度公司的殷大伟博士在“When Search Engine Meets LLMs”主题报告中,详细介绍了百度在检索增强生成系统中创新应用大语言模型的情况,包括查询理解、参考检索以及利用用户反馈进行优化等方面的内容。快手公司的张富峥博士分享了快手大模型在短视频场景中的业务应用。他介绍,快手自主研发的大模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写和多轮对话等广泛任务,在中文领域达到了行业领先水平。中国科学技术大学的冯福利教授就“大模型智能体驱动的引导式推荐”进行了报告,介绍了引导式推荐的核心问题与最新进展,包括兴趣驱动的引导序列优化和基于溢出效应的社交引导策略优化;同时探讨了大模型智能体在引导式推荐场景中的前沿应用。中国科学院计算技术研究所庞亮副研究员则围绕“检索增强大模型技术的探索与思考”进行了报告,探讨检索增强技术对大模型技术的影响,并指出这种技术能有效提升大语言模型生成内容的准确性和可信性。此次论坛不仅促进了学术界与工业界在“大模型+信息检索”领域的深入交流,也为相关领域的未来发展指明了方向。与会者纷纷表示,论坛内容丰富、讨论深入,为他们的研究和实践提供了宝贵的参考和启示。
Charles Clarke教授进行题为《Evaluating Generative Information Retrieval Systems》的报告
窦志成教授进行题为《生成式信息检索》的报告
殷大伟博士进行题为《When Search Engine Meets LLMs》的报告
张富峥博士进行题为《快意大模型简介及短视频场景的业务应用》的报告
冯福利教授进行题为《大模型智能体驱动的引导式推荐》的报告
庞亮副研究员进行题为《检索增强大模型技术的探索与思考》的报告
听众积极提问,与专家们展开深入交流