当前位置:首页 > 新闻中心 > 学会新闻

精彩回顾|中国大模型大会“大模型+机器翻译”专题论坛

来源:中国中文信息学会发布时间:2024-07-03

“大模型+机器翻译”论坛由中国中文信息学会机器翻译专委会承办,共邀请4位专家学者做特邀报告并举办专题研讨会,由苏州大学李军辉教授主持。

南京大学黄书剑副教授的报告题目是“大语言模型的多语言能力及其应用”,报告指出,大语言模型展示了强大的多语言能力,能够进行多语言之间的翻译以及与用户进行不同语言的交互。该报告介绍其研究组在大模型多语言能力应用方面的尝试,包括:通过多语言指令微调以提升翻译能力;利用大规模模型中的翻译知识来增强小规模模型的机器翻译能力;通过以翻译为核心的策略提升大模型在不擅长语言上的综合能力等。这些研究旨在将大语言模型打造成为不同语言用户之间的有效桥梁,为各语言用户提供更公平的服务。

东北大学肖桐教授的报告题目是“机器翻译与大语言模型的对立统一”,报告认为,大语言模型的兴起极大地推动了自然语言处理技术的进步。其中最为有意义的是,这些模型以统一的框架解决了众多不同的问题,展现出卓越的通用性和泛化能力。在机器翻译领域,人们不禁会问:大语言模型是否会取代传统的机器翻译方法?当前的趋势似乎在证明这一点。许多机器翻译领域的传统难题,如交互翻译、结构化输入、长文本翻译,都可以用大语言模型更好的解决。然而,我们发现,大语言模型和神经机器翻译模型本质上是相通的,二者在模型结构、多语言学习和Scaling laws等方面都显示了一定的统一性。通过结合这两类模型的优势,可以创造出更强大、高效的翻译模型。我们乐观的期待,在大语言模型发展的浪潮下,机器翻译能够迎来更大的发展。在拥抱这一变革的同时,我们仍可以不忘初心。

华为高级技术专家杨浩博士的报告题目是“大模型机器翻译研究和实践”,报告主要介绍大模型翻译的三段式微调,机器翻译+思维链的跨语言知识迁移,指导模型生成和评估,领域知识挖掘和RAG增强,从模型架构、训练微调、知识增强和交互等多方面探讨大模型机器翻译优化研究和实践。

中国科学院自动化研究所张家俊研究员的报告题目是“多语言大模型:提升低资源语言能力”,报告提到,随着模型参数与训练数据的不断增长,大语言模型展现出越来越强、越来越通用的能力。但是,无论是闭源模型还是开源模型,主要聚焦英文和中文等资源丰富语言,即使支持多种语言,不同语言之间的能力差距却非常显著,甚至无法理解和生成低资源语言。如何提升大语言模型的低资源语言处理能力、促进语言平等成为亟待解决的一个核心问题。该报告还从跨语言对齐的角度系统介绍了低资源语言能力的提升方法。

特邀报告环节之后,与会嘉宾继续围绕大语言模型时代下机器翻译产业发展,技术创新、未来发展与机遇等方面深入探讨。与会者一致认为,本次论坛汇聚了机器翻译领域技术研发与优化、翻译实践、多语言应用等多个方面的不同观点,为该领域的科研学者以及行业从业者提供了新思路。