评测主页: http://nlp.nju.
第十三届全国机器翻译研讨会(CWMT 2017)将于2017年9月27日至29日在中国大连举行。根据惯例,
CWMT 2017机器翻译评测方案与上届评测(CWMT 2015)相比有如下变化:
1、汉英、英汉新闻领域的评测项目,
2、新增日汉专利领域的评测项目,
3、本次评测不再设置统一发放数据的时间,
4、此外,本次评测暂停双盲评测(Double Blind Evaluation)项目,
希望本次评测能够促进国内外科研单位、
本次评测的组织信息如下(三个以上的并列项以汉语拼音为序):
评测主办机构:
中国中文信息学会
评测组织单位:
南京大学
中国科学院计算技术研究所
评测资源提供单位:
北京大学
北京语智云帆科技有限公司
点通数据有限公司
东北大学
哈尔滨工业大学
南京大学
内蒙古大学
青海师范大学
西北民族大学
西藏大学
厦门大学
新疆大学
中国科学院合肥智能机械研究所
中国科学院计算技术研究所
中国科学院新疆理化技术研究所
中国科学院自动化研究所
评测委员会主席:
黄书剑(南京大学)
评测委员会委员:
艾山·吾买尔(新疆大学)
魏永鹏(北京语智云帆科技有限公司)
肖 桐(东北大学)
杨雅婷(中国科学院新疆理化技术研究所)
伊力亚尔·加尔木哈买提(南京大学)
张家俊(中国科学院自动化研究所)
赵红梅(中国科学院计算技术研究所)
评测项目
本次评测包含6个评测项目,我们将为各个评测项目的参评单位提供相应的训练语料和开发语料。具体项目设置如表1所示。
表1 CWMT 2017 评测项目表
序号 | 项目代号 | 评测项目名称 | 语种 | 领域 |
1 | CE | 汉英新闻领域机器翻译 | 汉语à英语 | 新闻领域 |
2 | EC | 英汉新闻领域机器翻译 | 英语à汉语 | 新闻领域 |
3 | MC | 蒙汉日常用语机器翻译 | 蒙古语à汉语 | 日常用语 |
4 | TC | 藏汉政府文献机器翻译 | 藏语à汉语 | 政府文献 |
5 | UC | 维汉新闻领域机器翻译 | 维吾尔语à汉语 | 新闻领域 |
6 | JC | 日汉专利领域机器翻译 | 日语à汉语 | 专利领域 |
对于每个评测项目,参评单位可以自由选择所采用的机器翻译技术(如:基于规则的机器翻译技术、基于实例的机器翻译技术、统计机器翻译技术及神经网络机器翻译技术等)。参评单位也可以使用系统融合技术,但在系统描述中必须做出明确说明,并在技术报告中说明进行系统融合的各个单系统的性能。此处,系统融合技术指使用两个及两个以上单系统的翻译结果进行字、词、短语、句子级别的重构或选择的技术。没有明确产生两个或两个以上单系统翻译结果的技术,如统计机器翻译中的协同解码、神经网络机器翻译的输出层ensemble、单个系统结果的重排序等,本次评测不认定为系统融合技术。评测组织方在发布评测结果时,将对使用系统融合技术的系统进行标注说明。