Call for Participation
Shared Tasks in CCKS2016
September 19 – 22, 2016, Beijing, China
http://ccks2016.cipsc.org.cn/ or http://ccks2016.cn
全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专家委员会负责组织和承办。CCKS2016源于国内两个主要的相关会议:中文知识图谱研讨会Conference onChinese Knowledge Graph (KG)和中国语义互联网与Web科学大会Chinese Semantic Web and WebScience Conference (CSWS)。首届中文知识图谱研讨会于2013年在苏州举行,随后分别在武汉、宜昌成功举办第二次和第三次研讨会。CSWS首次会议于2006年在北京举办,随后的近十年里,逐渐成为国内语义技术领域的主要会议。新的知识图谱与语义计算大会将致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议,并聚集了知识表示、自然语言处理、机器学习、数据库、图计算等相关领域的重要学者和研究人员。
经过多轮任务征集以及CCKS2016程序委员会的讨论,此次会议共举行实体发现与实体链接、链接预测与元组分类、产品预测等三个任务。评测数据由清华大学、豆瓣、微软、华东理工大学、东南大学、KCOMBER公司联合提供。我们欢迎来自学术界、工业界的研究者积极参加本次评测。
评测任务任务介绍
本评测任务为限定领域的实体发现与实体链接,简称DSEDL (Domain-Specific Entity Discovery andLinking)。即对于给定的一组限定领域的纯文本文件,任务的目标是识别并抽取出与领域相关的实体名字(mention),并将它们链接到给定知识库对应的实体(entity)。实体名字具有歧义性和变异性,也就是同一个实体名字,有可能指代多个实体,需要根据上下文消歧;此外,同一个实体可能有多个实体名字与之对应,比如别名,绰号,昵称等等,需要将这些所有的名字变种都识别出来。
本任务基于图数据挖掘中链接预测的基本思想,通过计算尚未建立链接的两个entity发生链接的概率,实现图数据中entity与entity之间的链接关系预测。举例说明,已知下面两个三元组<entity A,配偶,entity B>与<entity B,儿子,entity C>,可以预测出<entity A,儿子,entity C>;或者已知三个三元组<entity A,生产,entity C>,<entity B ,生产,entity D>,<entity C,竞争,entity D>,可以预测出<entity A,竞争,entity B>。
同时我们设定三元组分类(triple classification)任务,其表示的意义是对于预测的三元组判断对与错,即一个三元组是正确的,那么triple classification是正确的,否则是错误的。例如,三元组<姚明,出生地,上海>的triple classification是正确的,而三元组<姚明,性别,女>的tripleclassification是错误的。三元组分类的正确与否直接关系图数据库的质量,同时对于知识推理、问答系统有着非常重要的影响。
本项任务主要是一个对进出口交易记录数据进行产品预测任务。本次任务有19046条数据记录,其中的18279条记录是有类别属性的,可作为分析时的训练样本,而任务目标是根据历史产品交易记录数据,针对当前767条测试数据(即交易记录)预测可能的产品信息。
参加注册
请参加单位在5月8日之前,填写注册表,并将注册表发给会议评测共同主席:刘康(中科院自动化所,kliu@nlpr.ia.ac.cn)、王志春(北京师范大学,zcwang@bnu.edu.cn)
重要时间节点
评测组织委员会:
更详细信息,请参见评测主页:http://www.ccks2016.cn/cckszhishitupupi.html