全国知识图谱与语义计算大会(CCKS 2018)在天津隆重召开

2018年全国知识图谱与语义计算大会(CCKS 2018)于8月14日至17日在天津召开,本次会议由中国中文信息学会语言与知识计算专业委员会主办,南开大学软件学院承办,天津大学智能与计算学部协办。会议主题为“知识计算与语言理解”。大会吸引了来自海内外的千余名知名学者、工业界专家和知名企业代表参加,其中主会注册人数超860人。会议回顾了知识图谱与语义计算的进展情况,探讨了领域内的新发现、新技术和新应用,旨在让社会各界了解知识图谱与与语义计算的新方向和新趋势,以推动我国语言与知识计算领域的进一步发展。

CCKS2018会议分为讲习班和主会两个阶段。8月14日至15日,中国中文信息学会《前沿技术讲习班》(ATT)第十一期在南开大学泰达学院报告厅举行。前沿技术讲习班邀请了国内外优秀青年学者及工业界专家,内容涵盖了知识图谱的推理、构建,自然语言的推理、关系抽取及知识图谱应用等方面,分别从知识图谱的构建及在实际场景中的应用等角度介绍了知识图谱的最新进展和实战经验。讲习班开班仪式由浙江大学陈华钧教授和加拿大皇后大学(Queen’s University)的助理教授朱晓丹主持。加州大学圣巴巴拉分校(University of California, Santa Barbara)的助理教授William Wang作了题为“Deep Knowledge Graph Reasoning”的报告,阿伯丁大学(University of Aberdeen)的 Jeff Z. Pan教授作了题为“Exploiting and Reasoning With Open Knowledge Graph”的报告,皇后大学(Queen’s University)的助理教授朱晓丹作了题为“Deep Learning for Natural Language Inference”的报告,卡塔尔计算研究所( Qatar Computing Research Institute)的Preslav Nakov博士作了题为“Semantic Relation Extraction from Text”的报告,阿里巴巴商品知识图谱负责人张伟博士作了题为“特定领域知识图谱的构建及应用案例”的报告;科大讯飞AI研究院语音交互研究主管刘权作了题为“语义计算与知识问答技术在实际场景中的应用”的报告,系统地介绍了在商业领域垂直知识图谱构建和服务的实践。

8月16日至17日,CCKS主会在天津滨海新区滨海一号酒店举行,中国中文信息学会理事长、中国工程院院士方滨兴、南开大学党委副书记李义丹、天津滨海新区副区长夏青林等嘉宾出席大会并致辞。主会包括特邀报告、知识图谱相关顶级会议Review、优秀学术论文报告、优秀测评系统报告、Poster Spot Highlight、知识图谱工业界论坛及知识图谱Panel等环节。特邀报告环节邀请了海内外知名学者和工业界代表介绍了学科前沿信息及重要成果,中国科学院院士张钹作了题为“知识与人工智能”的特邀报告,介绍了知识在未来人工智能发展中的重要性;语义网(Semantic Web)创始人之一James A. Hendler作了题为“ The Semantic Web: Vision, Reality and Revision”的报告;阿里巴巴集团副总裁墙辉在“阿里巴巴生态下的知识引擎” 中介绍了阿里通用知识图谱、商品知识图谱、客服知识图谱等的构建和应用;罗马大学(Sapienza University of Rome)Roberto Navigli教授作了题为“What can you do with multilingual knowledge graphs? Experiences at Sapienza and Babelscape”的报告。

中国中文信息学会理事长、中国工程院方滨兴院士致辞

CCKS2018大会主席、中科院自动化所赵军研究员介绍大会情况

CCKS2018程序委员会主席:清华大学唐杰副教授、中科院软件所韩先培副研究员介绍CCKS2018程序

中国科学院院士张钹进行Keynote报告

语义网(Semantic Web)创始人之一James A. Hendler进行Keynote报告

阿里巴巴集团副总裁墙辉(玄难)进行Keynote报告

罗马大学(Sapienza University of Rome)Roberto Navigli教授进行Keynote报告

        此外,大会还邀请了国内外知名高校、研究院及企业相关领域的知名学者和研究人员,作了有关知识图谱构建、信息抽取、知识存储、检索与推理、知识共享重用与基于知识图谱的问答等主题报告和专题讨论。顶级会议Review环节由复旦大学肖仰华教授、哈尔滨工业大学刘铭副教授和上海交通大学的朱其立教授系统地总结了知识图谱学科方向最新研究进展;评测竞赛环节设立了四个评测任务,分别是“面向中文电子病历的命名实体识别”、“ 面向音乐领域的命令理解任务”、“ 微众银行智能客服问句匹配大赛”和“开放领域的中文问答任务”,吸引了超过80支队伍参赛,以实际任务测评为展示平台,评估现有的技术水平,促进技术发展;CCKS2018新设立了Poster Spot Highlight环节,来自学术界和产业界的72支团队为参会人员简要介绍了各自在知识图谱领域的各类相关工作;工业界论坛邀请了腾讯、阿里巴巴、百度、思必驰、美团点评、文因互联、云知声、北明智通、上海海知智能等产业界专业研发人员分享了知识图谱构建、应用及评测中的实践经验;知识图谱Panel环节邀请了自然语言处理领域资深教授黄昌宁老师、清华大学朱小燕教授、清华大学李涓子教授、文因互联CEO鲍捷、香侬科技创始人李纪为、海知智能CTO丁力和阿伯丁大学(University of Aberdeen)的 Jeff Z. Pan博士,围绕“知识图谱”主题,专家学者进行了广泛的讨论和交流。

大会的中文最佳论文获得者为中科院软件所的《融合结构语义的知识库问答系统》(安波,韩先培,孙乐),大会的英文最佳论文获得者为南京大学的《DSKG: A Deep Sequential Model for Knowledge Graph Completion》(Lingbing Guo, Qingheng Zhang, Weiyi Ge, Wei Hu and Yuzhong Qu)。

CCKS2018 Panel

        CCKS是中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议,致力于促进我国语言与知识计算领域的学术研究和产业发展,为从事相关领域理论和应用研究的学者、机构和企业提供广泛交流的平台。CCKS2018聚集了知识表示及获取、知识推理、自然语言理解、智能问答等相关技术领域的重要学者和研究人员,为所有与会者带来了一场学术与技术的饕餮盛宴。

相关图片

全国知识图谱与语义计算大会(CCKS 2017)在四川成都隆重召开

2017年8月26-29日,全国知识图谱与语义计算大会(CCKS 2017)在四川成都隆重召开。本次会议由中国中文信息学会语言与知识计算专业委员会主办,西华大学承办。大会分为讲习班和主会两个主要环节,其中讲习班暨中国中文信息学会《前沿技术讲习班》ATT第七期的主题是知识图谱。本次大会吸引了来自全国学术界、产业界从事知识图谱相关研究的500多人参加,会议探讨了知识图谱领域的新发现、新技术和新应用,旨在向社会公众介绍知识图谱与语义计算领域的发展趋势和创新成果,进一步推动我国语言与知识计算领域的发展。CCKS 2017大会的主题是:语言、知识与智能。

会议包括学术讲习班、特邀报告、顶级会议Review、工业界论坛、知识图谱评测与竞赛、学术论文及演示等主要环节。其中,特邀报告邀请海内外知名学者介绍学科前沿及重要成果,学术讲习班邀请国内外青年研究学者讲授学术界最新进展和实战经验,工业界论坛邀请产业界的主要研发人员分享经验,促进产学研合作,顶级会议Review系统总结知识图谱学科方向的近年研究进展,评测与竞赛以实际任务为平台促进技术发展并评估现有技术水平,学术论文系统反映国内知识图谱研究进展。会议分为两个阶段举行,第一个阶段的学科前沿讲习班在西华大学进行,第二阶段的大会主会在成都金牛宾馆进行。

8月26-27号是中国中文信息学会《前沿技术讲习班》ATT第七期:知识图谱专题。本次讲习班在西华大学举办。讲习班开班仪式由讲习班主席哈尔滨工业大学秦兵教授和清华大学刘知远助理教授主持。中科院自动化所刘康副研究员和中科院软件所韩先培副研究员做了题为“知识图谱导论”的讲习报告,系统介绍了知识图谱的基本知识、历史沿革、代表图谱和知识表示。北京大学邹磊副教授和复旦大学徐波博士做了题为“知识图谱构建:百科知识图谱构建+基于图的RDF知识图谱数据管理”的报告,系统的介绍了如何构建百科知识图谱和如何存储管理知识图谱。Google资深研究员劳逆博士和复旦大学邱锡鹏副教授做了题为“知识获取方法:传统方法+深度学习”的报告,从历史和当前前沿两个角度系统介绍了知识获取的方法。上海瓦歌智能科技有限公司总经理、深圳狗尾草智能科技公司CTO王昊奋博士、上海海翼知信息科技有限公司创始人胡芳槐博士做了题为“知识图谱实践:知识图谱在金融、医疗领域的应用”的报告,从工业实践的角度展示了如何利用知识图谱构建应用。意大利博尔扎诺自由大学计算机学院助理教授肖国辉博士做了题为“知识图谱虚拟化:基于本体的数据访问,理论和应用”的报告。

ATT现场

8月28-29日是本次大会的主会,本次主会在四川金牛宾馆举办。开幕式由大会本地主席西华大学杜亚军教授主持。开幕式首先由西华大学校领导朱晋蜀副校长致辞,接着由中国中文信息学会名誉理事长、哈尔滨工业大学前党委书记李生教授致辞,随后中国中文信息学会副理事长兼秘书长、中国科学院软件研究所孙乐研究员和本次大会主席清华大学李涓子教授分别致辞,最后程序委员会主席Google资深研究员劳逆博士介绍了会议组织情况。

学会名誉理事长李生教授致辞

学会副理事长兼秘书长孙乐研究员致辞

专委会主任李涓子教授致辞

大会程序委员会主席劳逆博士介绍会议组织情况

本次会议邀请了欧洲科学院院士德国人工智能研究中心Hans Uszkoreit教授,美国知名教育家、学者和企业家Amit Sheth教授,微软亚洲研究院首席研究员林钦佑研究员,中科院自动化所赵军研究员等知名学者与会做4 场大会特邀报告。Amit Sheth教授做了题为“Knowledge will Propel Machine Understanding of Big Data”的特邀报告,报告介绍了如何利用知识来对内容进行更深的理解和充分探索大数据。林钦佑研究员做了题为“人工智能的下一个前沿: 知识计算”的特邀报告,报告系统展示了知识计算如何服务于我们的聊天系统和智能助理。Hans Uszkoreit教授做了题为“Open knowledge, corporate knowledge and the analytics of dynamic unstructured data”的特邀报告,报告展示了如何在工业应用系统中使用知识图谱。赵军研究员做了题为“显式知识在深度学习对话模型中的应用与挑战”的特邀报告,报告系统介绍了如何在深度学习对话模型中利用显式表示的知识。

Hans Uszkoreit教授(德国人工智能研究中心)做特邀报告

Amit Sheth教授(Kno.e.sis, Wright State University)做特邀报告

林钦佑 研究员(微软亚洲研究院)做特邀报告

赵军 研究员(中国科学院自动化研究所)做特邀报告

CCKS 2017新设立了顶级会议review环节,中科院信工所王泉副研究员和南京大学程龚副教授系统的总结了近3年来国际顶级会议上知识图谱的相关进展,并展望了未来的发展趋势。今年的会议延续了CCKS 2016的评测与竞赛环节,CCKS 2017设立了两个评测任务,分别是“问题命名实体识别与链接”和“电子病历命名实体识别”。评测主席北京师范大学王志春副教授介绍了今年评测的组织情况,评测共吸引了超过80家参赛队伍,其中“问题命名实体识别与链接”任务第一名由上海葡萄科技团队获得(具体排名见: https://biendata.com/competition/CCKS2017_1/winners/),“电子病历命名实体识别”任务第一名由哈工大深圳研究生院HITSZ_ICRC团队获得(具体排名见 https://biendata.com/competition/CCKS2017_2/winners/)。

论文报告现场

CCKS 2017共收到投稿85篇,经过通讯评审和会审,共录用中文论文 8篇、英文论文17篇(其中11篇长文、6篇短文),长文录用率为22%。论文出版得到Springer出版社、《模式识别与人工智能》、 《中文信息学报》、 《东南大学学报》和《郑州大学学报》(理学版)等编辑部的大力支持。论文涵盖了知识图谱研究的诸多方面,反映了我国当前知识图谱与语义计算研究的水平。会议设立多个论文session,涉及知识图谱构建、信息抽取、知识存储、检索与推理、知识共享重用与基于知识的系统等主题,以及海报及展示环节等。本次会议由程序委员会选出了最佳论文,其中最佳英文论文由中国科学院自动化研究所的“Attention-based Event Relevance Model for Stock Price Movement Prediction. Jian Liu, Yubo Chen, Kang Liu and Jun Zhao”获得,最佳中文论文由清华大学的“基于 word embedding 的自适应在线事件发现. Bin Zhang, Linmei Hu, Lei Hou and Juanzi Li”获得,同时苏州大学的“中文情感表达组合的抽取. Lu Qi and Chen Wenliang.”和华东理工大学的“BSBM+: Extending BSBM to Evaluate Annotated RDF Features on Graph Databases. Le Zhang, Tong Ruan, Haofen Wang, Yuhang Xia, Qi Wang and Dong Xu.”获得最佳论文提名奖。

在29号的知识图谱工业界论坛环节中,大会邀请了10家单位做邀请报告,分享实践经验。微软亚洲研究员的刘越做了题为“知识图谱在开放域聊天中的应用”的报告,小米公司的王刚做了题为“小米AI音箱中的自然语言处理技术”的报告,龙泉寺的贤度法师做了题为“大藏经整理与研究”的报告,腾讯的鲁楠做了题为” 针对金融智能客服知识图谱的构建“的报告,阿里巴巴的张伟做了题为” 阿里商品知识图谱“的报告,cnSchema的丁力做了” 中文开放知识图谱Schema “的报告,云知声的刘升平做了题为” 基于知识图谱的会话式交互“的报告,数库科技的夏磊做了题为” 金融行业知识图谱应用分享“的报告,广州索答做了题为” 智能厨房问答中的知识图谱技术应用研究“的报告,鼎复数据的吴雪军做了题为” 金融知识图谱自动构建和应用“的报告。工业界论坛同时组织了Panel环节,Panel由浙江大学陈华钧教授担任主持,Panel嘉宾针对知识图谱和聊天机器人的热点进行了深入探讨。

工业论坛Panel

会议期间,语言与知识计算专委会举行了2017年工作会议,会议回顾了专委会过去一年的工作,并对下一年工作进行了安排和讨论。本次工作会议增选中科院软件所韩先培副研究员为专委会副主任,中科院自动化所刘康副研究员为专委会秘书长,海瓦歌智能科技有限公司总经理、深圳狗尾草智能科技公司CTO王昊奋博士和清华大学许斌副教授为专委会副秘书长。专委会工作会议同时增选了15名来自学术界和企业界的新委员。

本次大会关注国内外知识图谱研究领域的最新进展,以及工业界的最新技术,对本领域面临的种种挑战性科学问题和关键技术难题展开了深入研讨,为所有与会者带来了一场学术与技术的饕餮盛宴。经语言与知识计算专委会2017年工作会议决定,2018年全国知识图谱与语义计算大会将在天津举办。

更多会议材料和信息见大会网站:http://www.ccks2017.com

中科院自动化所刘康副研究员做ATT报告

中科院软件所韩先培副研究员做ATT报告

北京大学邹磊副教授做ATT报告

复旦大学徐波博士做ATT报告

复旦大学邱锡鹏副教授做ATT报告

Google资深研究员劳逆博士做ATT报告

海瓦歌智能科技有限公司总经理、深圳狗尾草智能科技公司CTO王昊奋博士做ATT报告

上海海翼知信息科技有限公司创始人胡芳槐博士做ATT报告

南京大学程龚副教授做顶级会议Review报告

中科院信工所王泉副研究员做顶级会议Review报告

北京师范大学王志春副教授做评测综述报告

[评测任务征集]全国知识图谱与语义计算大会(CCKS 2017)

评测任务征集

全国知识图谱与语义计算大会(CCKS 2017)

2017年8月26~29日,成都

http://www.ccks2017.com

全国知识图谱与语义计算大会(CCKS:China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专家委员会组织和承办。全国知识图谱与语义计算大会(CCKS)是国内两个全国会议的合并:中文知识图谱研讨会the Chinese KnowledgeGraph Symposium (CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web andWeb Science Conference (CSWS)。CCKS2016在北京西郊宾馆成功召开,来自学术界和工业界的400余名学者和研究人员参加了会议。全国知识图谱与语义计算大会已经成为国内知识图谱、语义技术、链接数据等领域的核心会议,聚集了知识表示、自然语言理解、机器学习、数据库、图计算等相关领域的重要学者和研究人员。2017年全国知识图谱和语义计算大会将于2017年8月26日至29日在成都召开。

CCKS2017将组织一个评测竞赛workshop,为研究者们提供一个测试技术、算法、及系统的平台。大会诚挚地向相关领域的研究者、研究机构及企业征集评测任务方案。评测竞赛的参与者将会被邀请分享其技术、方法、和经验。

时间安排:

  • 任务征集截止:3月15日
  • 任务准备时间:3月20日-4月15日
  • 评测任务发布:4月15日
  • 报名时间:4月15日—5月2日
  • 训练及验证数据发布:5月2日
  • 测试数据发布:7月17日
  • 提交测试结果:7月18日
  • 评测论文提交:8月6日
  • CCKS会议日期:8月26日—29日

评测主席:

评测任务方案请通过邮件发送给评测主席,方案中应详细描述任务内容以及评测数据的准备过程。评测任务主题包括(但不限于):

知识/本体建模

  • 知识表示与本体建模
  • 知识表示学习
  • 知识图谱嵌入
  • 知识图谱的分布式表示
  • 本体重用与演化
  • 本体映射、融合与对齐
  • 本体评估
  • 概念学习
  • 知识表示新方法

知识图谱构建/信息抽取

  • 开放知识抽取
  • 众包知识工程与协同知识获取
  • 人机协同知识库构建
  • 维基数据的自动抽取
  • 自动化知识库构建工具、语言与系统
  • 基于监督学习/非监督学习的知识抽取
  • 轻量监督学习Lightly-supervised与文本抽取
  • 远程监督学习distantly-supervised learning与文本抽取
  • 机器阅读Machine reading

语义集成

  • 实体识别Entity recognition、消解disambiguation、和实体链接linking
  • 术语映射与集成
  • 结构集成Structure integration
  • 异构知识库集成
  • 跨语言知识链接与集成
  • 基于本体的数据集成

知识存储、检索和推理

  • 分布式知识库系统
  • 知识查询与搜索
  • 概率知识库存储
  • 弹性知识存储与分布式计算
  • 图数据库
  • 基于逻辑的推理
  • 基于概率统计的推理
  • 基于自然逻辑(Natural Logic)的推理
  • 基于嵌入与分布式表示的推理
  • 规则学习
  • 知识库补全

知识共享重用与基于知识的系统

  • 知识图谱可视化
  • 语义搜索引擎
  • 基于知识的问答系统
  • 智能个人助理系统
  • 基于知识的自然语言/语音/图像/视频语义分析

链接数据

  • 链接数据构建与发布
  • 链接数据查询与搜索
  • 链接数据集成
  • 链接数据挖掘与分析
  • 链接数据应用(生物医药、金融、电子政务……)

[CFP]全国知识图谱与语义计算大会(CCKS 2017)征文通知

全国知识图谱与语义计算大会(CCKS 2017)征文通知

2017年8月26~29日,成都

http://www.ccks2017.com

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专家委员会组织和承办。全国知识图谱与语义计算大会(CCKS)是国内两个全国会议的合并:中文知识图谱研讨会the Chinese Knowledge Graph Symposium (CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web and Web Science Conference (CSWS)。CCKS2016在北京西郊宾馆成功召开,来自学术界和工业界的400余名学者和研究人员参加了会议。全国知识图谱与语义计算大已经成为国内知识图谱、语义技术、链接数据等领域的核心会议,聚集了知识表示、自然语言理解、机器学习、数据库、图计算等相关领域的重要学者和研究人员。2017年全国知识图谱和语义计算大会将于2017年8月26日至29日在成都召开。

2017年全国知识图谱与语义计算大会的主题是“语言、知识与智能”,探讨在大数据环境下语言理解、知识获取与智能服务的关键技术和应用。会议将包括学术讲习班、工业界论坛、评测与竞赛、大会特邀报告及学术论文等环节。大会将邀请国内外知名学者讲授相关领域的最新进展、发展趋势和实战经验,工业界论坛将邀请产业界的主要研发人员分享经验,促进产学研合作。

大会诚挚邀请相关领域的研究者投审英文和中文论文。CCKS2017英文论文将被Springer出版的论文集收录,中文论文将被推荐到中文信息学报、模式识别与人工智能学报、广西师范大学学报、东南大学学报和郑州大学学报等期刊发表。

投审论文要求论文工作是未经未发表的研究成果,论文通过会议论文网站提交: https://easychair.org/conferences/?conf=ccks2017. 论文主题包括(但不限于):

知识/本体建模

  • 知识表示与本体建模
  • 知识表示学习
  • 知识图谱嵌入
  • 知识图谱的分布式表示
  • 本体重用与演化
  • 本体映射、融合与对齐
  • 本体评估
  • 概念学习
  • 知识表示新方法

知识图谱构建/信息抽取

  • 开放知识抽取
  • 众包知识工程与协同知识获取
  • 人机协同知识库构建
  • 维基数据的自动抽取
  • 自动化知识库构建工具、语言与系统
  • 基于监督学习/非监督学习的知识抽取
  • 轻量监督学习Lightly-supervised与文本抽取
  • 远程监督学习distantly-supervised learning与文本抽取
  • 机器阅读Machine reading

语义集成

  • 实体识别Entity recognition、消解disambiguation、和实体链接linking
  • 术语映射与集成
  • 结构集成Structure integration
  • 异构知识库集成
  • 跨语言知识链接与集成
  • 基于本体的数据集成

知识存储、检索和推理

  • 分布式知识库系统
  • 知识查询与搜索
  • 概率知识库存储
  • 弹性知识存储与分布式计算
  • 图数据库
  • 基于逻辑的推理
  • 基于概率统计的推理
  • 基于自然逻辑(Natural Logic)的推理
  • 基于嵌入与分布式表示的推理
  • 规则学习
  • 知识库补全

知识共享重用与基于知识的系统

  • 知识图谱可视化
  • 语义搜索引擎
  • 基于知识的问答系统
  • 智能个人助理系统
  • 基于知识的自然语言/语音/图像/视频语义分析

链接数据

  • 链接数据构建与发布
  • 链接数据查询与搜索
  • 链接数据集成
  • 链接数据挖掘与分析
  • 链接数据应用(生物医药、金融、电子政务……)

重要日期(tentative 

  • 摘要提交: 2017年5月18日 (23:59, 北京时间)
  • 全文提交:2017年5月25日 (23:59, 北京时间)
  • 审稿结果通知: 2017年6月25日
  • 正式版本提交: 2017年7月25日
  • 会议日期: 2017年8月26日—29日

主办: 中国中文信息学会语言与知识计算专业委员会

承办: 西华大学 

大会主席(General Chairs):

  • 周明 微软亚洲研究院
  • 李涓子 清华大学

程序委员会主席(PC Chairs):

  • 漆桂林 东南大学
  • 劳逆   google公司

学术讲习班主席(Advanced Lectures Chairs:

  • 秦兵 哈尔滨工业大学
  • 刘知远 清华大学

工业界论坛主席(Industrial Forum Chairs):

  • 闫峻 微软亚洲研究院
  • 谢殿侠 上海海智智能科技有限公司

竞赛与评测主席(Evaluation Chairs):

  • 肖仰华 复旦大学
  • 王志春 北京师范大学

海报与演示主席(Poster/Demo Chairs):

  • 陈华钧 浙江大学
  • 刘康 中科院自动化所

本地主席(Local Chairs):

  • 杜亚军 西华大学
  • 范永全 西华大学

会议赞助主席(Sponsorship Chairs:

  • 钱铁云 武汉大学
  • 胡伟 南京大学

会议出版主席(Publication Chairs:

  • 阮彤 华东理工大学
  • 杜剑锋 广东外语外贸大学

会议宣传主席(Publicity Chairs:

  • 张小旺 天津大学
  • 王昊奋 深圳狗尾草智能科技公司

顶级会议review主席(Top conference review Chairs:

  • 王泉 中科院信工所
  • 程龚 南京大学

全国知识图谱与语义计算大会(CCKS 2016)工业界论坛Slides共享

特邀报告(Keynote):Analytic knowledge graph for healthcare

演讲者:Sheng-Chuan Wu,Franz. Inc.

报告Slides共享:http://pan.baidu.com/s/1slrNnsT

个人简介:Dr. Sheng-Chuan Wu received his Ph.D. in Scientific Computing and Computer Graphics from Cornell University in the US. He has, since graduation, involved in several software companies, including the founding of the first integrated CAD/CAM/CAE company. In the last 20 years, he worked as a senior corporate executive at the leading Artificial Intelligence and Semantic Technology company, Franz Inc in Silicon Valley, with responsibility in application development, marketing, consulting and new business development. Dr. Wu has also in many occasions collaborated with Bioinformatics experts from Harvard Medical School, Stanford University and Astra Zeneca, working with massive biological data. Dr. Wu has been focusing on Semantic Technology over the last 8 years. He routinely lectured and keynoted on AI and Semantic Technology at conferences. Most recently, he was a keynote speaker at KSEM 2015 in China, at KMO 2016 in Germany and PRICAI 2016 in Thailand. He has, since 2007, conducted more than 20 week-long workshops on Semantic Technology and Artificial Intelligence in Malaysia, China, Singapore, India and other Asian countries. Dr. Wu has also consulted on several Big Data and Semantic Technology projects in the US and Asia.

报告摘要:Since sequencing of the human genome in 2003, we have dreamed about treating patients more effectively based on their genomic profiles. Such a dream remains elusive. “The fundamental difficulty lies in the complexity of biological systems that have evolved through billions of years.” On the other hand, major progress can be and has been made in “personalized medicine” by applying classic AI machine learning on the massive patient medical data accumulated. In essence, we can uncover new insight from the data to help patients without knowing the why a priori. Such new insight is then added back into the medical knowledge to form a richer knowledge graph for analysis later. Exploiting patient medical data brings another set of management problems, namely the heterogeneous nature of data sources and taxonomies, the enormous size of data volume, and huge analytic processing requirements. At this talk, we will discuss all these issues and show some examples at a major research hospital in New York City.

特邀报告(Keynote):拓尔思水晶球——基于动态本体的知识管理工具

演讲者:刘瑞宝,拓尔思

报告Slides共享:http://pan.baidu.com/s/1c2BQ7TY

个人简介:北京拓尔思信息技术股份有限公司副总裁,北京软件和信息服务交易所专家,1989年毕业于北京科技大学,曾经就职于冶金工业信息标准研究院,主持设计了冶金信息网并在1997年推出了基于中外文冶金文献的互联网服务,2000年加盟北京拓尔思信息技术股份有限公司,主持了新华社多媒体数据库、专利搜索与服务系统、公安云搜索、中国专利大数据与智慧服务系统等多个大型项目。

报告摘要:随着信息爆炸的大数据时代的到来,信息来源五花八门,各行业领域都需要专业的分析师通过数据分析来解决问题和揭示数据背后的秘密,这也是大数据分析师的工作。在互联网上Yago、Dbpedia、Freebase、百度百科等也建立起了各种面向知识关联的应用和服务,拓尔思水晶球通过对实体概念、实体属性、实体与实体之间关系,建立起基于动态本体的知识管理体系,本体定义基于对象的数据模型, 支持动态的本体定义,数据从多源的数据格式,被转换映射为统一的数据对象,关联现实世界中的人、地点、事物、事件以及之间的关系。结合NLP技术,不仅可以从结构化数据中获取知识,还能从非结构化数据中发现和挖掘知识。本次将从实战的角度,分享通过拓尔思水晶球获取知识、建立知识图谱、挖掘知识内涵的全过程。

特邀报告(Keynote):从语义到语用

演讲者:刘升平,云知声

报告Slides共享:http://pan.baidu.com/s/1nvybb3V

个人简介:北京大学人工智能专业博士,现任云知声资深AI技术专家,在IBM研究院工作期间,参与的两个研究项目获得IBM研究成就奖;在领域内国际顶级会议上发表5篇学术论文;获得了8项美国发明技术专利;是2010,2011年国际语义Web大会 (ISWC 2010, 2011)的程序委员会委员。在云知声工作期间,领导语义团队,成功发布了国内首个支持智能对话的公有语义云。2006年,参与的本体开发工具包项目获得了IBM研究成就奖。2010年,作为主要技术骨干参与的医疗领域语义元数据框架包项目获得了IBM研究成就奖。

报告摘要:在人与人的交谈中,要理解一句话的含义,除了理解字面含义之外,还要结合多种语境信息,才能理解用户的话语的真实意图。这些语境信息包括说话者的物理语境,如说话的时间,地点和场所,对话的语言语境,即上下文信息,以及知识语境,即说话者的背景知识,领域知识,用户信息等。利用语境信息来理解话语的含义在语言学上称为语用。本报告除了介绍语用学之外,还进一步提出了语用计算,即把语用学应用到人与机器的对话交互中,包括口语的理解,自然语言的生成,和人机交互框架。

报告题目(Invited Talk):小i机器人在中文语义开放平台的研究与进展

演讲者:陈培华、小i机器人

报告Slides共享:http://pan.baidu.com/s/1mhTAUjI

个人简介:陈培华毕业于上海交通大学,工学博士,现就职于上海智臻智能网络科技股份有限公司(小i机器人),担任创新研究中心研究员,主要从事面向自然语言处理相关的人工智能技术研究。

报告摘要:介绍人工智能热点研究领域以及小i机器人在人工智能领域的布局;介绍小i机器人在自然语言处理领域的研究进展——小i中文语义开放平台,旨在为用户提供全面的自然语言处理能力,涉及分词、命名实体识别、新词发现、摘要、主题发现、聚类、分类、情感分析等。

报告题目(Invited Talk):关联挖掘——图可视化的应用实践

演讲者:赵丹,海云数据CTO

报告Slides共享:http://pan.baidu.com/s/1hs4WLFI

个人简介:天津大海云科技有限公司(海云数据)技术合伙人。长期从事数据可视化,大数据分析,知识图谱应用等领域的研发工作。

报告摘要:通过行业实际使用场景,探讨关联分析中图可视化的用途、作用与意义;以及实用关联分析系统的设计思路与方法。

报告题目(Invited Talk):发现数据之美——大规模行业知识图谱的构建和应用

演讲者:丁军,海翼知CEO

报告Slides共享:http://pan.baidu.com/s/1c21oku

个人简介:华东理工大学计算机博士,现任上海海翼知信息科技有限公司CEO。长期从事知识图谱构建及应用方面研究,国内首家提供垂直知识图谱构建及应用解决方案的大数据公司,现已有全国企业商业知识图谱,中外创投知识图谱,海洋鱼类知识图谱,全国专利知识图谱等行业应用,相关研究也已发表在国际知名会议ISWC上。

报告摘要:在互联网高速发展的大背景下,数据的堆积越来越严重。在大多数企业应用场景中,用户希望一种能够存储、处理和查询海量数据的数据库系统;同时,用户还需要能够对多源异构的数据进行有效地融合组织,使其更好地被分析利用来创造价值。本报告将针对企业在数据整合与应用方面遇到的痛点,结合对海翼知大规模行业图谱的介绍,分享整合通用数据,行业数据以及企业私有数据的一些经验,共同探索更好的大数据消费模式。

报告题目(Invited Talk):Knowledge Graph in Japan: Open data beyond

演讲者:Nobuyuki Igata,富士通,高级研究员

报告Slides共享:http://pan.baidu.com/s/1hrEPZKC

个人简介:Nobuyuki Igata received his M.S. degree in Computer Science from Tohoku University, Sendai, Japan. He joined to Fujitsu Laboratories Ltd., Kawasaki, Japan in 1995 and currently works as a research manager in the same organization. His background is natural language processing and artificial intelligence such as information retrieval, social media analysis, Linked Data and so on. He was a visiting researcher at Massachusetts Institute of Technology, U.S.A. in 2005-2006 and held a part-time lectureship in Waseda University, Japan in 2011-2013. He is a member of Information Processing Society of Japan (IPSJ) and the Japanese Society for Artificial Intelligence (JSAI).

报告摘要:This talk introduces recent activities for building Knowledge Graph in Japan. From Open Data Charter of G8 in 2013, many Japanese organizations have published their own data with open data license. For instance, National Tax Agency (NTA) has published a dataset of corporation numbers covering 4.4 million companies, Kawasaki City published valuable information to support families with small children. However almost all of these data are described with CSV or XML format and there are no links to other datasets. In this talk, I introduce many activities in Japan to build Knowledge Graph from these open data. These activities come from two aspects; one is social events such as LOD Challenge, another is mash-up technology related to Linked Data technologies.

报告题目:知识图谱在自动应答系统上的应用和挑战

演讲者:韦克礼,图灵机器人技术负责人

报告Slides共享:http://pan.baidu.com/s/1o7WUD54

个人简介:多年来一直从事自然语言理解相关技术的研究,擅长大数据分析、中文语义解析等,作为联合创始人创办北京光年无限科技有限公司(简称:光年无限),目前担任技术负责人一职,从事图灵机器人大脑的研发工作,图灵机器人目前累计开发者已经超过22万,积累的语料库已经超过500亿条,在这一领域长期处于领先。

报告摘要:本次演讲中,将分享一些中文知识图谱构建的方法、策略,以及在自动应答系统中的应用。其中,自动应答系统依赖于大规模的知识图谱,在众多模块中都使用了知识图谱,包括查询分析,候选集打分和垂直领域问题解答。但是由于知识图谱构建的一些难点,在应用中还面临一些挑战。我将逐一列举挑战并和大家一起探讨解决之道。

中国中文信息学会《前沿技术讲习班》 第三期:知识图谱专题Slides共享

前沿技术讲座1:实战中的知识图谱

报告嘉宾:

摘要:知识图谱是一系列结构化数据的处理方法,它涉及知识的提取、表示、存储、检索等诸多技术。从渊源上讲,它是知识表示与推理、数据库、信息检索、自然语言处理等多种技术发展的融合。但传统的知识处理方法,在实际的工程应用,特别是互联网应用中,面临实施成本高、技术周期长、熟悉该类技术的人才缺乏、基础数据不足等诸多现实制约。实战中的知识图谱,需要充分利用成熟的工业技术,不拘泥于特定的工具和方法,特别是不盲目追求标准化、技术的先进性或者新颖性,以实际的业务出发,循序渐进推进工程的实施。在本教程中,我们首先回顾知识图谱从理念到工程逐步落地的发展历程,梳理各技术与知识图谱应用的关系。然后,我们结合工程上具体的实例,来展示知识图谱的核心理念和技术如何在成本约束下实施,包括结构化数据生成,可维护的知识结构,海量知识的数据库管理,和多层次的语义检索等。最后,我们讨论知识图谱在搜索,自动问答等应用中如何与统计/机器学习方法相结合来解决实际问题。

前沿技术讲座2:Testing and Assessing the Quality of Knowledge Graph

报告嘉宾:

  • Jeff Z. Pan 教授
  • 阮彤教授

报告Slides下载: http://pan.baidu.com/s/1i5ntO8l

摘要In this tutorial, we will introduce the notions of quality control for constructing and reusing knowledge graphs. Firstly, we will introduce a test driven approach of schema construction for knowledge graphs, by leveraging the ideas of competency questions and test driven software development. We will show some typical patterns of competency questions and illustrate how to use competency questions to construct authoring tests for knowledge graphs. Secondly, we will introduce data quality model, data quality assessment model and methods of data quality assessment. We will illustrate the role of data quality evaluation in big data trading.

 

前沿技术讲座3Understanding Short Texts

报告嘉宾:王海勋 博士,王仲远 博士

报告Slides下载: http://pan.baidu.com/s/1kVDEjER

摘要Billions of short texts are produced every day, in the form of search queries, ad keywords, tags, tweets, messenger conversations, social network posts, etc. Unlike documents, short texts have some unique characteristics which make them difficult to handle. First, short texts, especially search queries, do not always observe the syntax of a written language. This means traditional NLP techniques, such as syntactic parsing, do not always apply to short texts. Second, short texts contain limited context. The majority of search queries contain less than 5 words, and tweets can have no more than 140 characters. Because of the above reasons, short texts give rise to a significant amount of ambiguity, which makes them extremely difficult to handle. On the other hand, many applications, including search engines, ads, automatic question answering, online advertising, recommendation systems, etc., rely on short text understanding. In all these applications, the necessary first step is to transform an input text into a machine-interpretable representation, namely to “understand” the short text. A growing number of approaches leverage external knowledge to address the issue of inadequate contextual information that accompanies the short texts. These approaches can be classified into two categories: Explicit Representation Model (ERM) and Implicit Representation Model (IRM). In this tutorial, we will present a comprehensive overview of short text understanding based on explicit semantics (knowledge graph representation, acquisition, and reasoning) and implicit semantics (embedding and deep learning). Specifically, we will go over various techniques in knowledge acquisition, representation, and inferencing has been proposed for text understanding, and we will describe massive structured and semi-structured data that have been made available in the recent decade that directly or indirectly encode human knowledge, turning the knowledge representation problems into a computational grand challenge with feasible solutions insight.

前沿技术讲座4:知识图谱的摘要和集成

报告嘉宾:

摘要大数据被认为是继信息化和互联网后整个信息革命的又一次高峰,然而如何将大数据转化为知识依然面临巨大挑战。知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,它是数据语义链接的基石,有助于自然语言理解、数据挖掘等领域的发展。然而知识图谱的大规模、异构性等给基于知识图谱的应用带来了挑战。本次报告将首先介绍知识图谱、链接数据和本体的基础知识,接下来介绍知识图谱的摘要技术,其中重点介绍实体描述摘要、实体关联摘要的最新研究进展,最后介绍知识图谱的集成技术,其中重点介绍本体匹配和实体链接技术的最新研究进展。

 

全国知识图谱与语义计算大会(CCKS 2016)在北京隆重召开

2016年9月19-22日,全国知识图谱与语义计算大会(CCKS 2016)在北京西郊宾馆隆重召开。本次会议由中国中文信息学会语言与知识计算专业委员会主办。大会分为讲习班和主会两个主要部分,本次讲习班暨中国中文信息学会《前沿技术讲习班》ATT第三期的主题是知识图谱专题。本次大会吸引了来自全国学术界、产业界从事知识图谱相关研究的400多人参加,会议探讨了知识图谱领域的新发现、新技术和新应用,旨在向社会公众介绍知识图谱相关领域的发展趋势和创新成果,进一步推动我国知识图谱技术领域的发展。CCKS 2016会议的主题是:语义、知识与链接大数据。

会议包括学术讲习班、特邀报告、工业界论坛、评测与竞赛、学术论文、海报及演示等主要环节。其中,前沿技术讲习班邀请了8位国内外知名研究者,分别是:奇点机智的林德康博士、文因互联的鲍捷博士、阿伯丁大学的Jeff Z. Pan教授、华东理工大学的阮彤教授、Facebook的王海勋博士、微软的王仲远博士、南京大学的胡伟博士和南京大学的程龚博士,为大家分享了4个前沿技术讲座。特邀报告邀请了4位国内外的知名研究者,他们分别是:牛津大学的Ian Horrocks教授、马普研究所的Gerhard Weikum教授、北京理工大学的黄河燕教授和Facebook的王海勋博士。工业界论坛邀请了产业界的8位研发人员,分享了实战经验,他们分别是:Franz.的科学家Sheng-Yhuan Wu、拓尔思的副总裁刘瑞宝、云知声的AI技术专家刘升平、小i机器人的陈培华研究员、海云数据的CTO赵丹、海翼知的CEO丁军、富士通的研究员Nobuyuki Igata和图灵机器人的技术负责人韦克礼。

大会现场

9月19-20日是中国中文信息学会《前沿技术讲习班》ATT第三期:知识图谱专题。讲习班由清华大学朱小燕教授主持开班仪式。19号上午第一个讲座是林德康博士和鲍捷博士的《实战中的知识图谱》。在报告中鲍捷博士回顾了知识图谱从理论到工程逐步落地的发展历程,梳理了各技术与知识图谱应用的关系;并且结合工程商具体的实例,展示了知识图谱的核心理念和技术如何在成本约束下实施,包括结构化数据生成,可维护的知识结构,海量知识的数据库管理,和多层次的语义检索等。林德康博士探讨了知识图谱在搜索,自动问答等应用中如何与统计机器学习方法相结合来解决实际问题。19下午由Jeff Z. Pan教授和阮彤教授作讲习班的第二个讲座《Testing and Assessing the Quality of Knowledge Graph》。Jeff Z. Pan教授介绍了知识图谱构建和重利用的质量控制等基本概念,还介绍了一种测试驱动的知识图谱结构构建方法。阮彤教授介绍了数据质量模型,数据质量评估模型,以及数据质量在大数据分析中所起到的重要角色。20日上午由王海勋博士和王仲远博士作讲习班的第三个讲座《Understanding Short Texts》。本报告介绍了短文本的理解方面的工作,短文本的理解方法可以分为两类:显式表示方法和隐式表示方法,报告对这两类方法进行了详细的介绍。具体的,介绍了短文本理解中需要用到的知识获取、知识表示和知识推理等相关技术。20日下午由胡伟博士和程龚博士作讲习班的第四个讲座《知识图谱的摘要和集成》。本报告首先介绍了知识图谱、链接数据和本体的基础知识,还介绍了知识图谱的摘要技术,其中重点介绍了实体描述摘要、实体关联摘要的最新研究进展;最后介绍了知识图谱的集成技术,重点介绍了本体匹配和实体链接技术的最新研究进展。

9月21-22日是本次大会的主会。开幕式由专委会主任清华大学李涓子教授主持,首先由中国中文信息学会理事长李生教授致辞,接着由大会主席中国科学院软件研究所孙乐研究员致辞,最后程序委员会主席浙江大学陈华钧教授介绍会议组织情况。


学会理事长李生教授致辞


大会主席中科院软件所孙乐研究员致辞


程序委员会主席浙江大学陈华钧教授致辞

本次会议共邀请了四位海内外知名学者做特邀报告。来自牛津大学的Ian Horrocks教授作《Using Semantic Technology to Tackle Industry’s Data VarietyChallenge》的报告。报告主要介绍了基于本体的数据库方法(Ontology Based Data Access),并展示了该方法是如何解决数据多样性这个挑战的。同时也介绍了OBDA这种方法的问题和局限性,并探讨了如何减缓这些问题。德国马普研究所的Gerhard Weikum教授作《What Computers Should Know》的报告。报告介绍了知识图谱的发展和应用,探讨了最新的研究方法如常识获取,并指出了新的机遇和挑战。北京理工大学的黄河燕教授作《面向基础教育的大数据类人智能答题系统总体设想及其困难与挑战》的报告。报告主要介绍了面向基础教育的大数据类人类智能答题系统的总体设想与方案、研究进展,尤其是其中所面临的难点与挑战,以及未来的研究重点与方向展望。Facebook的王海勋研究员作《Short Text Understanding》的报告。该报告主要介绍了短文本理解中所用到的知识获取、知识表示和知识推理方面的方法,并介绍了大量的可用于文本理解的结构化和半结构化的数据。


牛津大学Ian Horrocks教授做特邀报告


马普研究所Gerhard Weikum教授做特邀报告


北京理工大学黄河燕教授做特邀报告


Facebook王海勋研究员做特邀报告

会议同时设置了学术论文、海报及演示、知识图谱竞赛等环节。知识图谱竞赛部分还邀请了清华大学刘知远博士作《知识表示学习与知识获取》的报告。刘知远博士主要介绍和总结了他们在知识表示和知识获取方面的最新的研究进展。中科院自动化所的刘康博士和北京师范大学的王志春博士报告了评测的总体情况。同时多个评测参与单位也介绍了他们的系统和相关的经验。

在主旨为“知识图谱与认知智能”的论坛环节,该论坛由东南大学的漆桂林教授主持,邀请了学术界和工业界的5位学者和研究人员参与讨论,他们分别是:Franz.的科学家Sheng-Yhuan Wu、哈尔滨工业大学的秦兵教授、浙江大学陈华钧教授、微软研究院闫峻研究员、百度公司刘亦梁主任架构师,各位专家就知识图谱未来的发展各抒己见、热烈讨论。


Panel讨论环节

22日下午是知识图谱工业界论坛,邀请了8位工业界的研究人员作特邀报告,分享实验经验:Franz.的科学家Sheng-Yhuan Wu作《Analytic Knowledge Graph for Healthcare》的特邀报告,报告主要介绍了知识图谱在医疗领域的应用。拓尔思副总裁刘瑞宝作《拓尔思水晶球 – 基于动态本体的知识管理工具》的特邀报告,报告从实战的角度,分享了拓尔思水晶球获取知识、建立知识图谱、挖掘知识内涵的全过程。云知声的AI技术专家刘升平作《从语义到语用》的特邀报告,报告介绍了语用学的基本概念,进一步提出了语用计算,即把语用学用到人与机器的对话交互中,包括口语的理解,自然语言的生成,和人机交互框架。小i机器人的研究员陈培华作《小i机器人在中文语义开放平台的研究与进展》的报告,报告介绍了人工智能热点研究领域以及小i机器人在人工智能领域的布局;还介绍了小i机器人在自然语言处理领域的研究进展。海云数据CTO赵丹作《关联挖掘 – 图可视化的应用实践》的报告,报告通过行业实际使用场景,探讨了关联分析中图可视化的用途、作用与意义;以及实用关联分析系统的设计思路与方法。海翼知CEO丁军作《发现数据之美-大规模行业知识图谱的构建和应用》的报告,报告针对企业在数据整合与应用方面遇到的痛点,结合对海翼知大规模行业图谱的极少,分享了整合通用数据,行业数据以及企业私有数据的一些经验。富士通研究员Nobuyuki Igata作《Knowledge Graph in Japan: Open data beyond》的报告,报告介绍了在日语方面从开放数据构建知识图谱的相关工作。图灵机器人技术负责人韦克礼作《知识图谱在自动应答系统上的应用和挑战》的报告,报告分享了一些中文知识图谱构建的方法、策略,以及在自动问答系统中的应用;还分析了知识图谱构建中的一些难点,在应用中面临的一些挑战,并探讨了解决之道。

本次大会关注国内外知识图谱研究领域的最新进展,以及工业界的最新技术,对本领域面临的种种挑战性科学问题和关键技术难题展开了深入研讨,为所有与会者带来了一场学术与技术的饕餮盛宴。经语言与知识计算专委会2016年工作会议决定,2017年全国知识图谱与语义计算大会将在四川成都西华大学举办。

大会网站:http://www.ccks2016.cn

评测竞赛CFP:全国知识图谱与语义计算大会

Call for Participation

Shared Tasks in CCKS2016

September 19 – 22, 2016, Beijing, China

http://ccks2016.cipsc.org.cn/ or http://ccks2016.cn

 

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专家委员会负责组织和承办。CCKS2016源于国内两个主要的相关会议:中文知识图谱研讨会Conference onChinese Knowledge Graph (KG)和中国语义互联网与Web科学大会Chinese Semantic Web and WebScience Conference (CSWS)。首届中文知识图谱研讨会于2013年在苏州举行,随后分别在武汉、宜昌成功举办第二次和第三次研讨会。CSWS首次会议于2006年在北京举办,随后的近十年里,逐渐成为国内语义技术领域的主要会议。新的知识图谱与语义计算大会将致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议,并聚集了知识表示、自然语言处理、机器学习、数据库、图计算等相关领域的重要学者和研究人员。

经过多轮任务征集以及CCKS2016程序委员会的讨论,此次会议共举行实体发现与实体链接、链接预测与元组分类、产品预测等三个任务。评测数据由清华大学、豆瓣、微软、华东理工大学、东南大学、KCOMBER公司联合提供。我们欢迎来自学术界、工业界的研究者积极参加本次评测。

评测任务任务介绍

  1. 1. 实体发现与实体链接

本评测任务为限定领域的实体发现与实体链接,简称DSEDL (Domain-Specific Entity Discovery andLinking)。即对于给定的一组限定领域的纯文本文件,任务的目标是识别并抽取出与领域相关的实体名字(mention),并将它们链接到给定知识库对应的实体(entity)。实体名字具有歧义性和变异性,也就是同一个实体名字,有可能指代多个实体,需要根据上下文消歧;此外,同一个实体可能有多个实体名字与之对应,比如别名,绰号,昵称等等,需要将这些所有的名字变种都识别出来。

  1. 2. 链接预测与元组分类

本任务基于图数据挖掘中链接预测的基本思想,通过计算尚未建立链接的两个entity发生链接的概率,实现图数据中entity与entity之间的链接关系预测。举例说明,已知下面两个三元组<entity A,配偶,entity B>与<entity B,儿子,entity C>,可以预测出<entity A,儿子,entity C>;或者已知三个三元组<entity A,生产,entity C>,<entity B ,生产,entity D>,<entity C,竞争,entity D>,可以预测出<entity A,竞争,entity B>。

同时我们设定三元组分类(triple classification)任务,其表示的意义是对于预测的三元组判断对与错,即一个三元组是正确的,那么triple classification是正确的,否则是错误的。例如,三元组<姚明,出生地,上海>的triple classification是正确的,而三元组<姚明,性别,女>的tripleclassification是错误的。三元组分类的正确与否直接关系图数据库的质量,同时对于知识推理、问答系统有着非常重要的影响。

  1. 3. 产品预测

本项任务主要是一个对进出口交易记录数据进行产品预测任务。本次任务有19046条数据记录,其中的18279条记录是有类别属性的,可作为分析时的训练样本,而任务目标是根据历史产品交易记录数据,针对当前767条测试数据(即交易记录)预测可能的产品信息。

 

参加注册

请参加单位在5月8日之前,填写注册表,并将注册表发给会议评测共同主席:刘康(中科院自动化所,kliu@nlpr.ia.ac.cn)、王志春(北京师范大学,zcwang@bnu.edu.cn)

重要时间节点

  • 2016年5月8日,报名截止
  • 2016年5月10日,发布知识库数据(根据任务而定)
  • 2016年5月20日,发布训练数据(标注评论数据)
  • 2016年8月8日,发布测试数据
  • 2016年8月15日,评测完成,停止接受结果
  • 2016年9月5日,评测完成,停止提交论文

评测组织委员会:

  • 刘康,   中国科学院自动化研究所 (kliu@nlpr.ia.ac.cn)
  • 王志春,  北京师范大学 (zcwang@bnu.edu.cn)
  • 王昊奋, 华东理工大学(whfcarter@ecust.edu.cn)
  • 漆桂林, 东南大学(gqi@seu.edu.cn)
  • 张江涛, 清华大学(zhang-jt13@mails.tsinghua.edu.cn)
  • 成洪山, KCOMBER公司(ola.cheng@kcomber.com)

更详细信息,请参见评测主页:http://www.ccks2016.cn/cckszhishitupupi.html

[CFP]全国知识图谱与语义计算大会第二轮征文通知

第二轮征文通知

全国知识图谱与语义计算大会

ChinaConference on Knowledge Graph and Semantic Computing  (CCKS2016)

2016年9月19日-22日,北京

征稿截止: 2016年7月1日

http://ccks2016.cipsc.org.cn/http://ccks2016.cn

 

全国知识图谱与语义计算大会(CCKS:China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专家委员会负责组织和承办。CCKS2016源于国内两个主要的相关会议:中文知识图谱研讨会the Chinese KnowledgeGraph Symposium (CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web andWeb Science Conference (CSWS)。首届中文知识图谱研讨会于2013年在苏州举行,随后分别在武汉、宜昌成功举办第二次和第三次研讨会。CSWS首次会议于2006年在北京举办,随后的近十年里,逐渐成为国内语义技术领域的主要会议。新的知识图谱与语义计算大会将致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议,并聚集了知识表示、自然语言处理、机器学习、数据库、图计算等相关领域的重要学者和研究人员。

 

今年会议的主题是“语义、知识与链接大数据”。会议将包括学术讲习班、工业界论坛、评测与竞赛、特邀报告、学术论文、海报及演示等主要环节。其中,学术讲习班邀请国内外知名研究者讲授实学术界最新进展和实战经验,工业界论坛邀请产业界的主要研发人员分享经验,促进产学研合作。

 

目前会议已经初步邀请到德国Max-PlanckInstitute for Informatics (MPII) Gerhard Weikum教授,瑞士苏黎世大学AbrahamBernstein教授,Facebook 王海勋博士等作为KeynoteSpeaker。

 

大会同时欢迎英文和中文论文。英文论文将被Springer出版的论文集收录,中文论文将被推荐到中国科学、东南大学学报、中文信息学报等期刊发表。部分优秀论文将被推荐到theSemantic Web Journal, Elsevier Journal of Big Data Research, Journal of WebSemantics,清华大学学报英文版等国际期刊发表。

 

所有论文要求是未发表内容,并通过会议论文网站提交:https://easychair.org/conferences/?conf=ccks2016 .相关主题如下(但不限于):

知识表示

•             知识表示与本体建模

•             知识表示学习

•             知识图谱嵌入

•             知识图谱的分布式表示

•             本体重用与演化

•             本体映射、融合与对齐

•             本体评估

•             概念学习

•             知识表示新方法

知识图谱构建与信息抽取

•             开放知识抽取

•             众包知识工程与协同知识获取

•             人机协同知识库构建

•             维基数据的自动抽取

•             自动化知识库构建工具、语言与系统

•             基于监督学习/非监督学习的知识抽取

•             轻量监督学习Lightly-supervised与文本抽取

•             远程监督学习distantly-supervised learning与文本抽取

•             机器阅读Machine reading

语义集成

•             实体识别Entity recognition、消解disambiguation、和实体链接linking

•             术语映射与集成

•             结构集成Structure integration

•             异构知识库集成

•             跨语言知识链接与集成

•             基于本体的数据集成

知识存储

•             分布式知识库系统

•             知识查询与搜索

•             知识索引

•             概率知识库存储

•             弹性知识存储与分布式计算

•             图数据库

知识共享与基于知识的系统

•             知识图谱可视化

•             语义搜索引擎

•             基于知识的问答系统

•             智能个人助理系统

•             基于知识的自然语言/语音/图像/视频语义分析

知识推理

•             基于逻辑的推理

•             基于概率统计的推理

•             基于自然逻辑(Natural Logic)的推理

•             基于本体的推理

•             基于规则的推理

•             基于嵌入与分布式表示的推理

•             规则学习

•             知识库补全

链接数据

•             链接数据构建与发布

•             链接数据查询与搜索

•             链接数据集成

•             链接数据挖掘与分析

•             链接数据应用(生物医药、金融、电子政务……)

  • 重要日期

•             摘要提交:  2016年6月23日(23:59, 北京时间)

•             全文提交:2016年7月1日 (23:59, 北京时间)

•             审稿结果通知:  2016年8月1日

•             正式版本提交:      2016年8月19日

•             会议日期:   2016年9月19日—22日

  • 主办:  中国中文信息学会语言与知识计算专家委员会
  • 承办:

•      清华大学

•      中科院软件技术研究所

  • 大会主席(GeneralChairs):

•      孙乐,          中国科学院软件所

•      王海勋,   Facebook

  • 程序委员会主席(PCChairs):

•      陈华钧,      浙江大学

•      季姮,                 Rensselaer Polytechnic Institute

  • 学术讲习班主席(AdvancedLectures Chairs):

•      朱小燕,  清华大学

•      胡伟,          南京大学

  • 工业界论坛主席IndustrialForum Chairs):

•      王昊奋,  华东理工大学

•      鲍捷,     文因互联

  • 竞赛与评测主席EvaluationChairs):

•      刘康,   中科院自动化所

•      王志春, 北京师范大学

  • 海报与演示主席Poster/DemoChairs):

•      倪渊,   IBM

•      张奇,复旦大学

  • 本地主席Local Chairs):

•      韩先培, 中科院软件所

•      刘奕群, 清华大学

  • 会议赞助主席(Sponsorship Chairs):

•      顾进广,  武汉科技大学

  • 会议出版主席(PublicationChairs):

•      阮彤,   华东理工大学

•      钱铁云,  武汉大学

  • 会议宣传主席(PublicityChairs):

•      吴鸿汉, 伦敦国王学院

•      廖祥文,福州大学

  • 分领域主席(AreaChairs):

•      程龚, 南京大学

•      杜剑峰, 广东外语外贸大学

•      冯岩松, 北京大学

•      洪宇, 苏州大学

•      刘知远, 清华大学

•      Gerard de Melo,  清华大学

•      孟遥, 富士通

•      Jeff Pan, 阿伯丁大学

•      漆桂林, 东南大学

•      秦兵, 哈尔滨大学

•      邱锡鹏, 复旦大学

•      王泉,中科院信工所

•      王鑫,天津大学

•      吴刚,东北大学

全国科技创新大会两院院士大会 中国科协第九次全国代表大会在京召开

2016-05-30

新闻联播链接

  习近平发表重要讲话强调,在我国发展新的历史起点上,把科技创新摆在更加重要位置,吹响建设世界科技强国的号角。科技是国之利器,国家赖之以强,企业赖之以赢,人民生活赖之以好。中国要强,中国人民生活要好,必须有强大科技。新时期、新形势、新任务,要求我们在科技创新方面有新理念、新设计、新战略。实现“两个一百年”奋斗目标,实现中华民族伟大复兴的中国梦,必须坚持走中国特色自主创新道路,加快各领域科技创新,掌握全球科技竞争先机。这是我们提出建设世界科技强国的出发点。

李克强主持 张德江俞正声刘云山王岐山出席

新华社北京5月30日电  全国科技创新大会、中国科学院第十八次院士大会和中国工程院第十三次院士大会、中国科学技术协会第九次全国代表大会30日上午在人民大会堂隆重召开。中共中央总书记、国家主席、中央军委主席习近平出席大会并发表重要讲话。他强调,科技兴则民族兴,科技强则国家强。今天,我们在这里召开这个盛会,就是要在我国发展新的历史起点上,把科技创新摆在更加重要位置,吹响建设世界科技强国的号角。实现“两个一百年”奋斗目标,实现中华民族伟大复兴的中国梦,必须坚持走中国特色自主创新道路,面向世界科技前沿、面向经济主战场、面向国家重大需求,加快各领域科技创新,掌握全球科技竞争先机。这是我们提出建设世界科技强国的出发点。

李克强主持。张德江、俞正声、刘云山、王岐山出席大会。

上午9时,大会开始,全体起立,唱国歌。

在热烈的掌声中,习近平发表了讲话。他指出,我国科技事业发展的目标是,到2020年时使我国进入创新型国家行列,到2030年时使我国进入创新型国家前列,到新中国成立100年时使我国成为世界科技强国。两院院士和广大科技工作者是国家的财富、人民的骄傲、民族的光荣,大家责任重大、使命重大,应该努力为建成创新型国家、建成世界科技强国作出新的更大的贡献。

习近平强调,历史经验表明,科技革命总是能够深刻改变世界发展格局。在绵延5000多年的文明发展进程中,中华民族创造了闻名于世的科技成果。经过新中国成立以来特别是改革开放以来不懈努力,我国科技发展取得举世瞩目的伟大成就,科技整体能力持续提升,一些重要领域方向跻身世界先进行列,正处于从量的积累向质的飞跃、点的突破向系统能力提升的重要时期。

习近平指出,纵观人类发展历史,创新始终是一个国家、一个民族发展的重要力量,也始终是推动人类社会进步的重要力量。不创新不行,创新慢了也不行。如果我们不识变、不应变、不求变,就可能陷入战略被动,错失发展机遇,甚至错过整整一个时代。实施创新驱动发展战略,是应对发展环境变化、把握发展自主权、提高核心竞争力的必然选择,是加快转变经济发展方式、破解经济发展深层次矛盾和问题的必然选择,是更好引领我国经济发展新常态、保持我国经济持续健康发展的必然选择。我们要深入贯彻新发展理念,深入实施科教兴国战略和人才强国战略,深入实施创新驱动发展战略,统筹谋划,加强组织,优化我国科技事业发展总体布局。

习近平就此提出5点要求。一是夯实科技基础,在重要科技领域跻身世界领先行列。推动科技发展,必须准确判断科技突破方向。判断准了就能抓住先机。科学技术是世界性、时代性的,发展科学技术必须具有全球视野、把握时代脉搏,及时确立发展战略,坚定创新自信,提出更多原创理论,作出更多原创发现,力争在重要科技领域实现跨越发展。

二是强化战略导向,破解创新发展科技难题。当前,国家对战略科技支撑的需求比以往任何时期都更加迫切。党中央已经确定了我国科技面向2030年的长远战略,决定实施一批重大科技项目和工程,要围绕国家重大战略需求,着力攻破关键核心技术,抢占事关长远和全局的科技战略制高点。成为世界科技强国,成为世界主要科学中心和创新高地,必须拥有一批世界一流科研机构、研究型大学、创新型企业,能够持续涌现一批重大原创性科学成果。

三是加强科技供给,服务经济社会发展主战场。科学研究既要追求知识和真理,也要服务于经济社会发展和广大人民群众。推动我国经济社会持续健康发展,推进供给侧结构性改革,落实好“三去一降一补”任务,必须在推动发展的内生动力和活力上来一个根本性转变,塑造更多依靠创新驱动、更多发挥先发优势的引领性发展,大幅增加公共科技供给,让人民享有更宜居的生活环境、更好的医疗卫生服务、更放心的食品药品。

四是深化改革创新,形成充满活力的科技管理和运行机制。科技创新、制度创新要协同发挥作用,两个轮子一起转。我们最大的优势是我国社会主义制度能够集中力量办大事,要形成社会主义市场经济条件下集中力量办大事的新机制。要以推动科技创新为核心,引领科技体制及其相关体制深刻变革。要制定和落实鼓励企业技术创新各项政策,加强对中小企业技术创新支持力度。要优化科研院所和研究型大学科研布局,厚实学科基础,培育新兴交叉学科生长点。要尊重科技创新的区域集聚规律,建设若干具有强大带动力的创新型城市和区域创新中心。

五是弘扬创新精神,培育符合创新发展要求的人才队伍。科学技术是人类的伟大创造性活动。一切科技创新活动都是人做出来的。我国要建设世界科技强国,关键是要建设一支规模宏大、结构合理、素质优良的创新人才队伍。要大兴识才爱才敬才用才之风,在创新实践中发现人才、在创新活动中培育人才、在创新事业中凝聚人才,聚天下英才而用之,让更多千里马竞相奔腾,努力造就一大批能够把握世界科技大势、研判科技发展方向的战略科技人才,培养一大批善于凝聚力量、统筹协调的科技领军人才,培养一大批勇于创新、善于创新的企业家和高技能人才。要尊重科学研究灵感瞬间性、方式随意性、路径不确定性的特点,允许科学家自由畅想、大胆假设、认真求证。要让领衔科技专家有职有权,有更大的技术路线决策权、更大的经费支配权、更大的资源调动权。政府科技管理部门要抓战略、抓规划、抓政策、抓服务,发挥国家战略科技力量建制化优势。

习近平强调,科技创新、科学普及是实现创新发展的两翼,要把科学普及放在与科技创新同等重要的位置,普及科学知识、弘扬科学精神、传播科学思想、倡导科学方法,在全社会推动形成讲科学、爱科学、学科学、用科学的良好氛围,使蕴藏在亿万人民中间的创新智慧充分释放、创新力量充分涌流。

习近平指出,中国科学院、中国工程院是我国科技大师荟萃之地,要发挥好国家高端科技智库功能,组织广大院士围绕事关科技创新发展全局和长远问题,为国家科技决策提供准确、前瞻、及时的建议。要发挥好最高学术机构学术引领作用,把握好世界科技发展大势,敏锐抓住科技革命新方向。希望广大院士发挥好科技领军作用,团结带领全国科技界特别是广大青年科技人才为建设世界科技强国建功立业。

习近平指出,中国科协各级组织要坚持为科技工作者服务、为创新驱动发展服务、为提高全民科学素质服务、为党和政府科学决策服务的职责定位,团结引领广大科技工作者积极进军科技创新,组织开展创新争先行动,促进科技繁荣发展,促进科学普及和推广。

习近平最后强调,有多大担当才能干多大事业,尽多大责任才能有多大成就。两院院士和广大科技工作者要发扬我国科技界追求真理、服务国家、造福人民的优良传统,勇担重任,勇攀高峰,当好建设世界科技强国的排头兵。让我们扬起13亿多中国人民对美好生活憧憬的风帆,发动科技创新的强大引擎,让中国这艘航船,向着世界科技强国不断前进,向着中华民族伟大复兴不断前进,向着人类更加美好的未来不断前进。

在京中共中央政治局委员、中央书记处书记,全国人大常委会有关领导同志,国务委员,最高人民法院院长,最高人民检察院检察长,全国政协有关领导同志出席会议。

中央和国家机关各部门、各人民团体、中央军委机关各部门、武警部队主要负责同志和大会代表,约4000人参加会议。