知识构建是知识图谱中的核心技术,是自然语言处理领域学术界和企业界的研究热点,本报告主要围绕哈工大《大词林》知识库的构建工作展开。传统命名实体的类别有限,无法满足自然语言处理领域各种应用的需求,开放域实体类型可以更灵活的处理实际任务。开放域实体类型获取可以从多个信息源中挖掘并筛选出置信度高的类型,层次化构建是根据实体类型,利用词的分布表示,学习从下位词到上位词的分段映射矩阵,进而构建大规模实体间的上下位关系。最终构建的《大词林》知识库是包含同义、同类、上下位关系的动态层级知识体系,并且能够不断地自动扩充,为上层应用研究提供支持。