汉语的一种知识一体化表示方法
[作者]孟洁; 陈群秀;
[摘要]随着计算机自然语言处理研究的不断深入,人们越来越认识到知识在计算机语言处理系统中的重要性。本文结合语言心理学的一些相关结论,对照人在真实领域中的语言处理过程,提出了一种适合计算机存储和检索的知识一体化表示方法,并分析了它的实际应用前景。
[Abstract]The deeper the research on computer aided naturallanguage processing goes ,the more peoplerealize aboutthe importance of knowledge . This thesis putforward an integrative knowledge representationwhich adapts to the effective computer storage and search . Then the practical application values are pre sented .
[关键字]自然语言处理; 知识; 知识表示; 知识的一体化表示;
|
英日自动翻译系统中基于P-树到D-树转换的的生成模块
[作者]马艾军;
[摘要]本文的内容是在1998 年中文信息处理国际会议小组讨论上发表的基础上加工而成。本文主要讨论了我公司最近研发的英日自动翻译系统中日语生成模块的一些理论和实践问题。主要包括以下几个内容:1 . 语法过滤机制:是该生成模块的开发的核心思想;2 . 格助词的处理问题,这是日文生成成败的关键问题;3 . 核心句转换:整个生成过程就是一个从非核心句到核心句的转换过程;4 . 助动词的处理, P树结构向 D树结构转换的重要组成部分;5 . 否定结构的处理,是该生成模块最困难的问题之一。
[Abstract]This technical report, developed from the short presentation at ‘1998 I C C I P,is concernedwith the phases of Japanese generating module in our English Japanese translation system . Itsfundamentalfocus is on the following points after giving an overview of the system :1 . Gram matical filter mechanism ,the fundamental idea when developing our generating module .2 . Postposition handling mechanism , the central issue when attempting to generate gram matical Japanese sentences .3 . Kernel sentences t...
[关键字]P-树; D-树; 语法过滤装置; 格助词; 核心句;
|
英日机器翻译系统E-to-J原语分析中的兼类词消歧策略
[作者]冯志伟;
[摘要]本文介绍了商品化英日机器翻译系统 Eto J中兼类词的消歧策略。作者根据机器翻译的实践,把英语中同形兼类词归纳为29 种类型,提出了基于上下文环境的处理这些兼类词类型的消歧方法。
[Abstract]This paperintroduces the deambiguity strategy of P O S( Part Of Speech) in English analysis of E to Jcom mercial machine translation system . The 29 types of P O Sambiguity in English are sum ma rized . And the author proposes the deambiguity rules based on the context analysis .
[关键字]机器翻译; 原语分析; 兼类词; 消歧;
|
写在前面
[作者]董振东;
[摘要]
[Abstract]
[关键字]计算机语言信息处理; 机器翻; 概念间的关系; 译文质量;
|
汉英机器翻译源语分析中词的识别
[作者]傅爱平;
[摘要]汉英 M T 源语分析首先遇到的问题是词的识别。汉语中的“词”没有明确的定义,语素和词、词和词组、词组和句子,相互之间也没有清楚的界限。按照先分词、再句法分析的办法,会在分词时遇到构词问题和句法问题相互交错的困难。作者认为,可以把字作为源语句法分析的起始点,使词和词组的识别与句法分析同时进行。本文叙述了这种观点及其实现过程,并且以处理离合词为例,说明了识别的基本方法。
[Abstract]The first problem we have metin source language analysis in a Chinese English M Tsystem is Chinese sentence tokenization ,as in written Chinese there is no explicit word delimiter . Finding tokenboundaries for a character string will be often interlaced with syntactic parsing ,or even with semantic re lations . This paper presents an approach of combination of sentence tokenization and syntactic semanticanalysis. Instead of getting tokenized word string before sentence parsing ,the tokenizing compo...
[关键字]机器翻译; 汉语自动分析; 汉语词的自动识别;
|
机器翻译中汉语的形式和语义分析二题
[作者]刘倬; 傅爱平;
[摘要]汉语分析是英汉和汉英机器翻译的难点。这篇文章提出了分析汉语的两个难题:一个是区分句法结构的歧义和多义,另一个是寻找句子成分之间的隐性语义关系和句式的意义。
[Abstract]Two difficulties in syntactic and semantic analysis for English Chinese & Chinese English ma chine translation are presented in this paper , which are syntactic disambiguity ,and underlying semanticrelations and structural meaning .
[关键字]机器翻译; 汉语自动分析;
|
全国第五届计算语言学联合学术会议(JSCL-99)
[作者]
[摘要]为促进国内计算语言学的研究和应用,加强同行间的学术交流与合作,中国中文信息学会、中国计算机学会、中国人工智能学会和北京市语言学会共同发起于1999年11月1-3日在北京龙泉宾馆联合举办“全国第五届计算语言学联合学术会议(JSCL-99)”,会议的正式...
[Abstract]
[关键字]学术会议; 计算语言学;
|
基于HMM的汉语文本识别后处理研究
[作者]李元祥; 丁晓青; 刘长松;
[摘要]本文用HMM(HiddenMarkovModel)描述汉语文本识别后处理,将汉语语言和单字识别这两个概率模型结合起来,以充分利用单字识别器提供的信息。语言模型的参数由语料库统计得到;单字识别模型的参数为条件概率,经理论分析,它可转化为后验概率来求解。在分析训练样本集单字识别结果的基础上,提出一种统计方法估计候选字的后验概率。HMM在脱机手写体汉语文本识别中的实验表明,后处理性能除取决于语言模型外,还取决于后验概率的精确估计。
[Abstract]
[关键字]汉字识别; 后处理; 语言模型; 隐马尔可夫模型; 后验概率;
|
蒙古文自动处理系统研究
[作者]嘎日迪; 赵小兵; 马红旭; 赛音; 白小玲;
[摘要]本文主要介绍了蒙古文自动处理系统的构成;蒙古文语料库,蒙古文知识库,蒙古文数据库以及蒙古文自动处理系统的软件等问题的初步探索研究的过程。
[Abstract]
[关键字]蒙古文自动处理; 蒙古文语料库; 蒙古文知识库; 蒙古文数据库;
|
文本层次分析与文本浏览
[作者]林鸿飞; 战学刚; 姚天顺;
[摘要]本文简要描述了文本的物理结构和逻辑结构以及相应的向量空间模型。研制了具有导航机制的文本浏览系统。提出了文本结构分析中的层次分析方法,它采用有序划分层次的方法。并在此基础上,给出了文本结构中各单元的标记信息,由此形成了文本的可视化表示。利用文本、层次、段落的超文本连接,根据浏览的需要,逐级展现文本细节,帮助用户有目的、有选择地浏览文本。最后给出评价的结果。
[Abstract]
[关键字]向量空间模型; 文本结构分析; 文本浏览; 文本可视化;
|
共95页 当前第50页