[ 2010 September,09, Thursday ]
中国中文信息学会
Chinese Information Processing Society of China
首页
学会简介
学会领导
学会办公室
工作委员会
专业委员会
学术活动
发展会员
钱伟长中文信息处理奖
科技工作者之家
中文信息学报
新书介绍
按年代和期次浏览(最新数据: 1997年第4期)
基于变换的汉语句法功能标注探讨
[作者]周明; 潘海华;

[摘要]本文尝试利用基于变换的方法标注中文句子词汇的句法功能。系统输入已分词并标注了词性的句子,输出每个词的依存关系。我们首先设计了一个由44种依存关系组成的汉语依存体系,然后以人机互助的方式标注了1300句中文句子。其中1100句作为训练文本用来获取标注规则,余下200句用做测试。设计了17类变换模板,采用基于变换的算法获取了60条有序的依存关系标注规则。在测试时,对新词标注以该词词性所对应的最高频的依存关系作为初始标注以提高鲁棒性。实验表明这种方法简单可行,取得了初步满意的效果。

[Abstract]:A transformation based method is applied to tag the syntactic function of the words in a Chinese sentence. The system inputs a Chinese sentence with word boundary and partofspeech information, and outputs the syntactic function for every words in the sentence. To realize this, a Chinese dependency formalism which consists of 44 kinds of dependency relations is firstly designed, and a corpus of 1300 sentences tagged with dependency relations in an efficient manmachine interactive mode is prepared. Among ...
[关键字]基于变换的学习算法; 汉语; 句法标注; 依存关系;



HNC理论概要
[作者]黄曾阳;

[摘要]HNC理论概要黄曾阳主编按语:《HNC理论概要》的作者黄曾阳先生创立的面向整个自然语言理解的理论框架,在语义表达上有自己的特色,在语义处理上走了一条新路。鉴于汉语语法研究尚有诸多困惑,HNC理论所走的以语义表达为基础的新路子对突破汉语理解问题尤其有...

[Abstract]
[关键字]语义块; 语义网络; 抽象概念; 具体概念; HNC理论; 自然语言处理; 自然语言理解;



汉字输入键盘设计方法的研究——兼论标准汉字双拼键盘的设计
[作者]杨道沅; 李棣;

[摘要]本文提出了汉字‘权值’的概念,并以汉字‘权值’做为衡量标准,以汉字输入双拼键盘的设计为例,对如何设计一个优秀的汉字输入键盘的方法进行了详细研究。【摘要】本文提出了汉字‘权值’的概念,并以汉字‘权值’做为衡量标准,以汉字输入双拼键盘的设计为例,对如何设计一个优秀的汉字输入键盘的方法进行了详细研究。同时指出,‘权值’概念的提出同样适合其它类型汉字编码方案的键盘设计。一、问题的提出在我国,汉字输入键盘的设计一般都是由编码者按自己的想法去定义,对如何设计一个好的计算机汉字输入键盘一直缺乏一个有普遍义意的科学的方法,本文力图提出一种有通用意义的,又很容易和各种汉字输入编码方案相结合的键盘设计方法。键盘设计方法必须和某种汉字编码方案相结合,本文以汉字输入双拼方案的键盘设计为例,说明这一方法的实现过程,以达到抛砖引玉的目的。二、汉字词权值的定义A.各类汉字编码方案的共性目前,计算机汉字输入方案有几百种之多,若按类来分,可分为音码,形码,音形码,形音码四大类,花样繁多,各汉字编码专家都强调自己的编码方案的优点,也即强调各编码的特殊性,但本文要讨论的是各编码方案在键盘设计时应注意的共性,它们都有一个共同的特点,在输入汉字,词

[Abstract]
[关键字]结合律; 权值; 汉字信息处理; 声母; 设计方法; 工作量; 韵母;



论多媒体技术在语言信息处理中的作用
[作者]张普;

[摘要]本文分为三部分:首先,概述了目前自然语言理解主要是汉语理解技术的现状,指出迄今为止用于自然语言理解的语言知识几乎都是来自书面语料的,是单媒体的。其次,从七个不同层次分析了(汉语)自然语言理解中存在的多重歧义问题,指出多重歧义如何消解是目前自然语言理解中的难题。第三,论证了多媒体与虚拟现实技术在自然语言理解中的作用,指出语言交际和交际环境的多媒体性质,主张建立多媒体语言资料库,获取多媒体语言交际知识,从而从语言学的角度论述了将最新的多媒体和虚拟现实技术用于自然语言理解的必要与可能。

[Abstract]This paper consists of three parts.The first part gives a survy of current situation of the technology of understanding of natural language(mostly Chinese),and states that almost all language source used in the natural language understanding are from written materials and Mono-mediaed.The second part analizes the ambiguity in the Chinese understanding from seven aspects, and proposes that ambiguity and disambiguity is the key to the natural language understanding.The third part expounds the effect of Multi ...
[关键字]语言知识; 语料库; 语言信息处理; 语言交际; 虚拟现实技术; 多媒体技术; 多媒体语言; 汉语信息处理; 自然语言理解;



一种文本理解的知识表示方法
[作者]麻志毅; 姚天顺;

[摘要]对自然语言文本的理解,应该把它与一定的情境联系起来。本文正是基于这样的思想,讨论了一个文本所描述的事物及其有关情境是如何在机内表示的。

[Abstract]To understand a Text,we must relate the text with a specified situation. The paper,on the basis of the idea,deals with how the things that a text discriptes and the situation that the text relate to are expressed in a computer.
[关键字]情境理论; 复杂特征集; 知识表示; 自然语言理解;



汉语受限语言的设计与应用
[作者]孙健; 张尧; 王启祥;

[摘要]在机器翻译和自然语言理解等领域内,受限语言的研究是一项有意义的工作。本文在分析考查现代汉语岐义短语的基础上,设计了一个汉语受限语言,籍以对存在汉语中的岐义进行受限处理,并且给出了一个应用实例———面向受限汉语的机器翻译前编辑系统。

[Abstract]The research of work of Controlled Language is very worthwhile in the field of Machine Translation and Natural Language Understanding. This paper discusses some principles of designing Controlled Language. On the basis of investigating and analyzing a great number of ambiguous phrase of Chinese,we design a Controlled Chinese for the sake of processing the ambiguity in Chinese. As an application instance,a Controlled Chinese oricnted Machine Translation Preeditor System is presented in this paper.
[关键字]汉语; 受限语言; 歧义; 机器翻译; 前编辑;



《现代蒙语词频统计软件系统》的设计与实现
[作者]吉日木图; 嘎日迪; 赛音; 达·巴特尔;

[摘要]本文介绍了《现代蒙语词频统计软件系统》的设计原理与实现方法。重点论述了统计模型的建立,B一树数据库的实现,同形词标记,单词统计,复合词统计,合并,频度排序,使用度排序,读音排序以及结果输出等语料处理软件系统的设计与实现。

[Abstract]This article introduced the designing principle and realizing method of software system of modern mongolian word frequency statistics,especially.introduced the designing and realizing method of subsystem such as creating statistical model,designing the B—tree database, marking homograph,individual word statistics,compound word statistics, merging result, sorting result in frequency ,in usage, in pronunciation and printing the result.
[关键字]现代蒙语; 词频; 统计; B-树; 数据库; 排序;



多字体印刷维吾尔文的切分
[作者]哈力木拉提; 丁晓青;

[摘要]在许多文字识别系统中,字符切分是预处理阶段的一部分,其目的是从文本图象中分离出字母图象。而后才能针对切分后的每个字母进行识别。在具有连体特征的文字中,字符切分就显得特别重要,因为字符切分的准确与否直接影响字符的识别。维吾尔文就具有这种明显的连体特点,本文主要讨论了采用抽取投影特征的方法,实现了多字体维吾尔文的行切分、字切分和字符切分。

[Abstract]In many OCR systems,character segmentation is a necessary phase for character recognition. it is very important and difficult to segment characters in cursive script characters,because the incorrect segmentation affects the result of the characters recognition. Uygur characters are featured with cursive script. In this paper, we present a method of segmenting Uygur printed characters that is based on the projection of character image, to realize segmentation of line、word and characters from a scanned image ...
[关键字]维吾尔文; 连体字符; 字符切分; 文字识别; 投影; 特征; 草书;



阿拉伯文字、汉字兼容处理系统
[作者]吴宗尧; 李健; 艾尔肯; 吴丹竹;

[摘要]本文描述阿拉伯文特色,提出阿文与汉字兼容的一种编码方法,介绍典型系统Windows3.1forArabic与ChineseStar2.0的系统集成原理和方法。

[Abstract]Abstract In this paper,the style and coding method of Arabic are described,and the method of composite system“windows 3.1for Arabic”with“Chinese Star 2.0 ”are presented.
[关键字]阿拉伯文; 兼容处理; 系统集成;



汉语文本压缩研究及其应用
[作者]王忠效;

[摘要]汉语文本压缩至今很少受到重视,然而,作为许多计算机应用系统的支撑技术,其重要性毋庸置疑。本文结合汉语文本的特征对现行文本压缩技术进行评述,指出汉语文本理论上可能获得的平均压缩比率(〉3.9)及现行压缩算法所能达到的水平(1.6左右)。此外,讨论了汉语文本压缩的研究方向以及几种典型的应用。

[Abstract]Chinese text compression has got little attention,but its importance as one supporting technique for many computer applications is beyond any doubt. This paper has investigated current theories and methods of text compression in accordance with the characteristics of Chinese text. It shows that Chinese text compression can even reach an average compression ratio as high as 3.9 theoretically,while it merely stays at around 1.6 with current compression algorithms. Besides,some research directions of Chinese t...
[关键字]汉语文本压缩; 算术编码; Hufman编码; Lempel-Ziv算法; 熵;



共95页 当前第59页 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95   
©中国中文信息学会 1981-2007
京ICP备05039057号