[ 2010 September,10, Friday ]
中国中文信息学会
Chinese Information Processing Society of China
首页
学会简介
学会领导
学会办公室
工作委员会
专业委员会
学术活动
发展会员
钱伟长中文信息处理奖
科技工作者之家
中文信息学报
新书介绍
按年代和期次浏览(最新数据: 2004年第4期)
基于转换的时间-事件关系映射
[作者]王昀; 苑春法;

[摘要]近些年来 ,中文时间信息抽取和处理已经变得越来越重要。然而 ,很少有研究者关注中文文本中事件信息所对应的时间信息的识别和分析。本文的目的就是确定文本中时间信息和事件信息之间的映射关系。区别于传统的基于规则的方法 ,本文采用了一种机器学习的方法—基于转换的错误驱动学习—来确定事件相应的时间表达 ,这种学习算法可以自动的获取和改进规则。使用训练得到的转换规则集后 ,系统的时间 -事件映射错误率减少了 9 74 % ,实验结果表明本系统对基于规则的方法有很好的改进效果

[Abstract]In the past years, temporal information processing and extraction has received increasing attentions. Nevertheless, only a few researchers have investigated the recognition about corresponding temporal expression of the event in Chinese text. The aim of this paper is to investigate both the temporal information extraction and the determining of mapping relation between event and its temporal expression. As compared to many other techniques, we use a machine learning method, transformation based error driv...
[关键字]计算机应用; 中文信息处理; 时间信息处理; 基于转换的错误驱动学习; 信息抽取;



基于机器理解的汉语隐喻分类研究初步
[作者]杨芸; 周昌乐; 王雪梅; 戴帅湘;

[摘要]本文将汉语隐喻分类计算模型的研究引入汉语的机器理解当中 ,通过对大规模汉语隐喻语料的研究分析 ,结合汉语隐喻的认知特征 ,笔者构建了一套基于理解的汉语隐喻分类体系。分类主要以汉语隐喻句中本体和喻体的内在相似性作为切入点 ,从隐喻理解的方式、理解的难易程度以及理解所涉及的相关知识结构等方面进行综合分析 ,同时 ,辅以真实语料的统计分析 ,对分类的合理性作出了验证和修订 ,最终给出了基于理解的汉语隐喻分类体系 ,并对该体系作出了语言学上的比较和解释

[Abstract]This paper introduces computational model of Chinese metaphor in machine understanding of Chinese. By analyzing large scale Chinese metaphor samples, we have classified Chinese metaphor based on understanding. The cognitive features of Chinese metaphor are also considered to improve our classification. The classification focuses on the similarity of the tenor and vehicle in a metaphor, showing the mode and difficulty of metaphor understanding. The relevant knowledge in metaphor understanding is also disc...
[关键字]计算机应用; 中文信息处理; 隐喻; 分类; 计算模型; 相似性;



基于互连网的术语定义获取系统
[作者]许勇; 荀恩东; 贾爱平; 宋柔;

[摘要]文中介绍了一个实验性的基于互联网的术语定义获取系统 ,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容 ,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便。系统采用一组术语定义的语言学模式 ,以多线程方式高效下载网页 ,并从中匹配符合术语定义模式的文本段落 ,再经一定后续处理 ,形成返回给用户的结果。系统中使用的语言学模式是在一定量的科技期刊语料库中获取的。试验结果表明系统的运行效率高 ,结果的准确度比较令人满意

[Abstract]This paper presented an experimental Web Based term definition retrieval system. It can provide the users convenient way to obtain definition related knowledge of newly emerged terms, like Clone, ADSL, etc. The system mainly consists of two modules: web crawling module and term definition matching module. Based on multi thread architecture, the web crawling module downloads web pages efficiently, in which the term definition matching module searches for the term definitions simultaneously with a set of t...
[关键字]人工智能; 自然语言处理; 术语定义; 信息抽取;



灰度图像中字符切分方法的研究
[作者]陈艳; 孙羽菲; 张玉志;

[摘要]字符切分目前已经成为限制OCR技术发展的瓶颈 ,对于图像质量较差、中英文混排和背景色变化的文本图像 ,传统切分方法造成的切分错误使得文字识别率大大降低。针对这些问题 ,本文提出了新型文字切分方法。该方法先将灰度图像的灰度值进行分级处理 ,再根据分级连通域的概念把整个图像构造成树状结构 ,然后确定主层次级别 ,根据一定的规则在部分节点上进行合并、分割等进一步处理 ,最后得到最优的切分结果。实验结果表明 ,该方法能够取得比常规切分方法更好的切分效果

[Abstract]In order to overcome the weakness of conventional segmentation algorithm in OCR, this paper presents a new segmentation method for gray document image. Important features of the new method include grading of the grayscale of pixels in image and construction of a tree structures for the whole document image. By dividing this trees branches and leaves, characters, pictures and forms can be correctly segmented. The experiment results showed that this method is very effective for document with both Chinese and...
[关键字]人工智能; 模式识别; 字符切分; 灰度图像; OCR;



基于规则库的汉字输入法自动评测系统的设计
[作者]张玉华; 周克兰;

[摘要]汉字编码输入法是汉字输入电脑的主要方式。对输入法进行科学评价 ,从而帮助软件开发人员和输入法用户进行自我改进或评估 ,有其十分积极的意义。本文在实际应用基础上 ,提出了通过汉字输入系统输入规则库的建立 ,在选定的输入法状态下 ,通过计算机自动模拟汉字输入得到输入法码本 ,并以码本为基础根据信息技术国家标准完成输入法性能自动评价的思路

[Abstract]The major way of inputting Chinese character into computer is the Chinese encoding input method. It is very important to evaluate the Chinese input method scientifically and help the programmers and the users improve the technology and make their choice. Depending on actual application, this thesis promotes the way of how to evaluate the Chinese input method performance. It narrates how to establish the input rules of any Chinese input methods, in a certain input method how the Computer simulates the input ...
[关键字]计算机应用; 中文信息处理; 码本; 规则库; 自动评测系统;



一种计算汉字串之间相关程度的新方法
[作者]曹娟; 周经野;

[摘要]本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念———黏结度 ,并给出了其计算方法。该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论 ,通过加入上下文信息来提高分词的准确度 ;另外 ,该方法在引用汉字词频时 ,增加了对动态词频的考虑 ,可以自动识别未登陆的专业词汇。文中同时给出了黏结度在分词领域中的应用实例。通过与前人提出的相关信息的方法相比较 ,这种计算方法能够解决分词中一些难于解决的问题并提高分词的精确度

[Abstract]In this paper we put forward a new concept, the degree of cohering of Chinese strings, and its computation. Its value reflects how close the two strings are interrelated. This method completely considered the environment of the Chinese strings and the local use frequency of the words. Its definition and the examples of applying it in word segmentation are presented。 Compared with the method of mutual information the predecessors had put forward, this method can solve some difficult problems in word segm...
[关键字]计算机应用; 中文信息处理; 黏结度; 相关信息[5]; 分词;



《信息处理用GB13000.1字符集汉字部件规范》在输入法应用中的难点讨论
[作者]张小衡;

[摘要]《信息处理用GB1 30 0 0 1字符集汉字部件规范》对于规范汉字形码输入法具有非常重要的意义。然而 ,在实际运用上却存在着部件数量太大 ,部件定义难以操作 ,部件拆分组合不易掌握等难处。造成困难的原因主要有 :(1 )基础部件主要靠列表来确定 ,(2 )部件强调按理切分和成字组合 ,(3)过多依赖“组字能力”的判别 ,(4 )过分注重部件数量的限制。要走出“难”的困境 ,应该在现有规范的基础上根据汉字的形态特征制定出简便可靠的部件识别规则和切分规则。实验证明 ,这种方法是行之有效的

[Abstract]Chinese Character Component Standard of GB 13000.1 Character Set for Information Processing is an important document for the standardization of Chinese character input methods. Yet, when employed to the design and implementation of a nontrivial Chinese character input system, the standard encountered a number of difficulties: the hard to remember large number of coding components, the difficult to maneuver definition of basic components, and the poor rules for component disassembly and assembly. The sou...
[关键字]计算机应用; 中文信息处理; 汉字输入; 汉字部件; 规范;



自然言语的韵律组织中的不确定性及其在语音合成中的应用
[作者]初敏;

[摘要]本文对自然言语的韵律组织中的不确定性及其对合成语音自然度的影响进行了初步探讨 ,并在此基础上 ,提出在韵律预测中用最小错误概率准则代替传统的最大生成概率准则 ,从而在预测结果中保留多种等价的韵律实现。本文还进一步提出一种将基于最小错误准则的韵律预测与单元选择结合的算法 ,首先根据最小错误准则在所有候选单元中筛选出最不可能造成韵律错误的样本 ,然后再依据最平滑拼接准则从各种韵律等价的路径中选出一条能达到最平滑拼接的作为最后输出

[Abstract]This paper explores the uncertainty of prosody in a speech corpus, which contains two read versions of 1000 sentences by a professional voice talent under the same linguistic and affective planning. It is found that corresponding prosodic features in the two versions change in a rather wide range. The scope of local variations can be as large as 45-50% of the overall variation range of a speaker. Based on such observation, this paper proposes a minimum error rate criterion (MERC) to replace the traditional...
[关键字]计算机应用; 中文信息处理; 言语; 韵律的不确定性; 单元选择; 最小错误准则;



盲人用计算机软件系统中的语音和自然语言处理技术
[作者]庄丽; 包塔; 朱小燕;

[摘要]本文介绍了智能技术与系统国家重点实验室开发的“北极光”盲人用计算机软件系统中涉及的语音和语言处理技术。该系统能够获取和分析需要反馈的屏幕信息 ,通过语音合成平台将其内容朗读出来 ,对用户进行语音提示 ;与汉语自动分词、语言模型等自然语言处理技术的结合 ,使系统能够进行汉字和盲文的转换 ,反馈信息可以通过盲文点显器输出 ,使用户能够摸读盲文点字来获取所需要的信息 ,用户也可以采用盲文输入法进行输入 ,输入结果可转换为汉字文本形式

[Abstract]Some speech and language processing technique used in the “Aurora” software system for the blinds developed by the State Key Laboratory of Intelligent Technology and Systems is introduced in this paper. The software system can obtain and analyze screen information that requires feedback, and read it in virtue of a speech synthesis platform to give information to the users. By using some natural language processing technique, including Chinese word segmentation and language model, the system can realize the ...
[关键字]计算机应用; 中文信息处理; 语音合成; 文本分析; 汉语自动分词; 语言模型;



多模式汉语连续语音识别中视觉特征的提取和应用
[作者]刘鹏; 王作英;

[摘要]本文对在汉语多模式汉语语音识别系统中利用视觉特征进行了研究 ,给出了基于多流隐马尔科夫模型 (Multi streamHMM ,MSHMM)的听视觉融合方案 ,并对有关视觉特征的两项关键技术 :嘴唇定位和视觉特征提取进行了详细讨论。首先 ,我们研究了基于模板匹配的嘴唇跟踪方法 ;然后研究了基于线性变换的低级视觉特征 ,并与基于动态形状模型的特征作了比较 ;实验结果表明 ,引入视觉信息后无噪环境下语音识别声学层首选错误率相对下降 36 0 9% ,在噪声环境下的鲁棒性也有明显提高

[Abstract]In this paper, we investigate on the using of visual feature in Mandarin multimodal speech recognition. The audio visual fusion strategy based on multi stream hidden Markov model is presented. Then key technologies about visual feature, including lip location and visual feature extraction, are discussed. Firstly, we research on the lip location algorithm based on model matching and the low Subsequently, the low level visual feature based on linear transform is investigated and compared to the high level...
[关键字]计算机应用; 中文信息处理; 多模式; 听-视觉融合; 视觉特征提取; 鲁棒性;



共95页 当前第20页 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95   
©中国中文信息学会 1981-2007
京ICP备05039057号