[ 2010 September,09, Thursday ]
中国中文信息学会
Chinese Information Processing Society of China
首页
学会简介
学会领导
学会办公室
工作委员会
专业委员会
学术活动
发展会员
钱伟长中文信息处理奖
科技工作者之家
中文信息学报
新书介绍
按年代和期次浏览(最新数据: 2004年第3期)
基于多元激励的高质量语音合成声学模型
[作者]陶建华; 康永国;

[摘要]传统的参数语音合成系统 ,多采用单纯的源滤波模型 ,缺少变化 ,通常导致在韵律变化较大或生成特定语气时 ,音质损伤较大。本文则在语音逆滤波过程的基础上 ,对声源在不同韵律特征和音色条件下的变化进行了仔细的比较分析 ,通过声源的重构、分类 ,进而形成了适用于多种韵律特征和音色特征的多元激励(Multi-Source ,MS)模型。在此基础构建了基于多元激励的语音合成的声学模型 ,在一定意义上较大的提高了语音合成在大范围语气变化中的合成质量 ,对个性化语音合成 ,以及超小型语音合成系统的建立起到了较好的推动作用。

[Abstract]Traditional source filter model has obvious limitation for speech synthesis in pitch modification due to the lack of spectrum distortion processing. To solve the problem, the paper compares spectrum features of voice source in various F0 ranges and timbres in detail, and generates Muliti-Source (MS) based acoustic model for speech generation in various prosodies and timbres, by classifying and reconstructing voice source into different types. The model enhances the quality of speech synthesis even with str...
[关键字]计算机应用; 中文信息处理; 语音合成; 声学模型; 声源; 多元激励;



考虑语速和前后环境的基频Target模型及实现
[作者]陈高鹏; 胡郁; 王仁华;

[摘要]本文通过一些实验和数据分析 ,对以音节为单位的基频target模型 (认为音节的实际基频是一个有语音学意义的隐藏的目标target和前后环境作用的结果 )的实现进行修正 ,并结合数据挖掘的方法自动得到了一个实用化的target基频模型。文中指出 ,音节的target必须不受语速影响 ,但同时受前后语言环境影响 ,实际的基频曲线是在前后的韵律曲线作用下向target的一个逼近过程。文章的主要任务就是如何假设一个合理的target,实现基频的target参数自动提取 ,最后进行基于机器学习的模型训练 ,成功实现了完全自动化的完整句子的基频预测和合成。集外测试结果预测的均方误差为 2 2Hz ,相关系数为 0 72。

[Abstract]This paper, aided by experiments and data analysis, improves and realizes the pitch target model which regards syllable as a basic linguistical unit. The F0 contour of a syllable is the representation of a result that a hidden target and environment interact. A useful model is realized automatically by data mining. In this paper it is proposed that the target of a syllable is independent on speech speed while it is effected by the linguistic environment. The real pitch is the approximation of the target eff...
[关键字]计算机应用; 中文信息处理; 语音合成; 韵律模型; 基频; Target;



《中文信息学报》第三届编辑委员会
[作者]

[摘要]

[Abstract]
[关键字]中文信息;



基于SVM的中文组块分析
[作者]李珩; 朱靖波; 姚天顺;

[摘要]基于SVM(supportvectormachine)理论的分类算法 ,由于其完善的理论基础和良好的实验结果 ,目前已逐渐引起国内外研究者的关注。和其他分类算法相比 ,基于结构风险最小化原则的SVM在小样本模式识别中表现较好的泛化能力。文本组块分析作为句法分析的预处理阶段 ,通过将文本划分成一组互不重叠的片断 ,来达到降低句法分析的难度。本文将中文组块识别问题看成分类问题 ,并利用SVM加以解决。实验结果证明 ,SVM算法在汉语组块识别方面是有效的 ,在哈尔滨工业大学树库语料测试的结果是F =88 6 7%,并且特别适用于有限的汉语带标信息的情况。

[Abstract]The classification algorithm based on SVM (support vector machine) attracts more attention from researchers due to its perfect theoretical properties and good empirical results. Compared with other classification algorithms, structural risk minimizations based SVM achieve high generalization performance with small number of samples. The text chunking, as a preprocessing step for parsing, is to divide text into syntactically related non-overlapping groups of words (chunks), reducing the complexity of the ful...
[关键字]计算机应用; 中文信息处理; 支持向量机; 结构风险最小化; 文本组块;



Web信息检索结果融合中的按位加权插入合并算法
[作者]张敏; 金奕江; 马少平;

[摘要]在Internet中 ,由于海量数据的多样性 ,在分布式数据集合上进行有效的检索就成为Web信息检索的一种必要方式。由此 ,引出多个检索结果的融合问题。对不同检索结果的相似度评分可能完全不可比的情况 ,本文给出一种新的解决方案 :按位加权插入合并算法。在 18GB的大规模web标准测试集上的实验证明 ,该算法始终能够提高综合检索性能 ,且分布数据集检索结果越好 ,则合并后性能改善越多。其中系统平均精度提高接近 10 %,突破了传统方法对分布数据集结果合并的综合效果总是低于使用集中数据集检索的性能局限。

[Abstract]According to the variety of huge amount of web pages in Internet, it has been necessary to todays Web IR to search effectively on distributed collections. Therefore, the retrieval results fusion problem is derived. In this paper, a novel rank-based weighted insertion results fusion algorithm is proposed. Though it is possible that similarity scores of different results are absolutely incomparable, the proposed algorithm works effectively. Experimental results on 18 GB large-scale Web standard test collecti...
[关键字]计算机应用; 中文信息处理; Web信息检索; 数据集选择; 结果融合; 基于排序的融合;



OpenE:一种基于n-gram共现的自动机器翻译评测方法
[作者]孙连恒; 杨莹; 姚天顺;

[摘要]在机器翻译研究领域中 ,评测工作发挥着重要的作用 ,它不仅仅是简单地对各个系统输出结果进行比较 ,它还对关键技术的发展起到了促进作用。译文质量的评测工作长期以来一直以人工的方式进行。随着机器翻译研究发展的需要 ,自动的译文评测研究已经成为机器翻译研究中的一个重要课题。本文讨论了基于n gram共现的自动机器翻译评测框架 ,介绍了BLEU、NIST、OpenE三种自动评价方法 ,并通过实验详细分析了三种方法的优缺点。其中的OpenE采用了本文提出了一种新的片断信息量计算方法。它有效地利用了一个局部语料库 (参考译文库 )和全局语料库 (目标语句子库 )。实验结果表明这种方法对于机器翻译评价来说是比较有效的。

[Abstract]Evaluations are very helpful for the research of Machine Translation (MT). The aim of evaluations is not only to output the differences among MT systems, but also to stimulate the improvement of key technologies in this area. In the past, the evaluations of MT are performed by human. With the increasing needs of MT research, the automatization of MT evaluations becomes more and more important. This paper introduces the basic framework of automatic MT evaluation using n-gram co-occurrence statistics. Three m...
[关键字]人工智能; 机器翻译; 机器翻译评测; 信息量计算; n-gram共现;



一种改善的基于语言模型的中文检索系统研究
[作者]张俊林; 曲为民; 孙乐; 孙玉芳;

[摘要]最近几年提出的语言模型检索系统将语音识别领域的语言模型技术引入信息检索领域并改善了检索系统的性能 ,但是其隐含的词汇间相互独立的假设并不符合实际情况。尽管统计翻译模型考虑了词汇间的同义词因素 ,但是由于它没有考虑词汇上下文信息 ,所以对于解决多义词词义的区分并无帮助。我们提出了触发语言模型检索方法来改善这一状况 ,通过训练语料得到词汇在一定上下文中的相关比率 ,同时利用查询条件所含词汇计算触发词汇集合来区别查询条件词汇的具体含义并将相关参数引入文档语言模型形成触发语言模型。实验结果表明我们提出的这个方法显著改善了检索系统的性能 ,与经典语言模型方法相比 ,触发语言模型方法的平均查准率提高了约 12 %,召回率提高了 10 8%。

[Abstract]Language model based IR system proposed in recent 5 years has introduced the language model approach in the speech recognition area into the IR community and improves the performance of the IR system effectively. However, the assumption that all the indexed words are irrelative behind the method is not the truth. Though statistical MT approach alleviates the situation by taking the synonymy factor into account, it never helps to judge the different meanings of the same word in varied context. In this paper ...
[关键字]计算机应用; 中文信息处理; 语言模型; 信息检索; 触发;



汉语语料词性标注自动校对方法的研究
[作者]钱揖丽; 郑家恒;

[摘要]兼类词的词类排歧是汉语语料词性标注中的难点问题 ,它严重影响语料的词性标注质量。针对这一难点问题 ,本文提出了一种兼类词词性标注的自动校对方法。它利用数据挖掘的方法从正确标注的训练语料中挖掘获取有效信息 ,自动生成兼类词词性校对规则 ,并应用获取的规则实现对机器初始标注语料的自动校对 ,从而提高语料中兼类词的词性标注质量。分别对 5 0万汉语语料做封闭测试和开放测试 ,结果显示 ,校对后语料的兼类词词性标注正确率分别可提高 11 32 %和 5 97%。

[Abstract]The disambiguation of multi-category words is one of the difficulties in part-of-speech tagging of Chinese text, which affects the processing quality of corpora greatly. Aiming at this question, the paper describes an approach to correcting the part-of-speech tagging of multi-category words automatically. It acquires correction rules for the part-of-speech tagging of multi-category words from right-tagged corpora based on the rough sets and data mining, and then corrects the corpora based on these rules aut...
[关键字]计算机应用; 中文信息处理; 兼类词; 汉语词性标注; 自动校对; 粗糙集;



基于对话语音的与文本无关的说话人确认系统的研究
[作者]陈雁翔; 戴蓓倩; 周曦; 李辉;

[摘要]本文建立了一个基于对话语音的与文本无关的说话人确认系统 ,它和传统的与文本无关的说话人确认系统的关键不同在于 ,训练及测试语音不再只包含一个人而都是对话语音 ,因此需要分割出属于不同说话人的语音段 ,以建立说话人模型和实现最终判决。文中详细介绍了高斯混合模型 -背景模型 (GMM UBM)这种说话人确认系统的框架 ,重点讨论了基于GLR(GeneralizedLikelihoodRatio)距离测度的无监督语音分割算法。最终阐述的输出评分的规整方法即ZNORM (ZeroNormalization)和持续时间修正 ,可以使确认系统的性能提高近 10 %。

[Abstract]In this paper, a text-independent speaker verification system is proposed based on conversation. The key difference between this system and the conventional 1-speaker verification system is that the speech for training and testing is conversation. So speech segmentation based on speakers is applied to train the speakers'models and make the final decision. The GMM-UBM frame is introduced while an unsupervised speech segmentation algorithm based on GLR distance measure is emphasized. Then the normalization of...
[关键字]计算机应用; 中文信息处理; 对话语音; GLR距离测度; 无监督语音分割;



语音合成中的韵律关联模型
[作者]吴志勇; 蔡莲红;

[摘要]基于大规模语音数据库的文语转换系统 (Text to Speech ,TTS)中 ,如何选取合适的语音基元是提高合成语音自然度的重要因素。本文研究了连续语流中的韵律关联现象 ,提出了包含韵律关联参数的汉语韵律特征参数集 ,基于数据挖掘中的关联规则模型 (AssociationRulesModel)建立韵律关联模型 ,并将该模型应用于基元选取。实验表明 ,该方法有效地利用了语音基元的韵律及关联信息 ,符合人耳的知觉感受 ,使得合成语音自然度的主观评测MOS(MeanOpinionScore)得分与不考虑韵律关联时的结果相比提高了 12 2 2 %(3 4 9/3 11)。

[Abstract]In this paper, a new unit selection approach for concatenative Text-to-Speech (TTS) synthesis based on prosodic correlation model is proposed. Firstly, prosodic correlations in continuous speech are studied. Then, some prosodic parameters, including prosodic correlation parameters, are concluded. Thirdly, a prosodic correlation model (association rules model from data mining) is put into use in unit selection. The experiments show that the unit selection method described in this paper can improve the natura...
[关键字]计算机应用; 中文信息处理; 文语转换; 基元选取; 韵律关联;



共95页 当前第22页 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95   
©中国中文信息学会 1981-2007
京ICP备05039057号