论文投稿百科

闽南方言研究现状论文

发布时间:2024-07-03 12:55:56

闽南方言研究现状论文

海外和闽南语本土以及台湾闽南话都有衰退趋势,现在所有讲闽南话的族群都时不时蹦出一句国语

福建地区在唐宋时期曾是汉语音韵学兴盛的地区之一。唐宋年间的两部早期韵图《韵镜》和《七音略》都跟福建人有着很密切的关系。《韵镜》的刊印者三山张麟之可能是福州人(福州别称三山,不过也有别的地方别称三山的),《七音略》的刊印者郑樵是莆田人。但唐宋时期人们关心的只是如何解释《切韵》,而对方言口语并不关心。明嘉靖年间,出现了第一部福州话韵书——《戚参将八音字义便览》。清朝康熙年间,又出现了福州话韵书《太史林碧山先生珠玉同声》、闽南语韵书《渡江书十五音》和《拍掌知音》。其中《渡江书十五音》是参照两部福州话韵书编成的。乾隆年间,《戚参将八音字义便览》与《太史林碧山先生珠玉同声》这两部福州话韵书合订为《戚林八音》并出版刊行,该书系统地记载了18世纪福州话的音系,对其他闽语的韵书影响甚大。后来的《安腔八音》、《建州八音》等闽北、闽东地区韵书便是受到《戚林八音》很大的影响。民国初年,广东饶邑隆都人(今汕头市澄海区莲华镇人)张世珍参照《渡江书十五音》,编写了潮州话韵书《潮声十五音》。厦门、福州、汕头、海南、台湾等地开埠后,西方传教士纷至沓来。为了便于传教,他们创造了闽南语白话字、福州土腔罗马字(福州话平话字)、兴化平话字、建宁府土腔罗马字等文字,以便记载闽语。他们也开始首次用西方语言学理论来描写和解释闽语。日本学者小川尚义在20世纪初调查了台语(台湾话),并为台语的研究作出了巨大贡献。1930年代,中国学者用现代语言学理论描写、解释闽语的著作日益增多(例如《闽音研究》)。1950年代是两岸方言调查的一个高峰期,同时海外亦有《四个闽南方言》的出版。

我们学校生物老师上课几乎都讲闽南语哦,我们全家都会说闽南语哦。我发现永春都是讲闽南语哦。。。。。。

不是很明白你的意思。我这儿有很多地方方言的论文,随便一篇就可以吗?

论文引言研究现状

很多同学在写国内外研究现状时,都会很纠结国外部分怎么写,一个原因是找不到权威的外文文献,另一个也是因为看不懂外文文献。这里有两个方法,帮你顺利完成国外研究现状撰写,不会写的宝子们赶紧来看~

1、从中文文献中总结中文文献一般都有国内外研究现状或文献综述,多看几篇,把其中那些常见的、意义重大的、学术大牛研究的、以及发表在核心期刊上的内容综合整理出来。

从中文文献的参考文献中寻找外文文献中文文献的参考文献中都 一定数量的外文文献,找到之后在知网或其他论文网站搜索下载,浏览时重点查看研究背景、研究方法和研究结果这几个部分,基本都能在摘要和引言中找到。这种方法需要借助翻译软件—— CNKI 翻译助手与其他翻译软件相比,它对专业名词的翻译更加准确,可以通过选中知网页面上的外文内容,点击 CNKI 在线翻译,直接跳转翻译页面。

2、查找研究领域的综述类文献述类文献和开题报告、论文中的文献综述都需要重点介绍国内外研究现状,但综述类文献包含的内容更加广泛,涉及文献众多,参考资料非常丰富,并有作者自己的看法和意见,如果能找到几篇研究领域内的综述类文献,那不管是写国内研究现状还是国外研究现状都会非常方便书写。

论文国内外研究现状写法如下:

首先,我们要知道国内外研究现状是什么,其实通俗来说,就是国内和国外对于一个研究对象目前的研究现状,可以是国家层面上相关部门对于研究对象的研究,也可以是权威学者,对于研究对象的研究。

所以很明确,国内外研究现状有两种写法,要不就是从相关部门对于研究对象的研究,或者就是从学者对于相关研究现状的研究来写。

正常来说,国内外研究现状都需要大家去阅读大量的文献,然后总结学者的主要观点,这里给大家一个小技巧,可以直接从一篇文章的摘要看出来,一个学者的研究观点主要集中在哪些,这样的话,即便你不完整的阅读文章,也能知道文章的主要观点。

还有一种方法,可以直接从硕士论文里面去摘抄,大家可以找一些和自己题目一样,或者是关键词一样的硕士论文,我们在里面摘抄国内外研究现状,并且将这个话改成自己的意思,这也是一种写作方法。

但是注意标注引用的时候,一定要找到最根本的文章,而不是你参考的这篇硕士论文。找文献去哪里,中文的话我们可以从百度学术或者是知网里面直接观看,主要就是看一篇文章的摘要,因为主要观点都在摘要里。

英文的话,之前有提过从谷歌学术去搜索关键词,就能找到很多的国外文献,这里要注意,查找国外文献的关键词,一定要翻译成英文,如果是中文的话,是没办法识别的,然后只需要把相关的英文文献翻译成中文,再去进行总结就可以了。

研究现状是开题报告的关键部分,对开题报告的层次和水平起决定性作用,也是英语论文“文献综述”的基础。

撰写研究现状之前,需要查阅与论文选题有关的国内外文献,以便了解国内外在该选题上的研究现状,比如:目前已经有了哪些方面的研究;这些研究是如何实施的;它们的研究方向和深度;取得了什么成果;还有哪些问题有待解决等等。

对选题相关文献的认真查阅不但可以让我们避免进行无效重复的研究工作,而且可以开阔我们的视野、拓展我们的研究视角。通过较全面的国内外文献资料的分析就可以发现以往研究的不足或漏洞,甚至可以启迪新的研究思维和角度,为我们提供新的研究目的和切入点。

写论文研究现状注意事项

研究现状内容长度一般是在1000字左右。并要附上有权威性和时效性的参考文献目录。在写研究现状时,不能单纯列举,应避免繁琐和不得要领。

另外也应避免空洞和泛泛而谈。要先从大处着手,然后逐步归拢,最后集中到本选题的研究问题上。要对所搜集到的研究文献进行的归纳和整合,客观地阐述研究背景,然后对巳有研究的不足进行主观评论。

必须指出国内外文献就相关论题已经提出的观点、解决方法和阶段性成果,阐述这些研究的广度、深度和不足,从而提出有待进一步研究的问题,确定本选题研究的平台,并指出本选题的研究预期将有哪些突破。

闽方言论文题目

68. 东北方言词汇与多元文化(字数:9192,页数:12 )69. 王家卫电影的人物精神分析与都市表达(字数:9573,页数:12 )70. 《三国演义》对《三国志》的材料取舍与改编(字数:10818,页数:14 )71. 艰难的辩白——对《我在霞村的时候》的重新解读(字数:8905,页数:11 )72. 景点命名的语言分析(字数:10523,页数:12 )73. 论铁凝小说中的女性救赎向度(字数:8695,页数:11 )74. 《儒林外史》对士阶层现状与命运的省思(字数:21174,页数:28 )75. 从《好奇害死猫》看都市人精神的扭曲(字数:9260,页数:10 )76. 徐志摩、林徽因情诗考述(字数:9045,页数:13 )77. “汉字繁简字之争”的思考(字数:9112,页数:12 )78. 闽南方言词语谐音现象研究(字数:9860,页数:14 )79. 艰难的辩白(字数:8905,页数:11 )80. 宋词中的杭州城市文化研究(字数:11198,页数:14 )81. 论白居易中隐诗(字数:8809,页数:11 )82. 从“穿越小说”看当代女性意识(字数:9438,页数:11 )

我先给你提供一份大纲你看下合适不合适内 容 摘 要本文以人民币升值背景为开端,对人民币汇率机制进行综述,重点论述了人民币升值对中国经济的影响,包括有利影响和不利影响,运用基本经济模型与数据进行分析,详细有力地论证了人民币升值对中国经济可能带来的各种影响,总结出我国政府应对的策略。文章最后,笔者就此问题提出了自己的看法,对现今人民币升值情况进行分析,得出人民币适时升值对我国经济发展不可估量的积极意义,并进一步提出合理建议。

湄洲方言是莆田话不是闽南话从湄洲方言不是闽南话说起电视连续剧《戏说乾隆》的有关故事发生在福建莆田湄洲,可是在戏中却不时出现用闽南话的对白,使观众看了听了莫名其妙,同时也使不明真相的观众产生错觉,以为莆田湄洲也是讲闽南话。莆田湄洲位于福建中部,离台湾最近。湄洲是莆田的一部分,包括湄洲岛和湄洲湾。[湄洲祖庙在湄洲岛上,是世界妈祖信仰的信众的朝圣的圣地,湄洲因此名闻天下。]莆田的方言古称兴化话,现在叫莆仙话,[意即莆田和仙游的方言。]含有吴越语和日语的词汇。莆仙话既不是福州话,也不是闽南话,是独树一格的方言,使用人众包括海内外的莆仙老乡有三百万人,使用区域在莆田市全境,惠安县的南埔乡,福清县的江兜镇,以及周边邻近县的部分村落。莆仙话与闽南话[台湾大部分人说的方言就是闽南话]不能交流。可《戏说乾隆》却把闽南话配音到莆田湄洲来了,好像闽南话在莆田湄洲也可以通用,真有点不伦不类。我觉得现在有些人在影视里以艺术为幌子故弄玄虚,让人不懂或难懂,有些古代玄学的味道。这样的人的心里总是以别人不知所云来显示他的高深的。普通话是汉语[华语]的最高标准,任何地方的方言都有它的局限性。解放后,随着新中国教育事业的发展,越来越多的人以能讲一口标准的普通话为荣,常常以中央人民广播电台的播音员的语音为榜样来学习,而为自己带地方口音使人听不懂或个别听不懂感到苦恼。闽南话和客家话在港台地区可以行得通,他们在影视或歌曲里用方言是为了让在那里的最广大的民众听得明白,目的是深入观众或听众,达到社会效果和经济效果。并不是艺术需要方言,而是观众或听众需要方言。这就和大陆各地的戏曲都用各地的方言一样,语言相通才能产生艺术效果。不知从什么时候开始,影视创作中大量地使用方言,好像真的很时髦。可能创作先生们只考虑“艺术”,如何开创自己的“风格”,而最重要的观众们却没有去考虑,请问,有人讲话你听不懂,你会怎么样?这是一个直接关系收视率或票房收入的问题。普通话是任何方言都无法假冒的,就是北京话也不能冒充普通话。北京话就是北京话。在中央电视台和北京电视台,有个别节目主持人满口北京腔,使外地观众听得很累。其特点 是舌尖和牙齿离不开,使观众觉得他[她]把口水吐掉了再说有多好呀!现代技术的字幕显示,是一种辅助手段,也是无法替代普通话的。我们从影视中看到的那么多译制片,普通话配音多好啊!假如字幕显示就能达到效果,那译制片的配音演员就要改行,去学电脑字幕显示技术。观众能看懂听懂才是好。退回来说,《戏说乾隆》里的方言如果[在湄洲]使用莆仙话对白,还说得过去,反正七呀不笑八,大家都在用方言。可是,莆田湄洲人讲闽南话不讲莆仙话,牛头不对马嘴,弄得太玄了,以致莆田人都不知所云。我认为,产生这种情况的是创作人员闭门造车想当然,连外景地不在莆田拍摄。南少林的武功片都在莆田南山广化寺实地拍摄,可是发生在莆田的故事不在莆田拍外景。因为莆田的房屋结构和别的地方的房屋比起来都不同,它的屋顶结构很特别……谈到此,使我想起鲁迅先生不能用“广州的雪花大如席”来夸张的话,任何艺术都离不开产生它的土地。我们的影视艺术应面对世界五分之一的人们,用普通话配音。不然的话,我们国家教育事业从幼儿园开始,就教孩子学汉语拼音,将造成很大浪费,因为还要去学习东西南北中的各种方言,才能看懂听懂影视里的语言[对白]。【注:本文于1994年11月4日草成】

不是很明白你的意思。我这儿有很多地方方言的论文,随便一篇就可以吗?

语言合成研究现状论文

这篇博客的主要内容是对语音合成 (text to speech)的背景知识进行介绍。 希望可以让读者通俗易懂的了解语音合成的工作原理, 并对为了理解state-of-the-art text to speech 的算法做基础。这个简介主要基于这篇论文 “Wavenet: a generative model for raw audio”的附录介绍的。 论文链接如下: , 以及stanford CS224S的课程, 链接如下 语音合成是通过文字人工生成人类声音, 也可以说语音生成是给定一段文字去生成对应的人类读音。 这里声音是一个连续的模拟的信号。而合成过程是通过计算机, 数字信号去模拟。 这里就需要数字信号处理模拟信号信息,详细内容可参考 [1]。 图片1, 就是一个例子用来表示人类声音的信号图。 这里横轴是时间, 纵轴是声音幅度大小。声音有三个重要的指标, 振幅(amplitude) , 周期(period) 和 频率(frequency) 。 振幅指的是波的高低幅度,表示声音的强弱,周期和频率互为倒数的关系, 用来表示两个波之间的时间长度,或者每秒震动的次数。  而声音合成是根据声波的特点, 用数字的方式去生成类似人声的频率和振幅, 即音频的数字化。了解了音频的数字化,也就知道了我们要生成的目标函数。 音频的数字化主要有三个步骤。 取样(sampling) :在音频数字化的过程,采样是指一个固定的频率对音频信号进行采样, 采样的频率越高, 对应的音频数据的保真度就越好。 当然, 数据量越大,需要的内存也就越大。 如果想完全无损采样, 需要使用Nyquist sampling frequency, 就是原音频的频率2倍。 量化 (quantization) : 采样的信号都要进行量化, 把信号的幅度变成有限的离散数值。比如从0 到 1, 只有 四个量化值可以用0, , , 的话, 量化就是选择最近的量化值来表示。 编码 (coding ):编码就是把每个数值用二进制的方式表示, 比如上面的例子, 就可以用2bit 二进制表示, 00, 01, 10, 11。 这样的数值用来保存在计算机上。 采样频率和采样量化级数是数字化声音的两个主要指标,直接影响声音的效果。 对于语音合成也是同样, 生成更高的采样频率和更多多的量化级数(比如16 bit), 会产生更真实的声音。  通常有三个采样频率标准 1. 采样, 用于高品质CD 音乐 2. 采样, 用于语音通话, 中品质音乐 3 . 采样, 用于低品质声音。 而量化标准一般有8位字长(256阶)低品质量化 和16位字长(65536阶)高品质量化。 还有一个重要参数就是通道(channel), 一次只采样一个声音波形为单通道, 一次采样多个声音波形就是多通道。 所以在语音合成的时候,产生的数据量是 数据量=采样频率* 量化位数*声道数 , 单位是bit/s。 一般声道数都假设为1.。 采样率和量化位数都是语音合成里的重要指标,也就是设计好的神经网络1秒钟必须生成的数据量 。 文本分析就是把文字转成类似音标的东西。 比如下图就是一个文本分析,用来分析 “PG&E will file schedules on April 20. ” 文本分析主要有四个步骤, 文字的规范化, 语音分析, 还有韵律分析。 下面一一道来。  文本分析首先是要确认单词和句子的结束。 空格会被用来当做隔词符. 句子的结束一般用标点符号来确定, 比如问号和感叹号 (?!), 但是句号有的时候要特别处理。 因为有些单词的缩写也包含句号, 比如 str. "My place on Main Str.  is around the corner". 这些特别情况一般都会采取规则(rule)的方式过滤掉。 接下来 是把非文字信息变成对应的文字, 比如句子中里有日期, 电话号码, 或者其他阿拉伯数字和符号。 这里就举个例子, 比如, I was born April 14. 就要变成, I was born April fourteen.  这个过程其实非常繁琐,现实文字中充满了 缩写,比如CS,  拼写错误, 网络用语, tmr --> tomorrow. 解决方式还是主要依靠rule based method, 建立各种各样的判断关系来转变。 语音分析就是把每个单词中的发音单词标出来, 比如Fig. 3 中的P, 就对应p和iy, 作为发音。 这个时候也很容易发现,发音的音标和对应的字母 不是一一对应的关系,反而需要音标去对齐 (allignment)。 这个对齐问题很经典, 可以用很多机器学习的方法去解决, 比如Expectation–maximization algorithm. 韵律分析就是英语里的语音语调, 汉语中的抑扬顿挫。 我们还是以英语为例, 韵律分析主要包含了: 重音 (Accent),边界 (boundaries),  音长 (duration),主频率 (F0). 重音(Accent) 就是指哪个音节发生重一点。 对于一个句子或者一个单词都有重音。 单词的重音一般都会标出来,英语语法里面有学过, 比如banana 这个单词, 第二个音节就是重音。 而对于句子而言,一样有的单词会重音,有的单词会发轻音。 一般有新内容的名词, 动词, 或者形容词会做重音处理。 比如下面的英语句子, surprise 就会被重音了, 而句子的重音点也会落到单词的重音上, 第二个音节rised, 就被重音啦。 英语的重音规则是一套英语语法,读者可以自行百度搜索。 I’m a little sur prised to hear it cha racterized as up beat . 边界 (Boundaries) 就是用来判断声调的边界的。 一般都是一个短语结束后,有个语调的边界。 比如下面的句子, For language, 就有一个边界, 而I 后面也是一个边界. For language, I , the author of the blog, like Chinese. 音长(Duration) 就是每个音节的发声长度。 这个通俗易懂。 NLP 里可以假定每个音节单词长度相同都是 100ms, 或者根据英语语法, 动词, 形容词之类的去确定。 也可以通过大量的数据集去寻找规律。 主频率 (F0 )就是声音的主频率。  应该说做傅里叶转换后, 值 (magnitude) 最大的那个。 也是人耳听到声音认定的频率。一个成年人的声音主频率在 100-300Hz 之间。 这个值可以用 线性回归来预测, 机器学习的方法预测也可以。一般会认为,人的声音频率是连续变化的,而且一个短语说完频率是下降趋势。 文本分析就介绍完了,这个方向比较偏语言学, 传统上是语言学家的研究方向,但是随着人工智能的兴起,这些feature 已经不用人为设计了,可以用端到端学习的方法来解决。 比如谷歌的文章 TACOTRON: TOWARDS END-TO-END SPEECH SYNTHESIS 就解救了我们。 这个部分就比较像我们算法工程师的工作内容了。 在未来的博客里, 会详细介绍如何用Wavenet 和WaveRNN 来实现这一步骤的。 今天这个博客就是简介一下算法。 这里说所谓的waveform synthesis 就是用这些 语言特征值(text features)去生成对应的声波,也就是生成前文所说的采样频率 和 振幅大小(对应的数字信号)。 这里面主要有两个算法。 串接合成(concatenative speech synthesis) : 这个方法呢, 就是把记录下来的音节拼在一起来组成一句话,在通过调整语音语调让它听起来自然些。 比较有名的有双音节拼接(Diphone Synthesis) 和单音节拼接(Unit Selection Synthesis)。这个方法比较繁琐, 需要对音节进行对齐(alignment), 调整音节的长短之类的。 参数合成 (Parametric Synthesis) : 这个方法呢, 需要的内存比较小,是通过统计的方法来生成对应的声音。 模型一般有隐马尔科夫模型 (HMM),还有最近提出的神经网络算法Wavenet, WaveRNN.  对于隐马尔科夫模型的算法, 一般都会生成梅尔频率倒谱系数 (MFCC),这个是声音的特征值。 感兴趣的可以参考这篇博客 去了解 MFCC。 对于神经网络的算法来说, 一般都是生成256 个 quantized values 基于softmax 的分类器, 对应 声音的 256 个量化值。 WaveRNN 和wavenet 就是用这种方法生成的。 下面是我学习语音合成的一些资料, 其中stanford cs224s 是强力推荐的,但是这个讲义讲的逻辑不是很清楚, 要反复看才会懂。 UCSB Digital Speech Processing Course 课程, 声音信号处理的基础。 建议读一遍, 链接如下,  Stanford CS224S WaveRNN,  音频的数字化,

语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 我整理了浅谈语音识别技术论文,欢迎阅读!

语音识别技术概述

作者:刘钰 马艳丽 董蓓蓓

摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的 发展 前景和应用。

关键词:语音识别;特征提取;模式匹配;模型训练

Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to developing prospect ion and application of the speech-identification technology are discussed in the last part.

Keywords:Speech identification;Character Pick-up;Mode matching;Model training

一、语音识别技术的理论基础

语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生 理学 、心理学、语言学、 计算 机 科学 以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行 自然 语言通信。

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。

(一) 语音识别单元的选取

选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。

音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而 英语 是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。

(二) 特征参数提取技术

语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。

线性预测(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。

Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。

也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。

(三)模式匹配及模型训练技术

模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元 网络 (ANN)。

DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集DHMM和CHMM特点)。一般来讲,在训练数据足够的,CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒性。

人工神经元 网络 在语音识别中的 应用是现在研究的又一 热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但ANN又不个有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。

二、语音识别的困难与对策

目前,语音识别方面的困难主要表现在:

(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。

(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓Lombard效应,必须寻找新的信号分析处理方法。

(三)语言学、生 理学 、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。

(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。

(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。

三、语音识别技术的前景和应用

语音识别技术 发展 到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方 经济 发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游 、银行信息,并且取得很好的结果。

语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

参考 文献 :

[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业 专栏.通讯世界,:(总l12期)

[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,

[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界, (总122期)

[4]陈尚勤等.近代语音识别.西安: 电子 科技大学出版社,1991

[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防 工业 出版社,2005

[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999

点击下页还有更多>>>浅谈语音识别技术论文

河南南阳方言研究论文

南阳方言,属河南方言小片数种方言中的一种,其或以形象,或以意会,皆不失字之原义者,如“诳语”曰“吹”,“视”曰“瞅”,“佯视以物”曰“晃”,“性急”曰“毛躁”,“初起”曰“开头”,“本来”曰“压根”,“讨厌”曰“膈意”,“脏”曰“埋迹”等,虽为俗语而实有意义可寻者,此为方言的一大特色。其第二大特色,乃为一音可变数字,如六、禄、陆、绿等,此等文字之读音与京音和普通话相去甚远,诸如此类,不可枚举。南阳为周秦之际经济文化重镇,秦统一了六国文字,实行“书同文”的政策,因而许多古音古字古词得以保留于民间至今。南阳又是华中与南楚相沟通之地,文人墨客云集,故而使得相当一部分古词汇在当地民间得以保留,方言中既有浓郁的荆楚风味,也有鲜活的儒学色彩,其生活用语、歇后语、民谣的幽默风趣以及所体现的远古文化的质朴,具有很高的学术价值和艺术价值。

南阳府衙大门前檐下柱子上挂有一联:看阶前草绿苔青无非生意听墙外鹃啼鹊噪恐有冤民大门两侧挂一联为:春雨无私进衙先拜清风二字青筠有节出府再留正气一身两幅对联悬挂在府衙门前,庄重了衙门,同时也文化了衙门。细究此两幅对联,不禁对古时官员们有一种钦佩。读此联即觉得那时的官员一身凛然正气。成语:父母官出自南阳。汉代曾出现了两个非常有政绩的地方官:西汉的召信臣、东汉的杜诗。据《后汉书》载杜诗为南阳太守,深受百姓爱戴,百姓将之与前代的召信臣相比,于是就有了“前有召父,后有杜母”之说,这时“父母”一词已经有了地方官的含义。宋初王禹偁《谪居感事》诗:“万家呼父母。”其自注:“民间呼令为父母官”,这便是将地方官比作父母官的最早出处。前有召父,后有杜母。于是,南阳府产生了一个人们常挂在嘴边的成语。细读这幅联:看阶前草绿苔青无非生意听墙外鹃啼鹊噪恐有冤民。可想象着,知府坐在衙内,看院里阶前草绿了,苔青了,甚至花红柳绿,猛然听见墙外面鹃啼鹊噪,猛然一惊,起身向堂外走去。因疑是冤民到来惊了鹃鹊鸟儿。故,前联用无非生意四字,给人以轻松之感,而后联四字则是恐有冤民,这四字很凝重,很深沉。而读第二联则让人对衙门冲满了庄重和敬畏,因为,它是正气和公理的象征。春雨无私进衙先拜清风二字,青筠有节出府再留正气一身。边无私的春雨进来,都要先拜清风,有节的青筠出得府去,都要带一身生气,何况官吏乎。(转摘)

相关百科
热门百科
首页
发表服务