加急见刊

语音识别系统使用的声学模型

来源:华文易迅 时间:

语音识别是一门交叉学科。语音识别研究经历了50多年的研究过程,经过50多年的积累研究,取得了巨大的进展。特别是在过去的20年里,语音识别技术取得了显著的进展,并逐渐进入市场。在未来,语音识别技术将得到更广泛的应用。本文简要阐述了语音识别的发展和趋势。

语音技术的发展历史。

20世纪50年代,大多数研究人员致力于声学和语音学的基本概念。1952年,在AT&TBell实验室,实现了10个英文数字的语音识别系统,单个发音人孤立发音,主要用于测量每个数字的元音段的共振峰。1956年,RCAlab进行了另一项独立研究,试图识别10个不同音节的单个发音,也采用了测量共振峰的方法。1959年,英国UniversityCollege的研究人员开始尝试另一个想法,通过谱分析和模板匹配构建音素识别器,用于识别4个元音和9个辅音。20世纪60年代,语音识别的几个重要思想相继出现和发表。1962年,东京大学尝试实现另一个音素识别器的硬件。它使用零率方法分离语音信号的不同部分。1963年,日本NECLab尝试数字语音识别是最值得注意的工作,因为它不仅是NEC语音识别研究的开始,也导致了一个长期而有效的研究计划。20世纪60年代,三个研究项目的发展对未来20年的语音识别研究和发展产生了重大影响。第一个研究项目始于20世纪60年代末研究项目始于20世纪60年代末,旨在研究语音事件时间不均匀性的实际解决方案。在可靠检测语音事件开始和结束的基础上,开发了一套时间纠正的基本方法。

2.语音识别技术的发展现状。

通过全球科学家的共同努力,经过半个多世纪的研究,语音识别技术已经发展到接近实践的阶段。在实验室环境中,宽带语音信号的平均识别率可达90%以上。在正式获得如此高的识别率后,语音识别技术逐渐从实验室演示系统转向实用商品。以IBMViavoice和Dragondictation为代表的两个听写机系统的出现,使语音识别逐渐进入公众视野,引起了广泛的社会关注。

由于校对和纠正识别错误是非常麻烦和浪费时间,因此降低了语音识别的优势。同时,由于使用环境或口音习惯等因素的影响,语音识别的内容大大降低,识别的内容无法达到100%正确。因此,许多人认为目前的语音识别系统不能满足实际要求。

目前,AT&T和MIT将语音识别技术应用于电话自动转接、电话查询、数字串识别等一些有限词汇的特定任务中。当演讲内容存储在系统中,使用环境的声学特性与训练数据的声学特性差异不大时,语音识别的正确识别率可接近100%。然而,如果这些条件在实际使用中被破坏,将对识别系统产生一定的影响。

3.语音识别技术的发展趋势。

虽然过去20年语音识别有了很大的发展,但仍有许多不足需要进一步探索,可分为以下几个方面:

1)提高可靠性。语音识别技术需要能够消除各种声学环境因素的影响。在嘈杂的公共环境中,人们的意识会有意识地排除不必要的声学环境因素,这对语音识别系统来说是困难的。此外,在日常生活中,人类语言往往具有很大的不确定性、随机性和明显的语言习惯。这也会给语音识别系统带来很大的识别麻烦。目前,在提高语音系统在不同环境中的可靠性的同时,应用现代技术使语音识别系统更加智能化,掌握人们语言随机性的一些规律,以达到最佳的识别效果。

2)增加词汇量。系统能识别的词汇量是系统能做什么的重要测量。如果语音识别系统使用的声学模型和语音模型过于有限,当用户说的词汇超出系统已知范围时,语音识别系统无法准确识别相应的内容。例如,当它突然从中文变成英文、法语和俄语时,计算机经常输出混乱和奇怪的结果。然而,随着系统建模方法的不断改进、搜索算法效率的提高和硬件资源的发展,未来的语音识别系统可能会实现无限词汇和各种语言的混合,使用户无需在语言之间来回切换,从而大大降低词汇对语音识别系统的限制。

3)应用程序扩展。语音识别技术可以用来使大脑、费力、费时的机器操作成为一件非常容易和有趣的事情,例如,当人们忙碌,手和无知的场景,通过语音识别系统模型结构,可以在驾驶室、危险的工业场合、远程信息获取、家电控制等方面,语音识别技术可以推动一系列新的或更方便的功能设备,更方便人们的工作和生活。它的应用范围和前景都非常广泛。它不仅可以应用于日常生活,而且可以带来生产模式的革命,是下一代智能控制的基础。

4)降低成本,减少体积。微型化是语音识别技术商业应用的另一种重要途径,其推广程度取决于语音识别技术本身的进步,与微电子芯片技术的进一步发展密切相关。语音识别应用系统具有先进的功能和性能固化到更小的芯片或模块,可以大大降低产品成本和体积,产品必须受到消费者的青睐,语音识别系统和微电子芯片技术的发展将引领我们的信息技术革命达到一个新的水平。

21世纪是信息和网络的时代。网络上可以实现一系列人类活动,如自然口语对话、电子商务、信息索取、数字图书馆、语音翻译、远程教育等。语音识别系统的出现将使人们在任何地方、任何时间、任何事情上都能轻松地享受到更多的社会信息资源和现代服务。这必将成为语音识别技术研究和应用的重要发展趋势。

杂志推荐


常见问题

Q:论文发表的时候可以一稿多投吗?
A:一稿多投的行为是典型的学术不端的行为,是国内外学术界都明令禁止的行为,原因主要在于涉及到文章版权归属的问题,如果作者的文章已经被某个杂志社录用,或者同时被两家杂志社录用,就会涉及到版权纠纷,作为杂志社都会保护本社的合法权益,到这时作者就会比较麻烦,吃官司都是小事儿了,被打入黑名单降级降职影响可就太大了。
Q:职称论文发表对时间有限制吗?
A:职称论文发表并没有明确规定截止时间,需要作者结合自己所在地区的具体规定自己安排发表时间,一般职称评审,各地区都会明确规定申报材料的最后期限和截止日期,我们结合这个日期来考虑何时发表文章就可以,大部分地区职称评审都集中在每年的8-10月之间,有的地区要求7月中旬开始交材料,最晚8月底之前,有的则是要求8月中旬交,还有部分地区要求截止时间为申报时间上年的12月31日,所以,各个地区的具体要求并不同,申报者需要在提交材料前确保自己的文章已经见刊并且被相应的数据库检索即可。
Q:网上发表论文如何防骗?可靠网站与可疑网站如何区分?
A:由于发表论文的需求远远多于杂志版面的供应,再加上众所周知的审稿难!审稿慢!选择论文发表网站发表表论文确实能解决以上问题。卖方市场的出现加之发表论文的刚性需求,就导致出现先付款后发表的现状。论文发表网站正规与否是通过网站从始至终所提供服务体现出来的,任何交易只要存在时间差都会有风险,但这个风险是可以通过您的智慧来避免的。因为不是所有论文网站都是骗子,你要做的就是过滤掉没保障的网站,选择可靠的论文发表网站!
Q:一般期刊需要提前多久准备?
A:省级、国家级期刊建议至少提前6个月准备。一般来讲,杂志社为了确保每期杂志正常出刊,都会提前将当期之后1-3个月的稿件提前安排好,而一些创刊较早,认可度更高的热门期刊,来稿量较大,发表周期可能就会更久。提前准备,意味着杂志的可选择性更多。
Q:核心期刊需要提前多久准备?
A:核心期刊建议至少提前12个月准备,核心期刊正常的审稿周期为1-3个月,且审核严格,退稿、返修几率更大,这意味着在流程上耗费的时间更久,且核心期刊版面有限,投稿竞争更加激烈,即使被录用,排刊也比普通期刊晚很多,因此需要更早准备。