社会语言学(sociolinguistics)是一门语言学的分支学科,研究社会的各层面对语言运用的影响,包含文化准则、社会规范或情境.
有人亦把后设语言学(metalinguistics,亦作“元语言学”)归类为社会语言学的一部分.
研究范围社会语言学研究的是语言的社会本质和差别,以及他们的社会因素.在传统的语言地理学中也有相同的研究,但是自社会语言学出现以后,这些内容都算做社会语言学的范畴了.
对社会本质的研究包括:
* 语言的社会本质的特点及其规律
* 语言、意识、社会在起源上的相互关系
* 民族语言和民族形成的关系
* 民族共同语的形成与社会发展的关系
* 语言演变与社会演变的关系
对语言差异的研究包括:
* 标准语与方言、行话的差异o 发音差异o 用词差异o 地位差异* 同一语言在不同国家、地区以及社会所产生的差异
o 例如:英语在不同国家或地区的传播中产生了变异,出现了美式英语、港式英语、新加坡式英语等
* 同一国家或社会中通行几种语言所造成的差异
o 例如:有两种或两种以上官方语言的国家或地区,如加拿大(英语、法语)、新加坡(英语、中文、马来语)
* 不同的语言使用者在语言运用上的差异
o 例如:性别差异导致男女使用有差异的语言.
* 社会场所不同所使用的语言的差异
o 例如:一般中国人在家庭环境中使用家乡方言,在工作学习时用普通话.
研究方法调查研究法对各地区、各行业、各阶层等人的语言运用进行考察.数学分析法对口语材料和文献资料进行数学统计和数理分析.对比研究法分析社会因素、研究语言差异.实验分析法用语音或心理实验仪器对语言差异进行实验分析,并作出定量和定性的描述.
语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
特定人语音识别的方法 目前,常用的说话人识别方法有模板匹配法、统计建模法、联接主义法(即人工神经网络实现)。考虑到数据量、实时性以及识别率的问题,笔者采用基于矢量量化和隐马尔可夫模型(HMM)相结合的方法。
说话人识别的系统主要由语音特征矢量提取单元(前端处理)、训练单元、识别单元和后处理单元组成,其系统构成如图1所示。 由上图也可以看出,每个司机在购买车后必须将自己的语音输入系统,也就是训练过程,当然最好是在安静、次数达到一定的数目。
从此在以后驾驶过程中就可以利用这个系统了。 所谓预处理是指对语音信号的特殊处理:预加重,分帧处理。
预加重的目的是提升高频部分,使信号的频谱变得平坦,以便于进行频谱分析或声道参数分析。用具有 6dB/倍频程的提升高频特性的预加重数字滤波器实现。
虽然语音信号是非平稳时变的,但是可以认为是局部短时平稳。故语音信号分析常分段或分帧来处理。
历史 早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的"Radio Rex"玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。
最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。
该系统得到了98%的正确率。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。
1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码Linear Predictive Coding (LPC), 及动态时间弯折Dynamic Time Warp技术。
语音识别技术的最重大突破是隐含马尔科夫模型Hidden Markov Model的应用。从Baum提出相关数学推理,经过Labiner等人的研究,卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。
[3]。此后严格来说语音识别技术并没有脱离HMM框架。
尽管多年来研究人员一直尝试将“听写机”推广,语音识别技术在目前还无法支持无限领域,无限说话人的听写机应用。 模型 目前,主流的大词汇量语音识别系统多采用统计模式识别技术。
典型的基于统计模式识别方法的 语音识别系统由以下几个基本模块所构成 信号处理及特征提取模块。该模块的主要任务是从输入信号中提取特征,供声学模型处理。
同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。 统计声学模型。
典型系统多采用基于一阶隐马尔科夫模型进行建模。 发音词典。
发音词典包含系统所能处理的词汇集及其发音。发音词典实际提供了声学模型建模单元与语言模型建模单元间的映射。
语言模型。语言模型对系统所针对的语言进行建模。
理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。 解码器。
解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。 从数学角度可以更加清楚的了解上述模块之间的关系。
首先,统计语音识别的最基本问题是,给定输入信号或特征序列,符号集(词典),求解符号串使得: W = argmaxP(W | O) 通过贝叶斯公式,上式可以改写为 由于对于确定的输入串O,P(O)是确定的,因此省略它并不会影响上式的最终结果,因此,一般来说语音识别所讨论的问题可以用下面的公式来表示,可以将它称为语音识别的基本公式。 W = argmaxP(O | W)P(W) 从这个角度来看,信号处理模块提供了对输入信号的预处理,也就是说,提供了从采集的语音信号(记为S)到 特征序列O的映射。
而声学模型本身定义了一些更具推广性的声学建模单元,并且提供了在给定输入特征下,估计P(O | uk)的方法。 为了将声学模型建模单元串映射到符号集,就需要发音词典发挥作用。
它实际上定义了映射的映射。为了表示方便,也可以定义一个由到U的全集的笛卡尔积,而发音词典则是这个笛卡尔积的一个子集。
并且有: 最后,语言模型则提供了P(W)。这样,基本公式就可以更加具体的写成: 对于解码器来所,就是要在由,,ui以及时间标度t张成的搜索空间中,找到上式所指明的W。
语音识别是一门交叉学科,。
历史比较语言学在西方具有悠久的历史,在现代语言学确立之前,语言研究主要是历史比较语言学方面的研究,其研究内容也以语音研究为主。目前,汉语的语音史研究也逐渐开始使用历史比较语言学的研究方法,同时还要考虑语言接触的问题。
你在提问中指出“根据方言的差异来考察语音的历史演变”,既然是方言差异,就不可能“以一种方言为例”,所以,“以一种方言为例,说明如何根据方言的差异来考察语音的历史演变”是无法实现的。现在学界的研究方法,不但要比较多种方言的语音,还要参考日语、朝鲜语、越南语中汉语借词的发音,在研究上古音的时候,还要分析汉字中的形声字的读音。也就是说,单纯地比较方言语音并不能有效地考察语音的历史演变。
就具体的操作方法来说,主要是考察方言间语音的对应关系,而不是语音的相似性。利用语音对应关系、语音发音的生理特点以及其他语言中的相类似的语音现象,可以挖掘出语音演变的脉络。
你指的是TCL C10的方言识别技术吧!这款电视的语音助手小T目前支持普通话、四川话、广东话、东北话、河南话、陕西话6种方言的识别,并且识别能力还挺精准的,拾音效果也不错。我也是看准了这点,才给我爸妈买的,这样他们就不用说着别扭的塑料普通话来语音控制了,直接可以说广东话。话说,我爸平常动不动就喜欢调戏小T,估计真的是猴钟意小T啊。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
蜀ICP备2020033479号-4 Copyright © 2016 学习鸟. 页面生成时间:2.733秒