语音助手是怎么工作的
1、提取语音:
通过话筒,获取你所说的语音,声波信号转换成电压信号,或是电流信号。

2、电信号的滤波:
将电压信号或电流信号通过硬件电路,进行高频滤波或是带通滤波,去除直流信号,和相关的分语音信号的干扰(电路的本身干扰等);其中的滤波器,有硬件电路实现的,也有软件实现的,现在大部分滤波的实现都是采用软件的方式(将信号进行模数转换,将数字信号进行相关的数字滤波)。

3、语音信号的预处理:
滤掉非语音信号以后,把我们的语音信号进行相关的处理,这些的方法都是基于对人类语音和听觉研究所得到的,有很多比较好用的方法。常见方法有:语音预加权,语音分帧,语音加窗等方法。
这个阶段的主要工作,是将语音信号标准化,便于设置通用的语音系统。
注意:这里所说的信号处理与电信号滤波是不一样的,上面的2,是说将非语音信号滤掉,也就是说我们要到真实的语音信号(即使有噪声,只要它是语音我们都不能滤掉,所以2中的东西也是一个挑战)

4、总结:
本过程主要任务是,将纵波的声波转换成电信号,然后在再由模拟的信号转换成数字信号,再根据语音学科相关的原理将语音进行相关的标准化处理,和简单的辨别处理。
设计基础理论:电路理论,电子理论,信号处理,声学理论。
设计技术:电子技术,ad技术,滤波器的设置技术,编程。

1、什么是语音特征:
所谓特征就是能够,用最简单的方式,将一段语音与另一端语音区分开来。
举个例子吧,大家还记得高中学的在笛卡尔坐标系中表示的圆吧,如果我们要想将这个圆与另一个圆区分开,我们先想到的方法就是,把一个圆上所有的点与另一个圆上所有的点进行对比,如果完全一样就说明这本来是一个圆,如果不一样就说明这是两个不一样的圆,但是真的有必要要这样吗,曲线上的点是无数个,你要比多少年啊,其实我们都知道仅仅只看圆的两个量就可以区分了,即圆的半径和圆点坐标,这两个量就可以认为是圆的特征了。
其实,语音也是这样的,一段语音信号的数据量太大不便于我们处理,但是这么大大的数据量对于语音处理是冗余的,我们的一段完整语音信号就相当于一个圆(只不过这个圆使用它的所有的点来表示的,严格来说是无数个),但是要辨别一个语音与定一段语音就像一个圆与另一个圆的区别一样(我们不用那圆上的所有的点都相互对比,仅仅就像圆的半径与圆点坐标那样呢),这样我们就要去思考,我们能不能像用圆的半径和圆的坐标那样,找到一组简单的量来表达这段语音呢,这就是要找语音特征了。

2、 为什么要提取特征呢?
从语音特征的特点可以看出,他能用最少的数据来表示一段无限数据量的语音。对于人类当前的计算机,是无法计算无限的数据量问题的,所以,我们要提取语音的特征。

3、怎么提取语音特征呢?
这就涉及到声学的高深理论了,经过我们的声学大牛们的研究,得到很多表达语音特征的方法,常用的方法有,lpc的方法,lpcc,lsp的方法,mfcc的方法。
不多说了就是通过以上方法进行一堆复杂的计算得到的。相关计算可以去资讯相关专家。

4、总结:
该过程是对语音信号简化的过程。
设计基础理论:声学,哲学,数学等。

1、模型的作用
在语音识别系统中,每一个模型对应一个单词或是指令(就是被识别的东西),将我们得到的语音信号输入到模型中进行一堆复杂的计算,得到该语音对应哪个模型。
一句话,这家伙使用来表示单词或指令的,每一个单词或指令就一个模型。

2、怎么得到模型
一 般的方法就是得到一堆已经知道的语音单词(指令)对照表,输入到每一个模型中,对模型的参数进行设置,这样就得到这个可用来运算的模型。
就和我们解方程一样,比如ax+by=z,我们的得到模型就是求解a,b,我们的语音对应x,y,我们的单词或指令对应于z,我们现在有了好几组已知的,x,y,z的实际对应值,用这几组值来求解a,b的过程,就是求解模型的概念。
当然,我们的语音识别的模型就没有那么简单了。
一些题外话,这些东西都是数学的内容,看到了学习数学的用处了吧,越是高端的技术越是离不开数学的。
这里涉及到数学建模领域。

3、总结
总的来说,每一个模型就是对应一个指令或是单词。即使简化了这也不是一个小的数据量了。
设计基础学科:数学建模,数据分析
小编相对年轻人说的一句好:好好学习数学,别再荒废时间了。

1、主要任务
将我们的语音特征信号输入到所有的模型中,得到最有可能的一个模型,然后找到这个模型对应的单词或是指令。

1、希望你读完我的经验有所得。
