python用百度AI实现语音合成和语音识别(完美)
1、通过百度网盘下载ffmpeg,当然也可以去官网下载最新版。
pan.baidu.com/s/1UlqR246U9tLTqO6b82S_pw
密码: 53dh

2、解压之后,艳昆可以看到文件夹里面有一个铲辞bin文件夹。
把这个文件夹的绝对路径复制下来。


3、计算机右键找到属性—侧涛况—高级系统设置——环境变量——系统变量——Path——编辑,在变量值最后面加一个英文分号,再把bin文件夹的绝对路径粘贴上去,点确定退出。
这样,ffmpeg就安装完成了。

1、调用baidu-aip的语音合成功能,把一段文字合成成为一段wav格式的音频。
这段音频是可以播放的,读者可以下载试听。
pan.baidu.com/s/1hjV3gbCVOTxY9hALPk8bkQ
密码: 753j

2、可是,baidu-aip的语音识别功能却不能识别这段音频。
报错3301,理由是音频质量差。
呵呵。
原因嘛,很可能是语音合成的时候,经过了压缩处理。

1、这里,我们使用python来调用cmd命令:
b=os.popen(r"ffmpeg -y -i E:/mathebook/python/BaiduAI/a0.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 E:/mathebook/python/BaiduAI/c0.wav")
作用是,用ffmpeg把a0.wav转化为采样率为16000的c0.wav,不压缩。

2、然后用baidu-aip识别c0.wav,就可以识别出大部分内容。
下面分别是识别之后的文字,与合成之前的文字,对比一下,发现少了很多东西。

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:116
阅读量:156
阅读量:90
阅读量:66
阅读量:59