PaddleSpeech是百度人工智能框架下的一个文本语音操作应用,具备工业级的文本与语音空间操作包括但不限于文本转语音,语音转文本,语音复制,声纹提取等功能。paddlespeech整体安装相对有些复杂,特别是机遇linux下安装,这里先以windows下通过cuda+python进行体验式安装过程。
准备环境(window10,没装git的需要先安装git环境)
1.python10
2.C++编译环境
3.cuda 11.7
4.cudnn 8.6
5.paddlepaddle-gpu 2.4.2.post117
6.paddlespeech 1.4.0
一. python10安装
这个安装很简单,直接上官网下载window版本的安装器傻瓜式next安装即可,官网地址:https://www.python.org/downloads/windows/
(python环境最好是通过ancoda进行管理起来,否则很容易混乱,通过ancoda进行python环境隔离不会影响其他环境)
二.C++编译环境安装
对于 Windows 系统,需要安装 Visual Studio 来完成 C++ 编译环境的安装。
https://visualstudio.microsoft.com/visual-cpp-build-tools/
三.cuda 和cudnn安装
英伟达显卡驱动以及神经网络加速包安装
cuda这里根据驱动版本进行选择安装,本机电脑使用cuda11.7
下载地址:https://developer.nvidia.com/cuda-toolkit-archive