ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Kaldi安装+编译+egs/yesno脚本运行

2021-03-29 19:58:28  阅读:297  来源: 互联网

标签:脚本 yesno egs Kaldi kaldi 安装 目录


文章目录


kaldi,我就不做过多介绍了,源码在github上,官方教程网址是 http://kaldi-asr.org/doc/index.html

源码下载

我的操作系统是Linux。
下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下的命令行输入命令:

git clone https://github.com/kaldi-asr/kaldi.git

稍等一会,提示OK后,能够看到以下文件:
在这里插入图片描述

  • egs :此目录为 Kaldi 例子目录,其中例子包含了不乏语音识别、语种识别、声纹识别、关键字识别等。
  • misc : 此目录包含了一些 pdf、以及相关 docker、htk 等资源
  • scripts: 此目录只用来存放 Rnnlm,以及相应的运行脚本。
  • src : 此目录为 Kaldi 的源代码目录,Kaldi 的多数算法的源代码都存放于此,其中不乏GMM、Ivector、Nnet等一系列的算法。
  • tools: 此目录主要存放 Kaldi 依赖库的安装脚本
  • windows: 此目录为在 Windows 平台运行所必须的脚本以及相关的执行程序。

安装依赖及工具

在kaldi文件夹下可以检查依赖库是否已经安装。
运行指令:tools/extras/check_dependencies.sh,会提示没有安装的包,根据脚本输出的提示安装对应包即可。

如果全部安装完成,会显示如下:
在这里插入图片描述

关于第三方工具,这里主要介绍必须安装的两个工具:OpenFst及CUB,具体作用就不介绍了。对应命令是在tools文件夹下,命令行依次运行指令

make openfst
make cub

第三方包还有很多,其它基本类似。等待安装成功即可。

编译kaldi代码

这是必要步骤,不要漏这一步。
编译环境kaldi使用configure命令来配置,在src目录下配置即可。
配置完成后分别运行:

make depend
make

大约要几十分钟吧。可以用-j 4作为make的参数,使用多线程加速编译。
编译完成后就可以运行其中的egs目录下的例子了。

egs/yesno脚本运行

yesno脚本是一个最简单的语音识别脚本,只能识别Yes和No(当然还有沉默)。进入对应文件夹,命令行使用./run.sh。如果前面步骤没有出错,很快就会有最后结果。
运行结果如下:
在这里插入图片描述

最后一行输出表示,232个测试样例全部判断准确。
最后的识别结果输出在exp/mono0a/decode_test_yesn,打开文件看看即可。
在这里插入图片描述

以上就是本次分享的Kaldi的helloworld步骤了。

结束语

跑通一个简单的样例后,就是对源码的阅读、探索、整理了。
希望本文能对Kaldi的新手有帮助。

标签:脚本,yesno,egs,Kaldi,kaldi,安装,目录
来源: https://blog.csdn.net/Xixo0628/article/details/115308838

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有