kaldi

python使用vosk进行中文语音识别2022-05-21 01:32:39

操作系统：Windows10 Python版本：3.9.2 vosk是一个离线开源语音识别工具，它可以识别16种语言，包括中文。这里记录下使用vosk进行中文识别的过程，以便后续查阅。 vosk地址：https://alphacephei.com/vosk/ 使用vosk-server进行语音识别使用docker启动vosk服务 1、获取vosk [root@hos
kaldi工具搭建语音识别系统——数据处理2022-04-29 01:32:11

Kaldi（http://kaldi-asr.org/doc/）是一个语音识别工具。使用 C++ 开发，基于 Apache 许可证。目的是为语音识别研究者提供。 Kaldi 的目标和受众范围与 HTK 相似。目标是用 C++ 编写的现代灵活的代码，易于修改和扩展。重要功能包括：与有限状态传感器（FST）的代码级集成根据 OpenFst 工
https://blog.csdn.net/u011930705/article/details/85340905 【kaldi】【kaldi】声纹识别之X-vector声纹识别之X-vector2022-04-09 12:00:35

一．搞了几天，首先说一下X-vector的优势： 1.训练速度非常快 2.无需特定语种的训练集，由于设置一个embedding层进行提取特征直接进行plda打分 3.识别率不错二．Kaldi中有现成的例子，可供研究 https://github.com/kaldi-asr/kaldi/tree/master/egs/sre16/v2 https://github.com/kaldi-asr/k
kaldi代码编译2022-01-20 22:04:45

1. kaldi源码编译 1.1 源码下载：git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden 1.2
kaldi Gstreamer worker 运行时报错处理2021-12-19 19:02:01

INTEL MKL ERROR: /opt/intel/mkl/lib/intel64/libmkl_avx2.so: undefined symbol: mkl_sparse_optimize_bsr_trsm_i8. Intel MKL FATAL ERROR: Cannot load libmkl_avx2.so or libmkl_def.so. 在命令行输入 export LD_PRELOAD=~/anaconda3/lib/libmkl_core.so:~/anaconda3/l
kaldi新手入门及语音识别的流程(标贝科技)2021-12-06 10:32:16

kaldi新手入门及语音识别的流程(标贝科技) 欢迎体验标贝语音开放平台地址：https://ai.data-baker.com/#/?source=qaz123 （注：填写邀请码hi25d7，每日免费调用量还可以翻倍）一、kaldi kaldi简介 Kaldi是当前最流行的开源的语音识别工具包，旨在提供灵活且可扩展的组
在mac上使用docker进行Kaldi编译2021-07-23 10:03:35

Kaldi -1 安装篇上次做ontonotes时租的服务器到期了。但我还是需要整一个好用的环境。我用的是mac，所以下载了docker desktop配置一下ubuntu16.04环境，不然在mac上安装dependencies的时候就开始疯狂报错了。过程大体仿照这篇博文的顺序。 docker ps #找到container ID docke
将加入小米，语音识别大牛、Kaldi之父Daniel Povey宣布年底前来中国工作2021-04-08 16:57:05

昨天，国际语音识别大牛、前约翰霍普金斯大学（Jonhs Hopkins University）教授、语音识别开源工具 Kaldi 之父 Daniel Povey 在 Twitter 上表示，他将很快与小米签订一项工作协议，工作地点位于北京。此外，他还表示自己将于 2019 年底之前前往北京工作，且会招聘一个小团队打造新一代的「PyTor
如何入手Kaldi和语音识别2021-04-07 10:59:58

如何入手Kaldi和语音识别什么是KaldiKaldi的三个部分预处理和特征提取模型训练过程什么是Kaldi Kaldi是一个用于处理语音数据的开源工具包。它已用于语音相关应用程序中，主要用于语音识别，但也用于其他任务，例如说话人识别和说话人区分。该工具包已有大约7年历史，但仍在
Kaldi简介2021-04-03 18:35:25

Kaldi是当前最流行的开源语音识别工具(Toolkit)，它使用WFST来实现解码算法。Kaldi的主要代码是C++编写，在此之上使用bash和python脚本做了一些工具. 语音识别，大体可分为“传统”识别方式与“端到端”识别方式，其主要差异就体现在声学模型上。 “传统”方式的声学模型一般采用
kaldi简介2021-04-03 18:33:52

一方面更加增加自己C++的基本功，另一方面也可以让自己慢慢走入语音识别的大门。首先我决定从kaldi的官网入手，不多说进入主题。 kaldi是什么kaldi是使用c++写的语音识别的工具，apache 授予了v2.0的证书（果真应验，apache旗下无弱将）。kaldi旨在供语音识别研究员使用。 kaldi的命
【语音识别】Kaldi学习之数据整理（1）2021-03-30 00:00:12

数据整理 1. 数据分集1.1 Librispeech示例的数据处理过程1.2 数据下载和解压在使用语音识别工具训练声学模型时，需要面临的两个问题：如何选择训练数据如何将数据整理成工具可以支持的格式。本文介绍如何构建符合Kaldi脚本规范的数据资源文件，包括数据文件夹data和语言
Kaldi安装+编译+egs/yesno脚本运行2021-03-29 19:58:28

文章目录源码下载安装依赖及工具编译kaldi代码egs/yesno脚本运行结束语 kaldi，我就不做过多介绍了，源码在github上，官方教程网址是 http://kaldi-asr.org/doc/index.html。源码下载我的操作系统是Linux。下载直接利用git版本控制系统就可以了,打开终端，直接在你的实验
kaldi例子thchs30笔记（二）2021-03-11 13:30:07

数据准备由于我们已经下载过数据了，直接进行数据准备。根据注释，我们知道，数据准备就是要产生四个文件分别是text，wav.scp，utt2spk，spk2utt (1)text:音频标注 (2)wav.scp:指定音频路径 (3)utt2spk:音频对应的说话人信息 (4)spk2utt:说话人对应的音频信息打开s5/local/thchs-30_da
AIBigKaldi（十五）| Kaldi的说话人自适应模型（源码解析）2021-02-15 13:58:13

本文来自公众号“AI大道理”。单音素模型词错误率为50.58%，三音子模型词错误率为36.03%，lda-mllt模型词错误率为32.12%。可见lda-mllt模型识别率继续有了一定的提高。能否继续优化模型？又要从哪些方面入手进行优化呢？说话人自适应技术将继续改善现有模型。以kaldi的th
AIBigKaldi（十）| Kaldi的thchs30实例（源码解析）2021-01-08 23:02:29

本文来自公众号“AI大道理”。单音子模型的假设是一个音素的实际发音与其左右的音素无关。这个假设与实际并不符合。由于单音子模型过于简单，识别结果不能达到最好，因此需要继续优化升级。就此引入多音子的模型。最为熟悉的就是三音子模型，即上下文相关的声学模型。在Ye
AIBigKaldi（九）| Kaldi的解码搜索（源码解析）2020-12-29 10:00:35

本文来自公众号“AI大道理”。构建了HCLG解码图后，解码就是在这个图上寻找一条最优路径。最优路径上去除epsilon后的输出标签序列就是单词级别的识别结果。（本篇主要解析kaldi源码实现，详细算法原理请阅读： AI大语音（十一）——WFST解码器（上）（深度解析）） 1 解码 5 decode.sh
Kaldi(A5)语言模型及HCLG.fst生成2020-12-26 20:58:13

这节介绍一下如何修改生成适合自己场景的语言模型。 Ref Online decoding in Kaldi(Nnet2) http://kaldi-asr.org/doc/online_decoding.html 修改语言模型首先，我们为什么要修改语言模型？虽然已有现成的Fisher_English或者Librispeech的HCLG.fst，但是他们用到的是3-gram，也就是说上
AIBigKaldi（六）| Kaldi的单音子模型训练（下）2020-12-20 23:00:36

本文来自公众号“AI大道理”。构造好训练图接下来就可以进行训练了。所谓训练就是在训练图上进行解码，获得最优路径的同时得到对齐序列，根据对齐序列进行统计信息量。转移概率可以进行数数获得，GMM参数随着对齐的帧数变化而更新，同时GMM分量从一开始的单高斯split出更多的高
OfficialKaldi（十四）| 从命令行角度来看Kaldi的 I / O2020-12-11 11:05:18

此页面从命令行工具用户的角度描述了Kaldi中的I / O机制。有关更多代码级概述，请参见Kaldi I / O机制。总览非表I / O 我们首先描述“非表” I / O。这是指仅包含一个或两个对象的文件或流（例如，声学模型文件；转换矩阵），而不是由字符串索引的对象的集合。 Kaldi文件格式默认为二进制
OfficialKaldi（四）| 法律相关（翻译注解）2020-12-03 09:35:47

这不是法律文件；请参阅发行版中的COPYING文件。在此页面中，我们解释法律内容的含义（据我们所知）。 Kaldi中的代码和其他内容（例如脚本，文档）是根据Apache许可版本2.0发布的。Apache许可证是一种流行的“类似于BSD”的许可证。这意味着您可以免费使用Kaldi并重新分发它，甚至用于商业目的，尽
OfficialKaldi（一）| 关于Kaldi项目（翻译注解）2020-12-02 23:57:27

什么是Kaldi？ Kaldi是使用C ++编写的语音识别工具包，并根据Apache License v2.0获得许可。Kaldi供语音识别研究人员使用。有关更详细的历史记录和贡献者列表，请参见Kaldi项目的历史记录。卡尔迪（Kaldi）这个名字根据传说，卡尔迪是埃塞俄比亚的牧羊人，发现了咖啡植物。 Kaldi
Kaldi语音识别学习记录-----编译安装2020-12-01 16:32:13

语音识别领域的开源框架有CMUSphinx、HTK、Kaldi等等，而目前仍然比较活跃，且工程价值较高的就数Kaldi，很多从事语音方面的公司，都使用该框架训练自己的语音识别能力，由于其内部代码逻辑较为复杂，故这里一步一步来解读，了解语音识别的内部原理，并期望自定义，实现业务场景下的语音识别、语
Kaldi：加权有限状态转换器 WFST2020-11-29 20:59:07

补充前几天的中文分词对一本小说进行分词 import jieba from zhon.hanzi import punctuation file = open('b.txt', 'r', encoding='utf-8') data=file.read() data = jieba.cut(data) string = re.sub(r"[%s]+" %punctuation, "",data) fW =
Kaldi的自然梯度理论基础2020-08-31 09:01:51

简介随机梯度下降一般梯度（最陡下降方向）当参数面具有隐含的特定结构时，最陡的方向并非一般梯度，而是自然梯度。在欧几里得正交空间中，G是单位矩阵I。自然梯度自然梯度表示延着雷曼（Riemannian）参数面的梯度迈出一步，这相当于在常规参数空间的一条弯曲路径，并且很难计算。

1 2 > 尾页

ICode9

python使用vosk进行中文语音识别2022-05-21 01:32:39

kaldi工具搭建语音识别系统——数据处理2022-04-29 01:32:11

https://blog.csdn.net/u011930705/article/details/85340905 【kaldi】【kaldi】声纹识别之X-vector声纹识别之X-vector2022-04-09 12:00:35

kaldi代码编译2022-01-20 22:04:45

kaldi Gstreamer worker 运行时报错处理2021-12-19 19:02:01

kaldi新手入门及语音识别的流程(标贝科技)2021-12-06 10:32:16

在mac上使用docker进行Kaldi编译2021-07-23 10:03:35

将加入小米，语音识别大牛、Kaldi之父Daniel Povey宣布年底前来中国工作2021-04-08 16:57:05

如何入手Kaldi和语音识别2021-04-07 10:59:58

Kaldi简介2021-04-03 18:35:25

kaldi简介2021-04-03 18:33:52

【语音识别】Kaldi学习之数据整理（1）2021-03-30 00:00:12

Kaldi安装+编译+egs/yesno脚本运行2021-03-29 19:58:28

kaldi例子thchs30笔记（二）2021-03-11 13:30:07

AIBigKaldi（十五）| Kaldi的说话人自适应模型（源码解析）2021-02-15 13:58:13

AIBigKaldi（十）| Kaldi的thchs30实例（源码解析）2021-01-08 23:02:29

AIBigKaldi（九）| Kaldi的解码搜索（源码解析）2020-12-29 10:00:35

Kaldi(A5)语言模型及HCLG.fst生成2020-12-26 20:58:13

AIBigKaldi（六）| Kaldi的单音子模型训练（下）2020-12-20 23:00:36

OfficialKaldi（十四）| 从命令行角度来看Kaldi的 I / O2020-12-11 11:05:18

OfficialKaldi（四）| 法律相关（翻译注解）2020-12-03 09:35:47

OfficialKaldi（一）| 关于Kaldi项目（翻译注解）2020-12-02 23:57:27

Kaldi语音识别学习记录-----编译安装2020-12-01 16:32:13

Kaldi：加权有限状态转换器 WFST2020-11-29 20:59:07

Kaldi的自然梯度理论基础2020-08-31 09:01:51