kaldi

Kaldi的在线自然梯度方法的算法细节2020-08-31 09:01:25

在线自然梯度对于任意对称矩阵Σ，存在一个特征值分解（eigenvalue decomposition，EVD）：然后，输出将等于：对方差的低秩近似低秩近似也可表示为：定义：来自 <https://stats.stackexchange.com/questions/22501/is-there-an-intuit
Kaldi nnet3的导数单元测试理论依据2020-03-31 18:04:54

对参数进行扰动在Kaldi nnet3的以下单元测试代码中 nnet3/attention-test.cckaldi::nnet3::attention::TestAttentionForwardBackwardnnet3/convolution-test.cckaldi::nnet3::time_height_convolution::TestDataBackpropkaldi::nnet3::time_height_convolution::TestParamsBackpr
音频工具kaldi部署及模型制作调研学习2019-12-02 19:03:40

语音识别简介语音识别（speech recognition）技术，也被称为自动语音识别（英语：Automatic Speech Recognition, ASR）、计算机语音识别（英语：Computer Speech Recognition）或是语音转文本识别（英语：Speech To Text, STT），其目标是以计算机自动将人类的语音内容转换为相应的文字。按照不同纬度
sclite(SCTK)`make check` faliure,C / perl / Cygwin,安全使用Perl4的东西？2019-10-02 08:08:44

我目前正在尝试安装NIST的sclite,它是SCTK 2.4.0(github或newer version)的一部分.我正在尝试在bash中安装Cygwin.安装使用make完成. 我已经通过了make configure并完成了安装的所有部分.这并非没有一些努力(参见first上的SO帖子(文件未被识别)和second(模板/范围)问题).当我进入安
kaldi入门详解——nnet3实现tdnn2019-08-31 21:38:56

aishell/s5为例 sets.txt 这里在构建决策树，初始把所有音素，每个音素的每个状态作为一颗决策树，这里把i1，i2，i3，i4绑在一块，作为i，只建立一颗决策树。因此我们能看见，transition-states的个数大于pdfs的个数，就是因为i1，i2里有的pdf是相同的（有用同一个pdf，但是tid还是分开的） obj
基于WFST的语音识别解码器2019-06-23 23:02:43

学习语音识别有些时间了。老板要求我们基于Kaldi搭一个语音识别系统，在设备上通过MIC讲话，连着设备的PC的console上就能基本实时显示出讲话的内容。由于我们都是小白，刚开始可以要求低些，就用传统的GMM-HMM，能实现孤立词识别就算达标了，后面随着这方面能力的提高，再做更难一点的。任务下达
对Kaldi nnet3进行奇异值分解（SVD）以减小模型大小2019-06-21 11:47:52

用处基于SVD实现模型压缩以适配低功耗平台根据nnet3bin/nnet3-copy，nnet3-copy或nnet3-am-copy的"--edits-config"参数中，新支持了以下选项： apply-svd name=<name-pattern> bottleneck-dim=<dim> 查找所有名字与<name-pattern>匹配的组件，类型需要是AffineComponent或其子类。如
kaldi中各种代码缩写的意思2019-03-07 08:54:16

mic=ihm：基于独立耳机麦克风的各种语聊和模型 mic=sdm：基于单程麦克风的各种语聊和模型 mic=mdm：基于多程麦克风的各种语聊和模型 data_sp：表示数据集经过了速度变换（utils/data/perturb_data_dir_speed_3way.sh） data_hires：表示数据集经过了音量变换（utils/data/perturb_data_dir_volu

首页 < 1 2

ICode9

Kaldi的在线自然梯度方法的算法细节2020-08-31 09:01:25

Kaldi nnet3的导数单元测试理论依据2020-03-31 18:04:54

音频工具kaldi部署及模型制作调研学习2019-12-02 19:03:40

sclite(SCTK)`make check` faliure,C / perl / Cygwin,安全使用Perl4的东西？2019-10-02 08:08:44

kaldi入门详解——nnet3实现tdnn2019-08-31 21:38:56

基于WFST的语音识别解码器2019-06-23 23:02:43

对Kaldi nnet3进行奇异值分解（SVD）以减小模型大小2019-06-21 11:47:52

kaldi中各种代码缩写的意思2019-03-07 08:54:16