ICode9

精准搜索请尝试: 精确搜索
  • Kaldi的在线自然梯度方法的算法细节2020-08-31 09:01:25

    在线自然梯度    对于任意对称矩阵Σ,存在一个特征值分解(eigenvalue decomposition,EVD):    然后,输出将等于:   对方差的低秩近似低秩近似   也可表示为:      定义:   来自 <https://stats.stackexchange.com/questions/22501/is-there-an-intuit

  • Kaldi nnet3的导数单元测试理论依据2020-03-31 18:04:54

    对参数进行扰动在Kaldi nnet3的以下单元测试代码中 nnet3/attention-test.cckaldi::nnet3::attention::TestAttentionForwardBackwardnnet3/convolution-test.cckaldi::nnet3::time_height_convolution::TestDataBackpropkaldi::nnet3::time_height_convolution::TestParamsBackpr

  • 音频工具kaldi部署及模型制作调研学习2019-12-02 19:03:40

      语音识别简介 语音识别(speech recognition)技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR)、计算机语音识别(英语:Computer Speech Recognition)或是语音转文本识别(英语:Speech To Text, STT),其目标是以计算机自动将人类的语音内容转换为相应的文字。 按照不同纬度

  • sclite(SCTK)`make check` faliure,C / perl / Cygwin,安全使用Perl4的东西?2019-10-02 08:08:44

    我目前正在尝试安装NIST的sclite,它是SCTK 2.4.0(github或newer version)的一部分.我正在尝试在bash中安装Cygwin.安装使用make完成. 我已经通过了make configure并完成了安装的所有部分.这并非没有一些努力(参见first上的SO帖子(文件未被识别)和second(模板/范围)问题).当我进入安

  • kaldi入门详解——nnet3实现tdnn2019-08-31 21:38:56

    aishell/s5为例 sets.txt 这里在构建决策树,初始把所有音素,每个音素的每个状态作为一颗决策树,这里把i1,i2,i3,i4绑在一块,作为i,只建立一颗决策树。 因此我们能看见 ,transition-states的个数大于pdfs的个数,就是因为i1,i2里有的pdf是相同的(有用同一个pdf,但是tid还是分开的) obj

  • 基于WFST的语音识别解码器2019-06-23 23:02:43

    学习语音识别有些时间了。老板要求我们基于Kaldi搭一个语音识别系统,在设备上通过MIC讲话,连着设备的PC的console上就能基本实时显示出讲话的内容。由于我们都是小白,刚开始可以要求低些,就用传统的GMM-HMM,能实现孤立词识别就算达标了,后面随着这方面能力的提高,再做更难一点的。任务下达

  • 对Kaldi nnet3进行奇异值分解(SVD)以减小模型大小2019-06-21 11:47:52

    用处基于SVD实现模型压缩以适配低功耗平台   根据nnet3bin/nnet3-copy,nnet3-copy或nnet3-am-copy的"--edits-config"参数中,新支持了以下选项: apply-svd name=<name-pattern> bottleneck-dim=<dim> 查找所有名字与<name-pattern>匹配的组件,类型需要是AffineComponent或其子类。如

  • kaldi中各种代码缩写的意思2019-03-07 08:54:16

    mic=ihm:基于独立耳机麦克风的各种语聊和模型 mic=sdm:基于单程麦克风的各种语聊和模型 mic=mdm:基于多程麦克风的各种语聊和模型 data_sp:表示数据集经过了速度变换(utils/data/perturb_data_dir_speed_3way.sh) data_hires:表示数据集经过了音量变换(utils/data/perturb_data_dir_volu

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有