thchs30跑过程中注意事项_thchs30错误总结-程序员宅基地

技术标签: kaldi thchs30  kaldi  

尽量使用最新的版本,之需要改下面的第一个问题,就可以全部跑通,新的版本中beam size 是6, 就不会有问题了。


按照github上的版本直接跑的过程中遇到两个问题: 
1. 在 make word graph的过程中字典正确的没有拷贝到本地: 
在 14.04 下面没有问题,在16.04 下面出现问题了。

  cat $thchs/resource/dict/lexicon.txt $thchs/data_thchs30/lm_word/lexicon.txt | grep -v '<s>' | grep -v '</s>' | sort -u > data/dict/lexicon.txt || exit 1;
  • 1

在16.04下面输出到文件里面是 (stand input),但是data/lang下面的文件都没有正确生成。 
但是在14.04 下面是没有问题的(亲测)。 
原因应该是 bash的版本不同导致的吧。 
解决方法就是: 
在grep 后面 加个 -a 就好了。

  1. 问题报如下错误: 
    错误作者回答: https://groups.google.com/forum/#!topic/kaldi-help/S06_dri-Kcg
WARNING (gmm-align-compiled:AlignUtteranceWrapper():decoder-wrappers.cc:466) Retrying utterance A02_000 with beam 40
WARNING (gmm-align-compiled:AlignUtteranceWrapper():decoder-wrappers.cc:475) Did not successfully decode file A02_000, len = 979
WARNING (gmm-align-compiled:AlignUtteranceWrapper():decoder-wrappers.cc:466) Retrying utterance A02_001 with beam 40
  • 1
  • 2
  • 3

具体原因:暂时不明,对对齐没有研究。

解决方法是: 
将 train_mono.sh 中 gmm-align-compiled scaleoptsbeam=scaleopts−−beam=beam –retry-beam=[[beam*4 
中的beam值设置的大点就好了,比如10, 50, 100 等。 
太大了对结果也会有影响。 
http://kaldi-asr.org/doc/faster-decoder_8h_source.html#l00033 中定义beam的时候有说明: 

46 opts->Register(“beam”, &beam, “Decoding beam. Larger->slower, more accurate.”);

参考文献:https://blog.csdn.net/u011280621/article/details/68947604

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Xwei1226/article/details/80239113

智能推荐

电脑自动重启的原因几处理方法_数据库量大电脑重启-程序员宅基地

文章浏览阅读2.4k次。一、软件☆1.病毒破坏自从有了计算机以后不久,计算机病毒也应运而生。当网络成为当今社会的信息大动脉后,病毒的传播更加方便,所以也时不时的干扰和破坏我们的正常工作。比较典型的就是前一段时间对全球计算机造成严重破坏的“冲击波”病毒,发作时还会提示系统将在60秒后自动启动。其实,早在DOS时代就有不少病毒能够自动重启你的计算机对于是否属于病毒破坏,我们可以使用最新版的杀毒软件进行杀毒,一般都会发现病毒存_数据库量大电脑重启

一个函数产生0/1的概率为 二分之一, 如何生成一个新函数使得产生0的概率为十分之三 产生1的概率为十分之七_已知一个函数f() 可以生成0或1,概率为1/2 让你实现一个函数生成1的概率为p-程序员宅基地

文章浏览阅读3.3k次。转自出处(1) 有一个函数fun能返回0和1两个值,返回0和1的概率都是1/2,问怎么利用这个函数得到另一个函数fun2,使fun2也只能返回0和1,且返回0的概率为0.3,返回1的概率为0.7。 分析: Nathan 16:42:59随机生成长度为4的01串0000~1111每个串出现的概率都为1/16Nathan 16:44_已知一个函数f() 可以生成0或1,概率为1/2 让你实现一个函数生成1的概率为p

今天开始程序员不用再发愁写commit message了,全部由CodeGeeX自动完成!_codegeex生成commit message-程序员宅基地

文章浏览阅读213次。当你在 IDE 中进行代码修改并准备提交时,在代码管理器中,点击CodeGeeX的图标。CodeGeeX会自动分析你的代码变更,并根据 Git Diff 信息生成建议的提交消息。还可以在设置中选择commit message的生成风格,确保了提交消息的一致性和规范性。它的使用方法非常简单,首先在你的VSCode插件市场中,搜索“CodeGeeX”智能编程助手,下载安装。CodeGeeX支持通过git diff信息,自动生成commit message,并成功提交。“这个功能真的是用了,就再也停不下来了!_codegeex生成commit message

python中默认的包安装路径为国外地址,直接安装出现报错,怎么切换成国内镜像网址(清华镜像、阿里云镜像以及中科大镜像)_中科大镜像源-程序员宅基地

文章浏览阅读571次,点赞8次,收藏7次。新手在python中安装包的时候常遇到安装镜像的网站地址问题,导致安装包失败。下面给大家介绍几个国内常用的镜像地址:一、清华镜像。二、中科大镜像。三、阿里云镜像_中科大镜像源

将hdfs文件加入hive分区表中_hdfs文件数据映射到hive 分区-程序员宅基地

文章浏览阅读2.3k次。先把文件放入hdfs,或用flume采集到hdfs,参看另一篇,再把hdfs文件加载到hive表中alter table ods_nshop.ods_01_releasedatas add partition (bdp_day='20191215') location 'hdfs://hadoop01:9000/data/nshop/ods/release/bdp_day=20191215'..._hdfs文件数据映射到hive 分区

skp、fbx、obj在线转gltf_fbx怎么转gltf-程序员宅基地

文章浏览阅读543次,点赞7次,收藏6次。支持skp,fbx,obj在线转换为轻量化格式gltf_fbx怎么转gltf

随便推点

华为Mate60和小米13参数对比 哪个值得买_小米13和华为mate60-程序员宅基地

文章浏览阅读964次。从CMOS的尺寸来看,它的这颗主摄和小米13差不多,同样都拥有1/1.56英寸的底,但华为凭借特别的RYYB特性和F1.4-F4.0可变光圈技术,它的主摄进光量要大于小米13,无论是夜间还是白天的拍照画质都有优势。终于回到小米13的主场了,它采用的是骁龙8Gen2处理器+LPDDR5X内存+UFS4.0存储的组合,从实测来看,它的性能表现在骁龙8Gen2手机中都算出色的那一类,大型游戏场景的帧率高,日常应用的流畅度也高,并且发热控制得较好,整体的性能感受非常好。小米13 更多使用感受和评价。_小米13和华为mate60

【BS学习】——B/S结构_b/s架构好学吗-程序员宅基地

文章浏览阅读5.3k次。未完待续_b/s架构好学吗

Linux驱动:网卡驱动分析之三--MAC驱动及PHY驱动框架了解_linux驱动 网卡mac通讯-程序员宅基地

文章浏览阅读3.4k次,点赞4次,收藏31次。1、前言在了解网卡驱动之前,推荐先看linux内核网络分层结构这篇文章,这里就摘取文章中的两张关于网络数据包的流程图(UDP示例),方便后面网络设备驱动程序的了解:数据结构说明:内核对网络数据包的处理都是基于sk_buff结构的,该结构是内核网络部分最重要的数据结构;对于网络设备驱动比较重要的一部分就是net_device结构体,在include/linux/netdevices.h中定义。(文章只是简单了解驱动框架,没有深入分析)2、MAC控制器驱动程序对于imx6ull的MAC控制_linux驱动 网卡mac通讯

编写程序,设计一个学生类Student和它的子类Undergraduate_设计一个学生类student和它的一个子类-程序员宅基地

文章浏览阅读7k次,点赞8次,收藏14次。编写程序,设计一个学生类Student和它的子类Undergraduate编写程序,设计一个学生类Student和它的子类Undergraduatepackage 一个题2020_3_31;/** * 学生类 * @author 马志勇 * @version V 1.0 * 许昌学院 * 互祝 互助 互注 *..._设计一个学生类student和它的一个子类

少儿Python每日一题(23):楼梯问题_python走楼梯一步三种走法问题-程序员宅基地

文章浏览阅读2.7k次。本次的题目如下所示:楼梯有n阶台阶,上楼可以一步上1阶,也可以一步上2阶,走完n阶台阶共有多少种不同的走法?输入格式:输入楼梯的阶梯数n输出格式:输出不同走法的个数输入样例:10输出样例:89这是一道非常经典的题目,我们可以先寻找一下上楼梯的规律。题目告诉了我们,一次可以上1阶,也可以上2阶。如果楼梯只有1阶,那很明显只有1种方法;如果楼梯有2阶,我们可以先跨1阶、再跨1阶,也可以直接跨2阶,有2种方法。当有3个台阶的时候,我们要么先上到第1阶,然后再上2阶;_python走楼梯一步三种走法问题

cut_part_xyzi-程序员宅基地

文章浏览阅读376次。xyzi#include <pcl/visualization/cloud_viewer.h>#include <iostream>//��׼C++���е�������������ͷ�ļ���#include <pcl/io/io.h>#include <pcl/io/pcd_io.h>//pcd ��д����ص�ͷ�ļ���#include <pcl/io/ply_io.h>#include <pcl/point_types

推荐文章

热门文章

相关标签