
語(yǔ)音識(shí)別培訓(xùn)
第一節(jié)
內(nèi)容:前世今生——語(yǔ)音識(shí)別的發(fā)展過(guò)程簡(jiǎn)介;
這一節(jié)將介紹語(yǔ)音識(shí)別技術(shù)自二十世紀(jì)五十年代誕生以來(lái)的簡(jiǎn)要發(fā)展歷史,按照核心技術(shù)的發(fā)展層次劃分為幾個(gè)時(shí)期,
簡(jiǎn)要介紹語(yǔ)音識(shí)別過(guò)程的主要組成部分,比如:語(yǔ)音信號(hào)預(yù)處理,聲學(xué)模型,語(yǔ)音模型,建模與評(píng)價(jià)方法等。
第二節(jié)
內(nèi)容:糧草先行——語(yǔ)音信號(hào)預(yù)處理;
這一節(jié)將介紹作為語(yǔ)音識(shí)別系統(tǒng)前端的信號(hào)預(yù)處理技術(shù),按照不同場(chǎng)景的分類,講述傳統(tǒng)的單通道、
多通道信號(hào)處理技術(shù),同時(shí)結(jié)合實(shí)例,說(shuō)明語(yǔ)音信號(hào)預(yù)處理在語(yǔ)音識(shí)別系統(tǒng)中的常用實(shí)現(xiàn)方法和重要作用。
這里的實(shí)例包括:語(yǔ)音識(shí)別云服務(wù),會(huì)議室麥克風(fēng)定位,智能手機(jī)和平板電腦上的麥克風(fēng)設(shè)置。
第三節(jié)
內(nèi)容:刀光劍影——聲學(xué)模型的建模與評(píng)價(jià)方法;
這一節(jié)將介紹語(yǔ)音識(shí)別系統(tǒng)中為核心的部分,即聲學(xué)模型的建模過(guò)程,簡(jiǎn)要介紹聲學(xué)模型建模方法的發(fā)展歷史,
重點(diǎn)分析目前主流的建模方法,適當(dāng)講解前沿的研究?jī)?nèi)容。
目前工業(yè)界主要采用的建模方法是GMM+HMM,其正在向DNN+HMM演進(jìn),
因此這里將以GMM+HMM的框架為主進(jìn)行講解,同時(shí)適當(dāng)介紹DNN+HMM的框架。可以安排工業(yè)界的實(shí)例,但是不安排講解具體的開(kāi)源工具代碼。
第四節(jié)
內(nèi)容:處變不驚——語(yǔ)言模型的建模與評(píng)價(jià)方法;
這一節(jié)介紹主流的語(yǔ)音模型的建模過(guò)程,不同于聲學(xué)模型的發(fā)展,語(yǔ)音模型相對(duì)固定,
這里只需要講解常用的語(yǔ)言模型工具即可,同時(shí)完整回顧從語(yǔ)音信號(hào)預(yù)處理到終識(shí)別結(jié)果的系統(tǒng)框架,語(yǔ)音識(shí)別系統(tǒng)性的介紹完成。
第五節(jié)
內(nèi)容:初放新英——語(yǔ)音識(shí)別前沿簡(jiǎn)介;