1.Turn-to-Diarize: Online Speaker Diarization Constrained by Transformer Transducer Speaker Turn Detection

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

簡評

google關於speaker diarization工作

2.Parameterized Channel Normalization for Far-field Deep Speaker Verification

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

簡評

ASRU2021關於speaker verification的工作

3.Visual Scene Graphs for Audio Source Separation

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

簡評

發表在ICCV2021上面的文章,基於視覺的聲源分離演算法

4.BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning for Automatic Speech Recognition

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

簡評

google結合自監督和半監督的最新結果,透過增加資料量和模型引數規模,在多個任務上面取得了SOTA的結果,並且探索了自監督在不同資料規模的效果

5.VoiceFixer: Toward General Speech Restoration with Neural Vocoder

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

簡評

位元組關於語音修復的工作,程式碼已開源

6.FastCorrect 2: Fast Error Correction on Multiple Candidates for Automatic Speech Recognition

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

簡評

微軟發表在Findings of EMNLP 2021上面的文章,關於ASR識別後處理糾錯演算法的改進工作。

7.Factorized Neural Transducer for Efficient Language Model Adaptation

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

簡評

微軟關於RNN-T文字領域遷移的改進

8.End-to-End Complex-Valued Multidilated Convolutional Neural Network for Joint Acoustic Echo Cancellation and Noise Suppression

作者摘要

本週值得關注的語音方向論文【2021005】

演算法結果

本週值得關注的語音方向論文【2021005】

本週值得關注的語音方向論文【2021005】

簡評

提交到ICASSP2021的工作