1.Turn-to-Diarize: Online Speaker Diarization Constrained by Transformer Transducer Speaker Turn Detection
作者摘要
演算法結果
簡評
google關於speaker diarization工作
2.Parameterized Channel Normalization for Far-field Deep Speaker Verification
作者摘要
演算法結果
簡評
ASRU2021關於speaker verification的工作
3.Visual Scene Graphs for Audio Source Separation
作者摘要
演算法結果
簡評
發表在ICCV2021上面的文章,基於視覺的聲源分離演算法
4.BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning for Automatic Speech Recognition
作者摘要
演算法結果
簡評
google結合自監督和半監督的最新結果,透過增加資料量和模型引數規模,在多個任務上面取得了SOTA的結果,並且探索了自監督在不同資料規模的效果
5.VoiceFixer: Toward General Speech Restoration with Neural Vocoder
作者摘要
演算法結果
簡評
位元組關於語音修復的工作,程式碼已開源
6.FastCorrect 2: Fast Error Correction on Multiple Candidates for Automatic Speech Recognition
作者摘要
演算法結果
簡評
微軟發表在Findings of EMNLP 2021上面的文章,關於ASR識別後處理糾錯演算法的改進工作。
7.Factorized Neural Transducer for Efficient Language Model Adaptation
作者摘要
演算法結果
簡評
微軟關於RNN-T文字領域遷移的改進
8.End-to-End Complex-Valued Multidilated Convolutional Neural Network for Joint Acoustic Echo Cancellation and Noise Suppression
作者摘要
演算法結果
簡評
提交到ICASSP2021的工作