演算法簡評摘要結果作者

本週值得關注的語音方向論文【2021005】

由 xmdxcsj 發表于娛樂2021-10-12

1.Turn-to-Diarize: Online Speaker Diarization Constrained by Transformer Transducer Speaker Turn Detection

作者摘要

演算法結果

簡評

google關於speaker diarization工作

2.Parameterized Channel Normalization for Far-field Deep Speaker Verification

作者摘要

演算法結果

簡評

ASRU2021關於speaker verification的工作

3.Visual Scene Graphs for Audio Source Separation

作者摘要

演算法結果

簡評

發表在ICCV2021上面的文章，基於視覺的聲源分離演算法

4.BigSSL: Exploring the Frontier of Large-Scale Semi-Supervised Learning for Automatic Speech Recognition

作者摘要

演算法結果

簡評

google結合自監督和半監督的最新結果，透過增加資料量和模型引數規模，在多個任務上面取得了SOTA的結果，並且探索了自監督在不同資料規模的效果

5.VoiceFixer: Toward General Speech Restoration with Neural Vocoder

作者摘要

演算法結果

簡評

位元組關於語音修復的工作，程式碼已開源

6.FastCorrect 2: Fast Error Correction on Multiple Candidates for Automatic Speech Recognition

作者摘要

演算法結果

簡評

微軟發表在Findings of EMNLP 2021上面的文章，關於ASR識別後處理糾錯演算法的改進工作。

7.Factorized Neural Transducer for Efficient Language Model Adaptation

作者摘要

演算法結果

簡評

微軟關於RNN-T文字領域遷移的改進

8.End-to-End Complex-Valued Multidilated Convolutional Neural Network for Joint Acoustic Echo Cancellation and Noise Suppression

作者摘要

演算法結果

簡評

提交到ICASSP2021的工作

關於艾滋病試紙檢測的問題

現在比較流行的衛衣品牌有哪些呢？