如何判斷模型過擬合還是欠擬合?論智2018-06-28 14:02:47

如果結果可以視覺化結果的話,值得嘗試一下。很多時候,視覺化結果之後,能夠很明顯地看出過擬合。

如何判斷模型過擬合還是欠擬合?

顯然,上圖中的模型過擬合了。

當結果不方便視覺化,或者可視化了之後也看不出什麼名堂的時候,我們可以透過視覺化ROC-AUC曲線來判斷過擬合還是欠擬合。

過擬合,簡單來說就是在訓練集上表現很好,但在測試集上表現不好。所以,如果兩條曲線距離很大,那很有可能出現了過擬合現象。

如何判斷模型過擬合還是欠擬合?

上圖中,藍色為在訓練集上的AUC,綠色為在測試集上的AUC。

相反,如果兩條曲線非常接近,同時評分都不高,那就很有可能碰到了欠擬合。

如何判斷模型過擬合還是欠擬合?

同樣,上圖中,藍色表示訓練集,綠色表示測試集。

除此之外,還有一種不太穩定地粗略判斷過擬合與欠擬合的方法。

一般而言,過擬合更容易出現預測結果偏置(bias)較低而方差(variance)較高的情況,而欠擬合則更容易出現預測結果偏置較高和方差較低的情況。

如何判斷模型過擬合還是欠擬合?

本回答中的圖片均來自論智授權編譯的Open Machine Learning Course(機器學習開放課程)。