什麼是非負矩陣分解?矽釋出2018-04-23 22:50:45

非負矩陣分解(NMF或NNMF)以及非負矩陣近似是多變數分析和線性代數中的一組演算法,其中矩陣V被分解成(通常)兩個矩陣W和H ,所有這三個矩陣都沒有負面因素。這種非負性使得矩陣更易於檢查。另外,在諸如處理音訊譜圖或肌肉活動的應用中,非負面性是所考慮的資料固有的。由於這個問題一般不能完全解決,所以通常用數字來近似。

設矩陣V是矩陣W和H的乘積,

矩陣乘法可以實現為計算V的列向量作為W中的列向量的線性組合,使用H的列提供的係數。也就是說,V的每一列可以計算如下:

其中v 我是我乘積矩陣的第列向量V和ħ 我是我的矩陣的第列向量ħ。

當矩陣相乘時,因子矩陣的維數可能明顯低於產品矩陣的維數,正是這種屬性構成了NMF的基礎。與原始矩陣相比,NMF生成的維數明顯減少。例如,如果V是一個m × n矩陣,W是一個m × p矩陣,並且H是一個p × n矩陣,那麼p可以顯著小於m和n。

以下是基於文字挖掘應用程式的示例:

讓輸入矩陣(矩陣被分解)為V,10000行,500列,其中單詞在行中,文件在列中。也就是說,我們有500個以10000字為索引的文件。它遵循的列向量v中V表示的文件。

假設我們要求演算法找到10個特徵,以便生成10000行10列的特徵矩陣 W和10行500列的係數矩陣 H。

W和H的乘積是一個有10000行500列的矩陣,其形狀與輸入矩陣V相同,如果分解工作,它對輸入矩陣V是一個合理的近似值。

從以上矩陣乘法的處理可以看出,乘積矩陣WH中的每列是特徵矩陣W中的10列列向量與係數矩陣H提供的係數的線性組合。

瞭解更多矽谷前沿深度訊息請看

矽釋出

微信公眾號。