無監督學習演算法有哪些?一尾活龍2017-10-25 08:58:20

分成幾種型別,大家知道最多的是k mean了,聚類還有mixture Gaussian model就是軟聚類,第二種是最有意思的,矩陣分解模型,包括非常多的變種,PCA,svd。EM, LDA等等,通常用來得到latent或embedding,或者用來推測缺失值,第三種是馬爾科夫系列模型,第四種名字忘了,透過聯合計數來得到事物之間的關係,比如啤酒與尿布的案例可以透過這種方式得到

無監督學習演算法有哪些?djdbupt2017-10-18 07:55:52

所謂無監督的學習演算法,就是從沒有任何標註資訊的資料中學習到規律,這裡的無標註主要是不需要人工參與!例如傳統的降維演算法PCA,透過把資料抽象為矩陣,透過求矩陣的特徵向量與特徵值來求主成分!像Topic model中的LDA,輸入的是一個一個的文字資料,得到每個文字的Topic資料!像很多傳統的聚類演算法等,也是透過計算資料之間的距離來得到相似度,從而做聚類!包括TFIDF,某些新詞發展演算法,ngram模型等,都可以透過統計來計算!

無監督學習演算法有哪些?豆豆都飛2017-10-17 08:12:44

無監督學習(unsurpervised learning)是深度學習的基礎,也是大資料時代科學家們用來處理資料探勘的主要工具。個人理解的話就是資料太多,而人們不可能給每個資料樣本加標籤吧,所以才有了無監督學習。當然用的最多的是用無監督學習演算法訓練引數,然後用一部分加了標籤的資料測試。這種方法叫半監督學習(semi-unsurpervised)。最近看的幾個深度學習演算法是:稀疏自編碼(sparse auto-encoder)、稀疏限制玻爾茲曼機器(sparse RBM)、K-means 聚類和高斯混合模型。根據論文An Analysis of Single-Layer Networks in Unsupervised Feature Learning的實驗結果,K-means聚類演算法是準確率最高,而且不需要超引數(hyper-parameter)。