每逢做實驗的季節,找資料集就成了一個重大活動,為了便於自己以後尋找實驗的資料集,在此做一個小小的整理,並在後續不斷進行更新。

先直接上一個大boss:

谷歌的

同時,留一些連結記錄一些

資料集網址集合

Best Public Datasets for Machine Learning and Data Science

免費資料集下載

吐血整理:43種機器學習開源資料集

各類資料集整理(持續更新中ing)

資料集大全:25個深度學習的開放資料集

找動態網路的資料集

機器學習需要的大量資料集從哪裡找?

資源 | 機器學習高質量資料集大合輯

AMiner Dataset

NETWORK DATASETS

Index of Complex Networks(支援條件篩選)

toreopsahl。com 資料集 (種類較多)

Stanford Large Network Dataset Collection

The KONECT Project

Network data

LINK-group

Network data sets

Kaggle

格物鈦graviti

以下為詳細的資料集:

Enron Email(郵件資料集)

DBLP資料集(論文合作關係)

Cora(引文網路)

Citeseer (引文網路)

Social Spammer (垃圾郵件資料集)

Astro Physics collaboration network(合作網路)

Hypertext 2009 Contact Network(會議與會者接近程度資料集)

SFHH (會議與會者接近程度資料集)

Citation Network Dataset(引文網路)

Patent citation network (專利引用網路)

Online Social Networks(Flickr、LiveJournal、Orkut、YouTube)—

含Group