可否用大資料分析的方法，來推斷水滸的真實作者是否為羅貫中？

無文2016-01-08 11:33:07

請問你哪來的古代的大資料。

吳寒笛2016-01-08 11:43:56

很有趣的題目。

首先需要採集確認為羅貫中作品的資料，然後再採集水滸相關的資料，做一下各維度擬合程度的對比

劉某2016-01-08 12:02:54

大資料的結論並不接近真相，接近於期望

甲乙2016-01-08 16:08:40

我好像在哪兒看過一篇文章，說復旦大學李賢平老師曾經做過一項科研。他們確定了文言文裡18個虛詞，把紅樓夢前80回和後40回的虛詞詞頻進行對比，發現差異很大，從而證明前後兩部分應該不是出自一個人之手。他們的假定是同一個人在寫作過程中使用虛詞（諸如“之”“也”等等）的頻率是固定的。我想這個方法如果可行的話應該也能用來判斷題主的疑問吧……

小白2016-01-18 15:42:14

你說的“大資料分析的方法”應該是指基於語料庫的分析方法。

語料庫中存放的是在語言的實際使用中真實出現過的語言材料；

語料庫以電子計算機為載體進行；

語料庫中的真實語料需要經過分析和處理，才能成為有用的資源。（即熟語料）

語料庫語言學：以大量精心處理的語言事實為研究素材，主要透過機率統計的方法，對已經出現的語言事實進行分析，進而得出結論。

語料庫語言學從本質上是實證性的。

語料庫語言學立足於大量真實的語言資料，對語料庫所做的系統而窮盡的觀察和概括所得到的結論。這對於語言理論建設具有無可比擬的創新意義。

可以建立已確定的羅貫中的作品的語料庫，再建立關於《水滸傳》的語料庫，然後對兩個語料庫中的虛詞等進行對比分析。由相似度得出結論。

但是自己建語料庫是一項非常龐大的工程。首先是語料的錄入，處理，其次就是分析項。可能會用到些基礎的程式設計知識。

語料庫語言學是最近語言學研究的新方法，新動向。我也是剛入門階段，一知半解的。

具體的有論壇：語料庫線上可以進去逛逛

入門書：《語料庫應用教程》外語教學與研究出版社

《語料庫語言學》清華大學出版社

可否用大資料分析的方法，來推斷水滸的真實作者是否為羅貫中？

有沒有一瞬間你覺得自己真的該努力了？

姓強起名取名？進來看看吧，全是精心整理的好名字！建議點贊收藏！

隨便看看

在農村集市上開什麼店比較合適？

帶傑字的繁體網名？

嘗還的讀音？

男生文案簡短吸引人50字？

可否用大資料分析的方法，來推斷水滸的真實作者是否為羅貫中？

有沒有一瞬間你覺得自己真的該努力了？

姓強起名取名？進來看看吧，全是精心整理的好名字！建議點贊收藏！

猜你喜歡

盤口語言129什麼意思？

東西方語言文字邏輯的主要區別是什麼？

漢語言文學、漢語言、漢語國際有啥區別？

隨便看看

在農村集市上開什麼店比較合適？

帶傑字的繁體網名？

嘗還的讀音？

男生文案簡短吸引人50字？