如何快速收集200份問卷迷途羔羊1991 2021-05-21

學術研究中,透過問卷收集資料,進行分析的情況越來越多。但在問卷收集資料時,難免會出現填寫者亂填,或者不知道如何填寫等,最終導致收集資料不準確,研究結論不可靠等問題。

如果問卷收集資料不準確,通常會帶來資料信度和效度的影響。單獨從肉眼看資料都挺正常,但使用研究方法進行測量就會立刻現出原形。

學術研究上使用量表居多,而且也只有量表也才能進行信度和效度測量,資料的信度即可靠性是最為基礎,同時資料的有效性也是資料質量的基本要求。研究者可透過SPSSAU問卷研究模組進行信度和效度測量。

信效度分析-SPSSAU

本文從兩個維度進行闡述,如何保證資料質量,分別是無效樣本的防範和無效樣本的處理。

既然資料問題會帶來信度和效度問題,那應該如何防範呢,出現問題時如何解決呢?

一、防範無效樣本

首先從防範的角度來看,從問卷設計和問卷收集兩個角度提供以下六點建議:

1。題目不能過多

題目過多會導致填寫者不耐煩,越到後面的問題越不準確,如果是學術研究,通常有一個標準是測量變數的5倍左右,比如測量變數有10個,每個測量變數通常對應4~7個題,那麼加起來共有50個題左右,除此之外再加上一些基本的個人資訊題和一些樣本行為特徵題即可。

因此如果研究越複雜,研究變數越多,那麼問卷設計的題目也會越多,對於收集資料的質量控制也應該越高;問卷設計時不是題越多越好,而應該以剛好匹配研究目的為準。

2。設定測謊題

問卷設計時可加入個別測謊題,此種做法的好處是可以在後續處理時很好的進行識別出無效樣本,快速地檢查出樣本是否真實回答問卷。

3。問卷整體規範

比如問卷設計時措詞表達的簡潔易懂,問卷結構的清晰簡單,問卷是給使用者填寫使用的,一定需要站在填寫問卷人的角度進行換角度考慮,設計出結構清晰簡單易懂的問卷,別人也更加願意為你填寫。

4。互填問卷需謹慎

問卷研究時樣本數量一般要求是量表題的5倍,嚴格是10倍。比如問卷中有40道量表題,那至少需要200個樣本才適合。問卷設計好後,通常是讓朋友同學進行填寫,但是數量有限,還是不夠,所以現在出現較多的問卷互填QQ群,陌生人幫助填寫等,陌生人為你填寫,也沒有利益問題,所以此類樣本的準確度沒辦法保證,因此在問卷設計時有個測謊題就可以用於後面的識別。

5。收費樣本需謹慎

當前有比較多的問卷網站提供樣本收集服務,如果使用此類服務,建議自己設定一些測謊題用於判斷是否真實有效的樣本。

6。問卷預測試

上述已經說明,問卷是否真實可靠,是否有效,肉眼根本無法識別,但是使用分析方法一下子就能看出。因此一般可以先收集小部分(比如50個)資料後,進行預測試分析,一般是做信度分析,大概看下效度分析情況。先做到心中有數,如果預測試出現大的問題,提前發現問題,修改一些問卷規範,重新找有效的樣本等。

二、無效樣本處理

上述六種辦法,已經做好各種防範,相信問卷中無效樣本已經非常少,餘下的都是有效樣本了。但實際上並非如此,比如說會出現這樣的樣本,很多個量表題都選擇同一個答案(比如‘同意’)。也或者填空年齡,結果出現一個數字110。類似這樣的都屬於無效,應該進行處理。

如果對無效樣本不進行處理,肯定會導致分析出現問題。因此在做好各種防範後,還需要在資料收集完成後對資料無效性進行處理。接下來以SPSSAU無效樣本和異常值處理這兩個功能進行說明。

1。無效樣本

首先找到SPSSAU提供的無效樣本處理功能。資料處理》無效樣本,如下圖:

無效樣本處理-SPSSAU

SPSSAU提供兩種情況的無效樣本設定:第一種是完全相同數字超過一定比例時設定成無效樣本。不認真填寫者通常有個特別是完全選擇相同的答案,一般以量表題選擇相同數字超過70%作為標準。

性別、學歷這種是樣本本身的屬性,到底是男還是女,無法測試。所以一般選中問卷中的所有量表題,比如30道題表題,30個量表題中70%都是相同數字,意味著21個題都選擇同樣一個答案,這種一般就算無效樣本。這裡70%是常見處理方式,當然也可以設定成60%或者80%的標準。

除了相同數字識別成無效樣本,SPSSAU還提供缺失樣本比例超過某數字後,也設定成無效樣本。如果一大堆答案都不選擇,那肯定也屬於無效。具體有多少比例的答案沒有做出回答算成無效,沒有固定的標準,一般70%以上肯定是無效樣本。

無效樣本處理-SPSSAU

設定好無效樣本後,預設會新生成一個標題,用來標識那些樣本是有效,那些是無效,在分析的時候直接進行篩選下就好。