描述統計初認識（Python）

問題：現有100萬的追加投資，投資候選物件為三家商鋪，要求分析投資哪家商鋪更合適。

思路：投資商鋪要從盈利能力，盈利穩定性等方面分析。

已經獲得三家商鋪近7個月的利潤資料。

1、匯入分析需要的庫和設定相關引數。

import

numpy

import

pandas

import

matplotlib。pyplot

plt

matplotlib

inline

from

pylab

import

mpl

。

rcParams

［

‘font。sans-serif’

］

［

‘SimHei’

］

plt

。

style

。

use

（

‘ggplot’

）

2、讀取資料，檢視資料。

。

read_excel

（

‘C：\Users\Thinkpad\Desktop\sp17。xlsx’

）

資料如下：

3、進行描述統計，python中很方便，直接用describe函式。

des

。

［：，

：

］

。

describe

（）

。

applymap

（

lambda

：

round

（

，

））

。

［：，

：

］

。

boxplot

（）

#做箱線圖

des

描述統計結果

mean為平均值，std為方差，下邊為分位數。

表格顯示不直觀，箱線圖可直觀反應資料情況。

根據圖表情況，可見，商鋪1平均盈利最高，但波動較大，整體態勢良好；商鋪2平均盈利最差，波動也較大；商鋪三盈利較好，且十分穩定。

因此，如若追求最大化收益投資商鋪1，追求穩定，則投資商鋪3，商鋪2不建議投資。

此外，還可以透過標準分對排名進行分析。

為了使用廣播功能方便分析，轉換成numpy陣列進行相關計算。

arr

。

array

（

。

［：，

：

］）

#轉換成陣列

arr_mean

。

array

（

des

［

：

］）

arr_std

。

array

（

des

［

：

］）

df_sts

。

DataFrame

（（（

arr

arr_mean

）

arr_std

），

index

［

，

］，

columns

［

‘商鋪1’

，

‘商鋪2’

，

‘商鋪3’

］）

。

applymap

（

lambda

：

round

（

，

））

df_sts

可見五月份是商鋪1 和商鋪3 的盈利高峰，二月份是商鋪2 的盈利高峰。

資料鏈接：

http：//

pan。baidu。com/s/1dFev5W

描述統計初認識（Python）

找一部電視劇，在20042008，不是大陸拍的，cctv1中午播過。女主是設計服裝的，後來瞎了。

結婚禮物：送給新娘的28種驚喜禮物

隨便看看

有沒有人在衣邦人上定製過衣服？最近需要做一套西裝？

有喜歡的紋身師嗎？

鏡片防偽標識對照表？

求一首詩的題目，內容是關於母親盼兒子回家的？

描述統計初認識（Python）

找一部電視劇，在20042008，不是大陸拍的，cctv1中午播過。女主是設計服裝的，後來瞎了。

結婚禮物： 送給新娘的28種驚喜禮物

猜你喜歡

手把手教你深入理解cc++中的指標

什麼是DES加密？

JS陣列去重---ES6 方法

隨便看看

有沒有人在衣邦人上定製過衣服？最近需要做一套西裝？

有喜歡的紋身師嗎？

鏡片防偽標識對照表？

求一首詩的題目，內容是關於母親盼兒子回家的？

結婚禮物：送給新娘的28種驚喜禮物