<Python, numpy> histogram

度数分布 /ヒストグラムhistogramのデータを作る。
グラフは、データフレームDataFrameがあれば、df.hist()で簡単につくれるが、、

numpy.histogramを使うらしい。

In [12]: df = pd.DataFrame([1,2,3,3,4,4,4,4,5,5,5,5,5,5,6,6,7,8,9,10])

In [13]: df
Out[13]: 
     0
0    1
1    2
2    3
3    3
4    4
5    4
6    4
7    4
8    5
9    5
10   5
11   5
12   5
13   5
14   6
15   6
16   7
17   8
18   9
19  10

In [14]: np.histogram(df.values, bins=10)
Out[14]: 
(array([1, 1, 2, 4, 6, 2, 1, 1, 1, 1], dtype=int64),
 array([  1. ,   1.9,   2.8,   3.7,   4.6,   5.5,   6.4,   7.3,   8.2,
          9.1,  10. ]))

In [15]: df.hist()
Out[15]: array([[<matplotlib.axes._subplots.AxesSubplot object at 0x000000000BF6CB70>]], dtype=object)

f:id:nekoyukimmm:20160229152802p:plain

なるほど。

マニュアル。

numpy.histogram — NumPy v1.10 Manual