Pythonでデータ分析する次の一歩(数値計算ライブラリー、NumPy編)

| Topic path: Top / 機械学習 / Pythonでデータ分析する次の一歩(数値計算ライブラリー、NumPy編)

*目次 [#zad8b254]
#contents


*はじめに [#z5904347]

NumPyは、数値計算のためのライブラリーです。

機械学習のためのライブラリーであるscikit-learnはNumPyを使いますので、NumPyを少し理解しておかないと、scikit-learnが使えません。
機械学習のためのライブラリーであるscikit-learnはNumPyを使いますので、NumPyを少し理解しておかないと、scikit-learnを使いこなせません。

参考書としては、次の本がオススメです。
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" src="https://rcm-fe.amazon-adsystem.com/e/cm?ref=qf_sp_asin_til&t=tohgorohmatsu-22&m=amazon&o=9&p=8&l=as1&IS2=1&detail=1&asins=4873116554&linkId=6d4c9121f7d09fe9aa24fea76158e69c&bc1=ffffff&lt1=_blank&fc1=444b4c&lc1=444b4c&bg1=ffffff&f=ifr"></iframe>
}}




*配列 [#n8b92d54]

NumPyの基本は、''配列''です。

NumPyの配列は、''numpy.ndarrayクラス''で表されます。
n次元配列 (n-dimensional array) という意味です。





*配列を作る [#u04a1960]
配列は、numpy.arrayで作ります。
#geshi(python){{
import numpy as np
a = np.array([1, 2 ,3, 4, 5, 6, 7, 8])
a
}}
#geshi(txt){{
array([1, 2, 3, 4, 5, 6, 7, 8])
}}


*配列の要素数を調べる [#p1e4c34d]

配列の要素数は、ndarrayオブジェクトの''shape属性''に格納されています。
#geshi(python){{
a.shape
}}
#geshi(txt){{
(8,)
}}

ndarrayオブジェクトのshape属性はタプルなので、数値で取り出すには要素番号を指定します。
#geshi(python){{
a.shape[0]
}}
#geshi(txt){{
8
}}


*配列の形を変える [#ec3c0207]

配列の形を変える(例えば、全体の要素数を変えないで二次元配列にする)には、''numpy.reshape関数''またはnumpy.ndarrayオブジェクトの''reshape関数''を使います。

numpy.reshape関数の場合は、次のようにします。
#geshi(python){{
np.reshape(a, (2, 4))
}}
#geshi(txt){{
array([[1, 2, 3, 4],
       [5, 6, 7, 8]])
}}

numpy.ndarrayオブジェクトのreshape関数の場合は、次のようにします。
#geshi(python){{
a.reshape((4, 2))
}}
#geshi(txt){{
array([[1, 2],
       [3, 4],
       [5, 6],
       [7, 8]])
}}

三次元配列にもできます。
#geshi(python){{
np.reshape(a, (2, 2, 2))
}}
#geshi(txt){{
array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])
}}

要素数が合わないと、エラーになります。
#geshi(python){{
a.reshape((4, 1))
}}
#geshi(txt){{
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-19-7c07ecbec7bf> in <module>()
----> 1 a.reshape((4, 1))

ValueError: cannot reshape array of size 8 into shape (4,1)
}}

要素数に-1を指定すると、配列全体のサイズに合わせて調整してくれます。
#geshi(python){{
a.reshape((4, -1))
}}
#geshi(txt){{
array([[1, 2],
       [3, 4],
       [5, 6],
       [7, 8]])
}}

*二次元配列の要素を取り出す [#w9406008]
説明のため、二次元配列を用意します。
#geshi(python){{
m = a.reshape((2, -1))
m
}}
#geshi(txt){{
array([[1, 2, 3, 4],
       [5, 6, 7, 8]])
}}

要素を取り出すには、取り出したい要素の行番号と列番号を指定します。
#geshi(python){{
m[0, 1]
}}
#geshi(txt){{
2
}}


*二次元配列の行を取り出す [#dee1f720]

行を取り出すには、行番号に取り出したい行の行番号を指定し、列番号には全てを表す : を指定します。
#geshi(python){{
m[0, :]
}}
#geshi(txt){{
array([1, 2, 3, 4])
}}

*二次元配列の列を取り出す [#m413d6ec]

列を取り出すには、行番号に全てを表す : を指定し、列番号には取り出したい列の列番号を指定します。
#geshi(python){{
m[:, 1]
}}
#geshi(txt){{
array([2, 6])
}}

*二次元配列に行を追加する [#iceadf2e]

行を追加するには、''np.vstack関数''に、同じ列数の二次元配列をタプルで指定します。
#geshi(python){{
np.vstack((m, m, m))
}}
#geshi(txt){{
array([[1, 2, 3, 4],
       [5, 6, 7, 8],
       [1, 2, 3, 4],
       [5, 6, 7, 8],
       [1, 2, 3, 4],
       [5, 6, 7, 8]])
}}


*二次元配列に列を追加する [#b1fbb5a5]

列を追加するには、''np.hstack関数''に、同じ行数の二次元配列をタプルで指定します。
#geshi(python){{
np.hstack((m, m, m))
}}
#geshi(txt){{
array([[1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4],
       [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8]])
}}

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS