- 追加された行はこの色です。
- 削除された行はこの色です。
*はじめに [#pcdbe70c]
Pythonで定番のツールを使ってデータ・マイニングを行う環境を整えます。
-pandas
-scikit-learn
-Jupyter Notebook
pandasはデータを扱うためのライブラリーです。
scikit-learnは機械学習のライブラリーです。
Jupyter NotebookはPythonのコードや出力結果をHTML形式で出力するツールです。
この記事の内容は、以下のバージョンで確認しました。
-macOS Sierra 10.12.3
-Python 3.5.1
-pytest 3.1.2
*インストール [#q1f4517c]
pipを使ってインストールしますので、まず、pipを最新版にします。
#geshi(sh){{
$ sudo pip3 install --upgrade pip
}}
scikit-learnに必要なWheel, NumPy, SciPyをインストールします。
#geshi(sh){{
$ sudo pip3 install wheel
$ sudo pip3 install numpy
$ sudo pip3 install spicy
}}
**pandas [#ob2d6389]
#geshi(sh){{
$ sudo pip3 install pandas
}}
基本的には、ここに書いてあるやり方に従って、インストールします。
-https://pandas.pydata.org/pandas-docs/stable/install.html
まず、pip3を使って、テスト・ツールであるpytestと、pandasをインストールします。
**scikit-learn [#y4702d61]
#geshi(sh){{
$ sudo -H pip3 install pytest
$ sudo -H pip3 install pandas
$ sudo pip3 install -U scikit-learn
}}
次に、python3を起動し、テストします。
#geshi(python){{
>>> import pandas as pd
>>> pd.test()
**Jupyter Notebook [#p49aaa0e]
#geshi(sh){{
# sudo pip3 install jupyter
}}
*動作確認 [#a84e2c0c]
**Jupyter Notebook [#nc0f879d]
まず、macOSのTerminalからJupyter Notebookを起動します。
#geshi(sh){{
$ jupyter notebook
}}
すると、ローカルでWebサーバーが起動し、Webブラウザが自動的に起動します。
#ref(./jupyter_boot.png,50%)
''New'' から ''Python 3'' を選択します。
#ref(./jupyter_new_python.png,50%)
すると、新しいノートブックが作成されます。
#ref(./jupyter_notebook.png,50%)
**scikit-learn [#l671ced9]
標準で入っているirisデータをSVM (SVC)で学習してみます。
入力ボックスにPython 3のプログラムを入力し、ボタンを押して実行します。
#ref(./jupyter_iris.png,50%)
#geshi(python3){{
>>> from sklearn import datasets
>>> from sklearn.svm import SVC
>>> iris = datasets.load_iris()
>>> clf = SVC()
>>> clf.fit(iris.data, iris.target)
>>> list(clf.predict(iris.data[:3]))
>>> clf.fit(iris.data, iris.target_names[iris.target])
>>> list(clf.predict(iris.data[:3]))
}}
まだ書きかけです。