• 追加された行はこの色です。
  • 削除された行はこの色です。
*はじめに [#pcdbe70c]

Pythonで定番のツールを使ってデータ・マイニングを行う環境を整えます。
-pandas
-scikit-learn
-Jupyter Notebook

pandasはデータを扱うためのライブラリーです。

scikit-learnは機械学習のライブラリーです。

Jupyter NotebookはPythonのコードや出力結果をHTML形式で出力するツールです。

この記事の内容は、以下のバージョンで確認しました。
-macOS Sierra 10.12.3
-Python 3.5.1
-pytest 3.1.2





*インストール [#q1f4517c]

pipを使ってインストールしますので、まず、pipを最新版にします。
#geshi(sh){{
$ sudo pip3 install --upgrade pip
}}

scikit-learnに必要なWheel, NumPy, SciPyをインストールします。
#geshi(sh){{
$ sudo pip3 install wheel
$ sudo pip3 install numpy
$ sudo pip3 install spicy
}}

**pandas [#ob2d6389]
#geshi(sh){{
$ sudo pip3 install pandas
}}

基本的には、ここに書いてあるやり方に従って、インストールします。
-https://pandas.pydata.org/pandas-docs/stable/install.html

まず、pip3を使って、テスト・ツールであるpytestと、pandasをインストールします。
**scikit-learn [#y4702d61]
#geshi(sh){{
$ sudo -H pip3 install pytest
$ sudo -H pip3 install pandas
$ sudo pip3 install -U scikit-learn
}}

次に、python3を起動し、テストします。
#geshi(python){{
>>> import pandas as pd
>>> pd.test()
**Jupyter Notebook [#p49aaa0e]
#geshi(sh){{
# sudo pip3 install jupyter
}}


*動作確認 [#a84e2c0c]

**Jupyter Notebook [#nc0f879d]
まず、macOSのTerminalからJupyter Notebookを起動します。
#geshi(sh){{
$ jupyter notebook
}}

すると、ローカルでWebサーバーが起動し、Webブラウザが自動的に起動します。
#ref(./jupyter_boot.png,50%)

''New'' から ''Python 3'' を選択します。
#ref(./jupyter_new_python.png,50%)

すると、新しいノートブックが作成されます。
#ref(./jupyter_notebook.png,50%)


**scikit-learn [#l671ced9]
標準で入っているirisデータをSVM (SVC)で学習してみます。

入力ボックスにPython 3のプログラムを入力し、ボタンを押して実行します。
#ref(./jupyter_iris.png,50%)

#geshi(python3){{
>>> from sklearn import datasets
>>> from sklearn.svm import SVC
>>> iris = datasets.load_iris()
>>> clf = SVC()
>>> clf.fit(iris.data, iris.target)
>>> list(clf.predict(iris.data[:3]))
>>> clf.fit(iris.data, iris.target_names[iris.target])
>>> list(clf.predict(iris.data[:3]))
}}


まだ書きかけです。

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS