はじめに

Pythonで定番のツールを使ってデータ・マイニングを行う環境を整えます。

  • pandas
  • scikit-learn
  • Jupyter Notebook

pandasはデータを扱うためのライブラリーです。

scikit-learnは機械学習のライブラリーです。

Jupyter NotebookはPythonのコードや出力結果をHTML形式で出力するツールです。

この記事の内容は、以下のバージョンで確認しました。

  • macOS Sierra 10.12.3
  • Python 3.5.1
  • pytest 3.1.2

インストール

pandas

基本的には、ここに書いてあるやり方に従って、インストールします。

まず、pip3を使って、テスト・ツールであるpytestと、pandasをインストールします。

from sklearn import datasets
from sklearn.svm import SVC
iris = datasets.load_iris()
clf = SVC()
clf.fit(iris.data, iris.target)

次に、python3を起動し、テストします。

list(clf.predict(iris.data[:3]))

まだ書きかけです。

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS