Pythonの機械学習・数値計算環境 (NumPy, SciPy, matplotlib, scikit-learn) をWindowsにインストール

あることをきっかけに機械学習に触れてみることになりました。 私の開発環境は OS が Windows 7 (64bit) です。 今回は Python 2.7 をインストールしようと思います。
Python の機械学習ライブラリ (具体的には、NumPy, SciPy, matplotlib, scikit-learn) をインストールするのに 何回かつまずいたので、自分が後々いつか再構成できるように環境構築をメモしておきます。
この記事を読まれた方の参考にもなれば幸いです。



インストール原則

大事です。これを守らないと大体失敗します。私は何度も失敗しました。繰り返さないように書いておきます。

  1. Python は 32bit 版を用いる! たとえマシンが64bit、OSが64bit、cygwin (64bit) を使用するとしても!
  2. Python 本体は cygwin のパッケージマネージャ等でインストールしない! Windows 用のバイナリをダウンロードしてインストールする!
  3. Python のライブラリ (NumPy, SciPy, matplotlib) は easy_installpip を用いずに、Windows 用バイナリからインストールする!

これに気をつければ問題は起きにくいです。逆に守らないとどっかでこけます。
1 は NumPy や SciPy が 64bit 対応してないからです。
2 は Python 単体で使用するのであれば cygwin のパッケージマネージャからインストールで問題ありませんが、Windows バイナリからインストールする方が無難です。
3 はライブラリのインストール時に、例えば SciPy は依存性があるらしく、うまくコンパイルできませんでした (下の記事を参考)。

Windows 7でnumpy, scipyインストール – 計算論的メンタルレキシコン http://d.hatena.ne.jp/niam/20110827

具体的な手順

ここまで書いたらあとはくさるほどインストールガイド記事がありますので要点だけメモ書きします。

Python 本体のインストール

python-logo-master-v3-TM

Python.org から 32bit 版 (今回はバージョン2.7のlatestである 2.7.10) をダウンロードしてインストールします。
Download Python | Python.org https://www.python.org/downloads/

Windows の Path に C:\Python27C:\Python27\Scripts を通しておきます。
Cygwin にもインストールでは使用しなくてもプログラムの実行には使う可能性があるので、パスを通しておきます。 Cygwin は今インストールした python を先に評価するように通します。つまりこのように既存のパスの前に書きます。

export PATH=/cygdrive/c/Python27:/cygdrive/c/Python27/Scripts:$PATH

NumPy, SciPy, matplot-lib のインストール

この3つは pip でインストールすると失敗する可能性が高いので、 それぞれ Windows バイナリ (32bit、Python 2.7 用) をダウンロードしてインストールします。
ちなみに、今回は NumPy 1.9.2、SciPy 0.15.1、matplotlib 1.4.3 です。

NumPy, SciPy: Obtaining NumPy & SciPy libraries — SciPy.org http://www.scipy.org/scipylib/download.html
matplotlib: matplotlib: downloads http://matplotlib.org/downloads.html

matplot-lib はこれだけでは不十分な場合があります。 この節の一番下に書いてあるインポートを試してみてインポートエラーが発生した場合、 足りないパッケージを pip でダウンロードしましょう。

pip install python-dateutil
pip install pyparsing

scikit-learn のインストール

scikit-learn だけは Windows のコマンドプロンプトより pip でインストール可能です。 0.16.1 がインストールされました。

pip install -U scikit-learn

Python のインタプリタを起動して、以下をタイプしてみてインポートエラーが起きなければ問題ないでしょう。

import numpy
import scipy
import matplotlib
import sklearn

2015-07-15 追記:
Chainerのインストールは以下の記事を参考にしてください。
DeepLearningライブラリのChainerがすごい、らしい – cvl-robot’s diary http://cvl-robot.hateblo.jp/entry/2015/06/11/223928

Make your life better with machine learning!

この記事をシェアする:Tweet about this on Twitter
Twitter
Share on Facebook
Facebook
Email this to someone
email