2014年2月2日日曜日

科学計算用のscipyスタック(anaconda)

科学計算用(というより統計や機械学習系)のpython環境をwindowsにつくろうとして、いろいろ調べていると、scipyスタック(*1) として「anaconda」というものが存在することを知った

このanaconda、かなり便利でこれ1つインストールするだけで、主なところで、
  • python 2.7.5
  • theano 0.5.0 L
  • numpy 1.7.1
  • scipy 0.13.0
  • pip 1.4.1
  • matplotlib 1.3.1
  • pandas 0.12.0
とかが一緒にインストールされる。(全パッケージ情報はここ参照)

■インストール方法(Windows)

インストール方法は全くもって簡単で、ここからwindows用インストーラーをダウンロード。ダウンロードしたインストーラーをダブルクリックで起動するだけ。

インストール中は、基本的に画面に従ってデフォルト設定で「次へ」を押していけばいいが、一点だけ注意が必要で、英語で「自分のみにインストールするか?(推奨)、それともシステム全体にインストールするか?」と聞かれる箇所がある。この時デフォルトの設定では「システム全体にインストール」側にチェックが入っているので、推奨の「自分のみにインストール」をしたければ、チェックを付替えてから「次へ」でインストールを進める。

■動作確認

インストールが終わったら、「スタートボタン>全てのプログラム」に「Anaconda」の項目がある。
例えば、「Annaconda Command Prompt」を選択し、コンソールから
$python -V
と入力してバージョン情報が表示されれば、ひとまずインストールは成功。

また、anaconda本体は、「自分のみにインストール」を選択してインストールした場合、
「C:\Users\[XXX]\Anaconda」
以下にインストールされている。(ここで[XXX]はあなたのユーザーネーム)

これだけ簡単にインストールできるとなると、pythonでのデータ分析とかの敷居がどんどん低くなっていくなーと感じる。

■パッケージをアップデート

Anacondaで使われているパッケージは若干古いバージョンのものも含まれるので、使うパッケージは最新版にアップデートしておいた方がよい。Anacondaは独自のパッケージ管理ツール「conda」で管理されるので、例えばpandasを最新版にアップデートしたい場合は、
「Annaconda Command Prompt」を起動し、コンソールから
$conda update pandas
を実行すればOK。依存するパッケージも自動でアップデートしてくれる。
また、condaで管理していないパッケージについては、従来どおりpipでアップデートも可能。

0 件のコメント:

コメントを投稿