saito

記者紹介

saitoxu(さいとぅ)

株式会社Carat 最高技術責任者 京都大学大学院修了。新卒でITベンチャーに就職し、BtoBのWebサービス開発に従事。キカガクOnlineでは機械学習を学ぶ初心者が、次のステップを踏み出すのに役立つ情報を発信していく予定。

fig4

Cloud9というブラウザで実行できる統合開発環境を使って、機械学習・ディープラーニングを学べる環境を構築しましょう。

環境構築はめんどう

これから機械学習・ディープラーニングで学ぼうという方にとって、最初のハードルなのは実は学ぶ環境そのものの構築だったりします。
多くの先人の方々が構築作業で躓いて、その対応策をWeb上に残してくれてはいますが、なかなか自分と同じ環境に合致する対応策が見当たらず、環境構築で挫折、なんてことが往々にしてあります。

そこで最近注目されてきているのが、Cloud9というサービスです。

Cloud9とは?

Cloud9はブラウザ上で実行できるリモートコンピュータで、無料で利用できます(有料版もあり)。
Cloud9ではブラウザからリモートにあるコンピュータを立ち上げることができ、自分のPCにソフトウェア等をインストールする必要がありません。
しかも、プログラムやコマンドの実行からWebサーバの起動までできてしまいます。
リモートのコンピュータはまっさらな状態からスタートできるので、環境構築時によくある、自分のPCの環境が壊れてしまうという心配もありません。

無料プランではコンピュータのスペックが制限されており(メモリ512MB、ハードディスク2GB)、時間のかかる計算処理などはできませんが、学習用途しては十分なので、Cloud9で機械学習・ディープラーニングを学べる環境を作ってみましょう。

機械学習・ディープラーニングの環境構築

まずはCloud9にアクセスして、サービスに登録しましょう。
クレジットカードの登録が必要になりますが、無料で使い続けることができます。
その他は普通のWebサービスと大差なく登録処理を進められると思います。

登録が済んだら、以下のようなダッシュボード画面が表示されます。
Cloud9では1つ1つの環境のことをワークスペースと呼んでいます。
+ボタンからワークスペースを作成しましょう。

fig1

ワークスペースの作成画面では、「Blank」のテンプレートを選択してください。
※最新のPythonを使うため、Pythonのテンプレートではなく空のテンプレートからインストールします。
ワークスペース名はお好きな名前でけっこうです。

fig2

最後に作成ボタンを押すと、以下のような画面が立ち上がります。
それでは右下の画面(ターミナル環境)を使って、機械学習・ディープラーニングの環境を構築していきます。

fig3

機械学習の環境構築

今回はminicondaというシステムを使ってPythonならびに機械学習のライブラリをインストールします。
minicondaはPythonとcondaというパッケージ管理システムがいっしょになったもので、データ分析を行う人が扱いやすいように作られています(ローカルでのコンパイルが不要なので、環境に依存せずに使える)。
※パッケージ管理システムについては以前pipを取り上げました。

では、まずminicondaをインストールしましょう。
cloud9のターミナルで以下のコマンドを打ちます。

# miniconda(pythonとconda)のインストール
user:~/workspace $ cd
user:~ $ wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh # minicondaのインストールスクリプトをダウンロード
user:~ $ bash Miniconda3-latest-Linux-x86_64.sh # インストール実行

# ...
# インストール中は基本、yesと打つかEnterで進めばOK
# ...

user:~ $ source .bashrc # 設定の再読込
user:~ $ python --version # Pythonがインストールされているか確認
Python 3.5.2 :: Continuum Analytics, Inc.
user:~ $ conda --version # condaがインストールされているか確認
conda 4.2.13

ここまででminicondaがインストールされたので、つぎは機械学習のライブラリをインストールしていきましょう。
とはいえ、手順はこれだけです。

# 機械学習に使うライブラリのインストール
user:~ $ conda install numpy pandas scipy scikit-learn

試しにNumPy(科学計算ライブラリ)を使ってみましょう。

# NumPyを使ってみる
user:~ $ python
Python 3.5.2 |Continuum Analytics, Inc.| (default, Jul  2 2016, 17:53:06) 
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy as np
>>> a = np.array([1,2])
>>> a
array([1, 2])

正しくインストールされていることが確認できました。

ディープラーニングの環境構築

続いてディープラーニングの環境を作ります。
ディープラーニングを行うフレームワークはいくつかありますが、今回は国産で使いやすいと言われているchainerをインストールしましょう。
chainerはインストールがとても簡単で、以下のコマンドだけで済みます。

# chainerのインストールと確認
user:~ $ pip install chainer # chainerはcondaに登録されていないので、pipでインストールする
user:~ $ python # chainerがインストールされたか確認
>>> import chainer
>>> chainer.__version__
'1.19.0'

これでディープラーニングの環境構築も完了しました。
chainerを使ったディープラーニングについてはこちらが参考になるので読んでみてください。

おわりに

以上、Cloud9を使って、無料かつ簡単に機械学習・ディープラーニングを学ぶ環境構築の方法を紹介しました。
自分のPCでの環境構築で苦労されている方は、ぜひ試してみてください。