2015年11月3日火曜日

RISEでインタラクティブなIPython notebookのスライド作成!

前にも書いたけど、ちょっとしたプレゼン資料を作るときに以下のようなことが多々ある。
手軽に書きたい
Texで数式
図を入れたい。
プログラムを入れたい。
かっこ良くしたい。
PDFにしたい。
個人で使う分はフリーで済ませたい。
しかもreveal.jsを使っていかにもギークっぽくしたい。
そんな要求に答えてくれるライブラリがある!
https://github.com/damianavila/RISE

まずはIPython notebookをインストール。

IPython notebookはAnacondaを入れると一発で入る。Pythonを使う人は入れておいて損はないけど、他の言語でIPython notebook使う人にはちょっと大きすぎるかも。

RISEをインスール

https://github.com/damianavila/RISE
をどこかに保存して,そのディレクトリに移動した後に
python setup.py install
するとIPython notebook上に新しいボタンが現れる。
ボタンを押すとスライドになって☓を押すと元に戻る。
そのままではすべて1枚のスライドになってしまうのでCell ToolbarでSub slideとかに設定すればよい。
これから会社ではこれ使って発表しよう。

2015年9月23日水曜日

ipython notebookでVim(バインディング)

ipython notebook(Jupyter)でもvim bindingが使えるらしい。
https://github.com/lambdalisue/jupyter-vim-binding
ipython notebookで使いにくかった点が1つ改善された。
環境はMacにAnacondaを導入している。
基本的な導入は上のGithubのリンクに書いてあるけど…一応メモしておこう。
まずはipythonをアップデートして、さらにjupyterを入れる。
(Jupyterを入れないとnotebookモジュールがないと怒られる)
$ conda update ipython
$ conda install jupyter
次に以下を実行
from notebook.nbextensions import install_nbextension
install_nbextension('https://goo.gl/5TK96v', user=True, destination="vim_binding.js")
一時的に使うときは
%%javascript
Jupyter.utils.load_extensions('vim_binding')
ずっと有効にしたいときは
%%javascript
Jupyter.notebook.config.update({
  'load_extensions': { 'vim_binding': true },
});
これでipython notebook上でVimバインディングが使える。いやー、便利になった。


2015年9月13日日曜日

Iteratively Reweighted Least Squares についてサクッと。

Iteratively Reweighted Least Squares(IRLS)ってたまに出てくるけど、何か分かってなかった.

Least Squares

LSでは線形モデル、
\bf{y} = \bf{\beta}^T \bf{x} + \bf{\epsilon}
というモデルを考えたときにデータとモデルの2乗和誤差を最小にするように\bf{\beta}を決定する。このとき誤差\bf{\epsilon}を1つの定数で書ける(データのばらつきが次元で同じ)ときは擬似逆行列を使って係数\bf{w}を決定することができる。導出はないけど、微分が0になるようにbf{\beta}を決定すれば
\bf{\beta}^{*}= (X^TX)^{-1}X^T \bf{y}

Weighted Least Squares

先程はデータの次元でばらつきが同じとしたけど、次元間の分散が違うことだってある。そんな場合にWLSをつかう。調べた感じWikipediaが一番分かりやすい。
https://en.wikipedia.org/wiki/Linear_least_squares_(mathematics)#Weighted_linear_least_squares
この場合、
\bf{\beta}^* = (X^TWX)^{-1} X^TWy
となる。ただしWは対角成分に分散の逆数を並べた行列。例えば、あるデータ次元についてはほぼ確定的なら始めから分散は小さくできるので、それを反映させることができる。式を見ると、データを標準偏差で割っているのと同じになっているので、データが事前にある場合は標準化(standardization)しとけば同じことになりそうだ。

Iteratively Reweighted Least Squares(IRLS)

上の2つは一発で最適な係数\bf{\beta}^*を求めることができた。これは2乗和誤差が\bf{\beta}の2次で書けるからだ。IRLSでは、2次でない場合でも2次で近似しながら重みWを更新して、最適な係数\bf{\beta}を求めてくれる。これまたWikipediaがわかりやすかった。
https://en.wikipedia.org/wiki/Iteratively_reweighted_least_squares
Lpノルムを最小化したいときは、
\bf{\beta}^{(t+1)} = (X^TW^{(t)}X)^{-1} X^TW^{(t)}y
W^{(t)}は対角行列。W^{(0)}=\bf{1}と初期化しておき、対角成分の各要素は以下のように更新していく。
w_i^{(t)} = | \bf{y}_i - X_i \beta^{(t)}|^{p-2}
IRLSはスパースな係数を選択するためにL1最適化を使う場合に用いられたりするようだ。
コンピュータビジョン最先端ガイド6巻の3章に少しだけIRLSの記述がある。
Scikit-learnなどではOMPが実装されているみたいだが。

2015年9月1日火曜日

Python でPRML7.2章 RVMを実装。

いつ使うかは分からんが、RVMを実装しておこう。
7.2章の数式をそのまま書いた。動作確認は1次元のガウス基底で行った。

def rvm(t, PHI, alphas0, beta0, maxloop=10):
    """
    t: observed values.
    X: designe matrix
    alphas0: initial weights for each parameter.
    beta0: an initial precision value.
    
    returns
    alpha: prior weights
    beta: prior precision
    m: prior means
    V: prior covariance matrix
    
    See PRML 7.2 for details.
    
    ** to many loop causes 0 devision for some reason.
    """
    beta = beta0
    alphas = alphas0
    
    for i in range(maxloop):
        A = np.diag(alphas)
        V = np.linalg.inv(A+beta*np.dot(PHI.T, PHI))
        m = beta*np.dot(V, np.dot(PHI.T, t))
        gammas = 1 - alphas * np.diag(V)
        
        #new alphas and beta
        alphas = gammas / m**2 
        beta =  (N - np.sum(gammas)) / np.linalg.norm(t - np.dot(PHI, m))
        
    return alphas, beta, m, V




10個のガウス基底でフィッティングをした。
今回書いたコードではループの回数が多すぎるとzero divisionでエラーとなった。でもループは10回くらいで十分フィットしているように見えた。




2015年8月24日月曜日

Python3 で OpenCV3を使う(Windows)。

最近やりたいことはほとんどPython3で出来ているが、OpenCVを使う時だけpython2に切り替えている。OpenCVもPython3に対応したようだが、配布バイナリはPython2のものしか提供されていない。オフィシャルでないけど、サクッとPython3にOpenCV3をインストールする方法を見つけたので紹介する。


まず、ここから.whlファイルをダウンロードする。
(このサイト経由だと余計なものをダウンロードしなくて済むのでよい)
http://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv

whlはpipでインストールできるので、

pip install opencv_python-3.0.0-cp34-none-win_amd64.whl

とする。

前はソースからコンパイルとかしたけど、こんなにラクになるとは。ありがとうございます。

2015年7月19日日曜日

matplotlibのcolormap

scipy2015に興味深い講演があった。
A Better Default Colormap for Matplotlib
https://www.youtube.com/watch?v=xAoljeRJ3lU


Matplotlibの現在のデフォルトの色はjet。
Matplotlib2.0からはデフォルトの色が'viridis'に変わる。
http://betterfigures.org/2015/07/10/a-welcome-development-for-matplotlib/
'viridis'は4つの候補のうちの1つで、投票で選ばれたらしい(緑が入ってるから)。4つともMatplotlib1.5から導入はされるらしい。

なにが良くなったかというと、
色空間を連続的に変化させるだけでなく、人間の視覚を通した時にスムーズに変化するようになっているらしい。こうすることによって、より細かい変化に気付くことができる。たとえば、医師の誤診断とかも減るとか。更に、白黒にしたとしても分かるし、色盲の人でもわかりやすいように設計されているらしい。

ここには動画もある。
https://bids.github.io/colormap/

ちなみに今使えるcolromapサンプルはここにある。
http://matplotlib.org/examples/color/colormaps_reference.html

2015年6月28日日曜日

Pythonで多項式回帰

pythonで最小二乗法で係数を求めるのには関数を定義しなければいけないが、高次の多項式だとクロスタームやらいっぱい出てきて書くのが大変だ。

scikit-learnのPolynomialFeaturesはそこを自動で計算してくれる。
例えば2次の場合degree=2とすれば、

[x1, y1] -> [x1**2, x1*y1, y1**2, x1, y1]

を計算してくれる。

それを使って多項式近似をする。
以下メモ。
Pipelineについては
http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html

from sklearn.linear_model import Ridge
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import make_pipeline

#original function
def f(x):
    return 2*x[0]**2 + 3*x[0]*x[1] + 4*x[1]**2 + 2*x[0] + 3*x[1] + 4

#observed data
xx, yy = np.meshgrid(np.linspace(-2, 2, 10), np.linspace(-2, 2, 10))
X = np.vstack((xx.reshape(-1), yy.reshape(-1))).T
y = list(map(f, X))

#fit the data
degree = 2
model = make_pipeline(PolynomialFeatures(degree), Ridge())
model.fit(X, y)

#accessing to the coeffs
#(model is a Pipeline.)
print(model.steps[1][1].coef_)


2015年6月27日土曜日

Python でサクッとLeast Square fit

Pythonで最小二乗を使うときはサクッと以下のように行おう。

import numpy as np
from scipy.optimize import leastsq

def func(c, x):
    return c[0]*x**2 + c[1]*x + c[2] 

def errfunc(c, x, t):
    return t - func(c, x)

#observed data and initial guess
x = np.linspace(-5, 5, 100)
t = 4*x**2 + 1 
c0 = [0, 0, 0]

leastsq(errfunc, c0, args=(x, t))


2015年6月2日火曜日

AnacondaでPython2と3のIPython notebookを起動する。

Pythonで計算をするときはAnacondaを入れとけばとりあえず色々できる。

Python2と3の両方を使うためにAnacondaとAnaconda3を2つインストールしていたが、そんなことしなくてもよいことがわかった。Anaconda3でPython2を扱う方法をメモしておく。


まず、AnacondaでPython2の環境を作る。これはいろいろなサイトに載っている通りに行う。




>conda create -n python2 python=2.7 anaconda




IPython notebookをPython2で使うときは



>activate python2
>ipython notebook




SublimetextでPython2を使いたいときは

{
    "shell": true,
    "cmd": ["C:\\Users\\myname\\Anaconda3\\envs\\python2\\python.exe", "-u", "$file"],
    "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)"
}



2015年5月24日日曜日

Lispを保存

Land of Lispを読み始めた。 といっても実は2回目の挑戦である。一回目に読んだときはパソコンの電源を落としたら、インタプリタに打ち込んだ変数やら関数がなくなってしまって挫折した。

今回はそうならないようにLispの環境を保存できるようにする。
インストールしたのはGNU CLisp.

保存する場合は

(ext:saveinitmem "lispinit.mem")


読み込んで始める場合は、

clisp -norc -M lispinit.mem 



インタプリタで開発は書きづらいのでエディタで書いてそれを上のコマンド保存、読み出しをするのがやりやすそうだ(個人的には)





2015年3月29日日曜日

Xperia Z SO-02E MVNOのSIMでもテザリングする。

ドコモのXperia Zを使って2年がたった。
乗り換えばかりを優遇する3大キャリアに嫌気がさしたのと、普段月2Gも使って居ないのでMVNOにMNPした。

たまに電車の中とかでテザリングしたいときがあったけど、そのままのXperiaではテザリングできないらしい。いやーひどい。

調べてみると、WifiテザリングはRoot化しないと無理とかいう情報ばかりだったけど、したのリンクの記事にRoot化しなくても行けると書いてあった。
http://androplus.org/Entry/282

ここに書いてある通りにやればadb.exeもダウンロードできてうまくいった。
http://xperia-freaks.org/2015/03/21/docomo-tethering/


テザリングはうまくいったけど、たまにspモードがどうとかいう警告がでるのがうざい。
これはRoot化しないときえないのか…