超幾何級数を扱うhypergeoパッケージ

世の中には興奮することっていっぱいあるけども、
一番興奮するのはやっぱり超幾何級数を扱うときですよね。

超幾何級数についてのWikipediaはこちら
活用例などはこちらがおすすめです。
ちなみに僕は、非心ベータ分布の平均を計算するために用いました。

R言語で超幾何級数を扱うときは, hypergeoパッケージが簡単です。
使い方を軽くメモしておきます。

インストール

CRANにあります。

> install.packages("hypergeo")
> library(hypergeo)

使い方

 _2F_1 を求める。

超幾何級数の中で頻出なのは  _2F_1 でしょうか。

{ \displaystyle
{}_2F_1(a,b;c;z) = \sum_{n=0}^\infty \frac{(a)_n (b)_n}{(c)_n} \frac{z^n}{n!}.
}

ただし,  (a)_n はポッホハンマー(Pochhammer)記号です。

{ \displaystyle
(a)_n = \begin{cases} 1 & n = 0 \\
a(a+1) \cdots (a+n-1) & n > 0
\end{cases}
}

このような 2F1 は hypergeo 関数で求めることができます。
例えば、{a, b, c, z} = {2,3,4,5}のときは、

> hypergeo(2,3,4,5)
[1] 0.1565421+0.1507964i

となり、超幾何級数が計算できました。

一般化された超幾何級数 _pF_q

 _2F_1だけでなく、 _pF_qのように一般化された超幾何級数を求めましょう。

このとき、  _pF_q は次のように定義されます。

{ \displaystyle
{}_pF_q=\sum_{n=0}^{\infty}\frac{(a_1)_n(a_2)_n\dots(a_p)_n}{(b_1)_n(b_2)_n\dots(b_q)_n\;n!}z^n 
}

これを求めるためには、genhypergeo 関数を使いましょう。
genhypergeo 関数のパラメータUに  (a_1)_n(a_2)_n\dots(a_p)_n を、
パラメータLに  (b_1)_n(b_2)_n\dots(b_q)_n を代入します。
例えば、  a_1=1, a_2=2, b_1=3, b_2=3, b_3=3, z=2 のとき、超幾何級数  {}_2F_3 は、

> genhypergeo(U=c(1,1),L=c(3,3,3),z=2)
[1] 1.078934

となります。

便利ですね!

超幾何関数 (すうがくの風景)

超幾何関数 (すうがくの風景)

サンドウィッチマンライブツアー2014 [DVD]

サンドウィッチマンライブツアー2014 [DVD]

Shinyで作った確率分布を動かせるページを, NVD3.jsでヌルヌルでインタラクティブなグラフにしました。そしてShinyでD3.jsを使う方法3つ。


今回のブログの内容を、TokyoR#45で発表しました。 上は、その時の発表資料です。

先日、Shinyを使った確率分布を動かせるページを作りました。

Shinyで確率分布を動かして遊べるページ作った - Dimension Planet Adventure 最終章 最終話『栄光なる未来』

そのときはggplot2を使ってグラフを書いていましたが、 それを全てNVD3.jsで作りなおしました!! 少し動作に時間がかかるのが難点ですが、 ヌルヌル動くインタラクティブな操作ができるようになって、 見た目的にちょっと面白いものになっています。

果たしてどれくらいヌルヌルなのか!?
以下のgifをご覧ください!!

f:id:ksmzn:20150114193524g:plain

......あんまりヌルヌルじゃないですが、
これは僕が持っているスクリーンショットアプリのgifがしょぼいだけであり、 実際はもっとヌルヌルです!!

↓ 直接アプリでご覧になって、ヌルヌル動かしてください!!

https://ksmzn.shinyapps.io/statdist/

いろいろな確率分布のパラメータをいじくるアプリ @ksmzn #Shiny

ShinyでD3.jsを使う方法。

軽く調べたところ、3つほど方法がありました。

1. rChartsを使う

これがおそらく最もカンタンな方法です。
rChartsはRで手軽にインタラクティブなグラフを描画できるパッケージで、JavaScript の可視化ライブラリを用いています。

rChartsのクイックスタートのページにも ShinyでrChartsを用いる方法が書いてあり、 それをカスタマイズするのが最もラクです。

僕も最初はこの方法で書いていたのですが、 すごく重くてなかなかグラフが描画されないという問題があり、断念しました。
この方法は、単純なシングルページで使う分には全く問題がないのですが、 僕のアプリのようなnavbarPageを使った複数のページにグラフを載せるようなアプリの場合には 辛かったです。

とはいえ、ほとんどのパターンではこの方法で良いと思われます。

2. d3Networkを使う

ネットワーク図やデンドログラムなどを描画したい場合は、 d3Networkパッケージを使う方法もあるようです。

ただ、今回の目的には適していないため、僕は試しておりません。
このページ↓を見る限り、なかなか便利そうです。

Shinyでもd3.jsを容易に使えるd3Networkパッケージを試した - でたぁっ 感動と失敗の備忘録

追記 TokyoRの会場で、上記ブログ著者のid:mitsunori さんからnetworkD3というパッケージを教えて頂きました。
名前が似てますが、d3Networkの後継っぽいです。
詳細はid:mitsunori さんの記事をご覧ください

networkD3 - でたぁっ 感動と失敗の備忘録

3. 直接D3.jsを使う

結局、この方法を採用しました。
正確に言えば、僕のアプリで直接使ったのは(NVD3.js)http://nvd3.org/です。

この方法を使う場合、とても参考になるサンプルコードがShinyのGalleryにありました。

Shiny - NVD3 line chart output

Shiny - NVD3 line chart output

これは、僕が理解している範囲で言えば、独自のoutputオブジェクトを定義してDataframeをjsに渡し、 nvd3.jsでグラフを記述するというやり方です。

なかなか面倒くさいですが、僕のアプリの場合rChartsよりサクサクとグラフが描画されましたし、 まぁ、こういうやり方とサンプルがあるよ、ということで。
詳しくは、上記コードをご覧ください。

繰り返しになりますが、基本的にはrChartsを使うのが最もカンタンだと思います。

参考文献

夕空のクライフイズム 1 (ビッグコミックス)

夕空のクライフイズム 1 (ビッグコミックス)

Fedora20に、Python3.4によるvirtualenvwrapperでデータ分析環境を構築する。

Fedora20にPython3.4をインストールし、virtualenvwrapper環境を構築します。 その後、virtualenv環境に分析系ライブラリを入れてみます。 メモし忘れたので、覚えている範囲で。 あくまで自分が試したことであり、ベストプラクティスではないのであしからず。

Python3.4のインストール

cd /usr/local/src

# 必要なパッケージをインストール
sudo yum -y install zlib-devel openssl openssl-devel readline-devel \
ncurses-devel sqlite-devel expat-devel bzip2-devel \
tcl-devel tk-devel gdbm-devel

# 最新安定版をダウンロード・展開
wget https://www.python.org/ftp/python/3.4.2/Python-3.4.2.tgz
tar zxvf Python-3.4.2.tgz

# ビルド&インストール。prefixはおこのみで。
# 既存のpythonと分けるため、make install ではなくaltinstall を行う
cd Python-3.4.1
./configure --prefix=/usr/local/python-3.4 --with-ssl
make
sudo make altinstall

—with-sslがないと、後々get pipするときにエラーが起きました。

Python3.4がインストールできたので、PATHを追加しましょう。 zshを使っているので、.zshrcに以下を記述。

export PATH=/usr/local/python-3.4/bin:$PATH
source .zshrc

Pythonがきちんと入っているか確認しましょう。

> python3.4 -V
Python 3.4.2 

OK.

pip のインストール

pipを入れる前に、一般ユーザのパスをroot ユーザのパスに引き継ぎ、 python3.4をrootで実行できるようにしましょう。

sudo visudo

で/etc/sudoersを編集し、

 - Defaults secure_path = /sbin:/bin:/usr/sbin:/usr/bin - See more at: http://3.1415.jp/pemvzrla#sthash.AbDgNo3l.dpuf
 + Defaults secure_path = /sbin:/bin:/usr/sbin:/usr/bin - See more at: http://3.1415.jp/pemvzrla#sthash.AbDgNo3l.dpuf
 + Defaults env_keep += "PATH"

とします。

python3.4をrootで実行できるか確認。

> sudo python3.4 -V
Python 3.4.2 

OKですね。pipをインストールしましょう。 実際はsetuptoolsをインストールしてしまったのですが、 事前に入れなくてもgetpip.pyが入れてくれるようです。

wget https://raw.github.com/pypa/pip/master/contrib/get-pip.py
sudo python3.4 get-pip.py

入ったか確認しましょう。

> which pip
/usr/local/python-3.4/bin/pip

入りました。

virtualenv & virtualenvwrapper

では、仮想環境用のライブラリをインストールしましょう。

pip install virtualenv virtualenvwrapper

virtualenvwrapperのために、.zshrcに下記設定を記述します。

if [ -f /usr/local/python-3.4/bin/virtualenvwrapper.sh ]; then
export WORKON_HOME=$HOME/.virtualenvs
export VIRTUALENVWRAPPER_PYTHON=/usr/local/python-3.4/bin/python3.4
export PROJECT_HOME=$HOME/Devel
source /usr/local/python-3.4/bin/virtualenvwrapper.sh
export PIP_RESPECT_VIRTUALENV=true
fi

ここ、あんまりpython-3.4って書きたくないのですが、 いい方法が思いつかず。

.zshrcを読み込み直せば、virtualenvwrapperが使えるようになっているはず。 データ分析用の仮想環境を構築します。名前は適当にstatで。

mkvirtualenv -p `which python3.4` stat
workon stat

仮想環境ができました!

データ分析用ライブラリをインストール

ipython notebook

pip install "ipython[notebook]"

こうすれば、notebookに必要なライブラリが一気にインストールできます。

numpy & pandas

pip install numpy pandas

あまり苦労せず入るはず。

matplotlib

曲者。まずは普通にインストールしようとします。

> pip install matplotlib
Collecting matplotlib
()
REQUIRED DEPENDENCIES AND EXTENSIONS
()
png: no [pkg-config information for ‘libpng’ could not be found]
()

REQUIEDのところに、libpngが無いと言われるので、

sudo yum install -y libpng libpng-devel

をインストール。

もう一度pipでインストールすると、

> pip install matplotlib

入りました。

scipy

すんなり入る気配の無いscipy...。いったいどんなエラーが出るんだ...

pip install scipy

...すんなり入りました。すごい!

スクレイピングはpyquery

sudo yum install -y libxslt-devel libxml2-devel
pip install pyquery

となるとrequestsも外せない

pip install requests

とりあえずここまで。

参考文献

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

歌劇「フェドラ」/愛さずにはいられぬこの思い

歌劇「フェドラ」/愛さずにはいられぬこの思い