TeXShopのSolarize_darkカラースキーマ

論文やスライドはTeXで書いてます。

TeXShop、そのままでは味気ないのでカラーを変更しましょう。 世に知られている多くのカラースキーマのうち、特に有名なSolarize_darkに変更するスクリプトを書いたので紹介します。 なお、動作確認はMacOSX mavericksのみです。

Solarized dark color scheme for TeXShop

これをダウンロードしてきて、

$ sh solarize_dark.sh

元に戻したいときは、

$ sh texshop_color_default.sh

これで戻ります。

参考

[改訂第6版] LaTeX2ε美文書作成入門

[改訂第6版] LaTeX2ε美文書作成入門

平塚らいてう評論集 (岩波文庫)

平塚らいてう評論集 (岩波文庫)

Python3 で MeCab を使う

他のブログにも情報が載ってるけどメモ代わりに。

友人の研究を手伝う可能性が出てきたので、OSXMeCabを入れましょう。 Pythonのバージョンは以下です。

$ python
Python 3.4.2 (default, Oct 19 2014, 17:52:17)
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.51)] on darwin
Type "help", "copyright", "credits" or "license" for more information.

Homebrewならサクッと入りますね。

$ brew install mecab mecab-ipadic

MeCab が入ったので、mecab-pythonをPython3に入れましょう。

$ pip install https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz

()
IndexError: list index out of range
----------------------------------------
Cleaning up...

あれ、入らない。

どうやらsetup.pyを書き換える必要があるようです。 tarballをソースからwgetして書き換えましょう。

$ wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
$ tar -zxvf mecab-python-0.996.tar.gz
$ cd mecab-python-0.996
$ vim setup.py

変更点はこのように。 参考→ Python3でMeCab

def cmd2(str):  
    return string.split (cmd1(str))  
#を以下に変更  
def cmd2(str):  
    return cmd1(str).split()  

変更後に、pipでインストール。

$ pip install -e .

入ったかな

$ pip freeze
mecab-python==0.996
$ python -c "import MeCab

入ったようです。

参考

入門 自然言語処理

入門 自然言語処理

pandasとggplotで回帰分析

Python版ggplotの練習です。

コードと元データはこちらを参考にしました。

ITエンジニアのためのデータサイエンティスト養成講座(6):回帰分析I:回帰分析って何? から、最小二乗法、モデル評価、妥当性検討の実際まで (1/3) - @IT

import pandas as pd
import numpy as np
from ggplot import *

# データを格納
df=pd.read_csv("children_data2005_08_130819.csv", encoding='shift-jis', skiprows=2, header=-1)
df=df[np.isfinite(df[9])] # 欠損したデータは除く
df=df[np.isfinite(df[10])] # 欠損したデータは除く

# 身長と体重をプロット
g=ggplot(aes("height","weight"), data=df[[9,10]])+geom_point()
g

f:id:ksmzn:20140905181346p:plain

ggplotでプロットできました。

# 最小二乗法
model=pd.ols(x=height, y=weight, intercept=True)
model

f:id:ksmzn:20140905180829p:plain

# 回帰直線をプロット
g+geom_line(data=pd.DataFrame({"height":model.x["x"], "weight":model.y_fitted}), color="green”)

f:id:ksmzn:20140905180731p:plain

# 「体重は身長の3乗に比例する」というモデル
model2=pd.ols(x=height**3, y=weight, intercept=True)
model2

f:id:ksmzn:20140905180825p:plain

ggplot(aes("x","y"), data=pd.DataFrame({"x":model2.x["x"], "y":model2.y}))+\
    geom_point()+\
    geom_line(data=pd.DataFrame({"x":model2.x["x"], "y":model2.y_fitted}),color="red”)

f:id:ksmzn:20140905180744p:plain

ggplotで図を重ねるときにハマりやすいポイントとしては、 ggplot(aes=(“”,””), data=~)で指定したaesの文字列と、 geom_line(data~)ので指定したデータフレームのヘッダーが一致していないといけないということです。

過去記事

Python版ggplotで日本語を使う - Dimension Planet Adventure 最終章 最終話『栄光なる未来』 Python3.4にPython版ggplotをインストールしたい - Dimension Planet Adventure 最終章 最終話『栄光なる未来』

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理