データマイニングハックス(仮)

東京都内のIT企業でデータ分析の仕事をしています。データマイニングを使って世界を良い方向へ変えていきたいです。起業準備中。各種オフ会なども積極的に参加したいと考えています。もし、よろしければお声掛けください。

unicodeの日本語文字列で正規表現

import re

# encoding: shift_jis

p=re.match(u"[あ-ん]+", u"おはよう御座います")

print p.group() #「おはよう」と返る