データマイニングハックス(仮)

東京都内のIT企業でデータ分析の仕事をしています。データマイニングを使って世界を良い方向へ変えていきたいです。起業準備中。各種オフ会なども積極的に参加したいと考えています。もし、よろしければお声掛けください。

Python+Mecab

指定したURLのHTMLからタグを削除し形態素解析

#!/usr/bin/env python# -*- coding: utf-8 -*-import reimport urllib2fp = urllib2.urlopen('http://www.yahoo.co.jp’)html = fp.read()fp.close()data = htmlp = re.compile(r'<.*?>')res= p.sub('', data)f = open('text.txt', 'w')f.write(res)f.close(…

PythonからMecabの形態素解析を実行

#coding:utf-8import MeCabtagger = MeCab.Tagger("-Ochasen")result = tagger.parse("この記事はPythonの勉強メモです。")print result