データマイニングハックス(仮)

東京都内のIT企業でデータ分析の仕事をしています。データマイニングを使って世界を良い方向へ変えていきたいです。起業準備中。各種オフ会なども積極的に参加したいと考えています。もし、よろしければお声掛けください。

2013-01-02から1日間の記事一覧

matchの実行

import re p=re.compile('[a-z]+') m=p.match("abc") print m

明日の自分は予測できるか

iPhone5を購入して約1カ月。 購入の翌日から、iPhone5のGPS機能を使って、自分の移動履歴を記録しています。 1か月たったのでデータをGoogleマップにインポートして見てみました。ふーん、って感じ。 今後、自分に関するあらゆるデータを記録して、それぞれ…

指定したURLのHTMLからタグを削除し形態素解析

#!/usr/bin/env python# -*- coding: utf-8 -*-import reimport urllib2fp = urllib2.urlopen('http://www.yahoo.co.jp’)html = fp.read()fp.close()data = htmlp = re.compile(r'<.*?>')res= p.sub('', data)f = open('text.txt', 'w')f.write(res)f.close(…

PythonからMecabの形態素解析を実行

#coding:utf-8import MeCabtagger = MeCab.Tagger("-Ochasen")result = tagger.parse("この記事はPythonの勉強メモです。")print result

Pythonで日本語を扱う

#!/usr/bin/env python# -*- coding: utf-8 -*-print 'こんばんは'

指定したURLのHTMLを取得し、テキストファイルに保存

import urllib2fp = urllib2.urlopen('http://www.yahoo.co.jp/')html = fp.read()fp.close()f = open('text.txt', 'w')f.write(html)f.close()

指定したURLのHTMLを取得

import urllib2fp = urllib2.urlopen('http://www.yahoo.co.jp/')html = fp.read()fp.close()print html

リンク先のURLを取得

import refrom mechanize import Browserbr = Browser()br.open('http://www.google.com/')br.title()for i in br.links():print i