データマイニングハックス(仮)

東京都内のIT企業でデータ分析の仕事をしています。データマイニングを使って世界を良い方向へ変えていきたいです。起業準備中。各種オフ会なども積極的に参加したいと考えています。もし、よろしければお声掛けください。

指定したURLのHTMLを取得し、テキストファイルに保存

import urllib2
fp = urllib2.urlopen('http://www.yahoo.co.jp/')
html = fp.read()
fp.close()
f = open('text.txt', 'w')
f.write(html)
f.close()