データマイニングハックス(仮)

東京都内のIT企業でデータ分析の仕事をしています。データマイニングを使って世界を良い方向へ変えていきたいです。起業準備中。各種オフ会なども積極的に参加したいと考えています。もし、よろしければお声掛けください。

2chのスレッドを自動要約するプログラム

 2chのスレッドを自動要約するプログラムを作りました。現在、要約結果をブログに投稿する試験をしています。運用から10日ほど経ちまして、訪問者数は徐々に伸びている模様。

 以下、google アナリティクスの画面のキャプチャです。f:id:dmhacks:20130418000659p:plain

 今後、自動要約する際のテキストの取捨選択を判断する評価関数を洗練させ、自動で要約されて、かつ、「面白い!」と思えるテキストを生成していきたいと考えています。

 今はいかにして「面白さ」を定義して、プログラムに学習させるかについて考え中です。

 

 

記憶力を強くする ver.0 [更新日:2012/4/18]

記憶力を強くする―最新脳科学が語る記憶のしくみと鍛え方 (ブルーバックス)

記憶力を強くする―最新脳科学が語る記憶のしくみと鍛え方 (ブルーバックス)

記憶に自信のなかった私が世界記憶力選手権で8回優勝した最強のテクニック

記憶に自信のなかった私が世界記憶力選手権で8回優勝した最強のテクニック

記憶力を強くする方法について考えたり、調べたりした結果をまとめていくエントリーです。

今後、このエントリーに対して追記したり、修正をしたりしていきます。

創造力を強くする ver.0 [更新日:2012/4/18]

創造力の不思議―アイデアは脳のどこからやってくるのか

創造力の不思議―アイデアは脳のどこからやってくるのか

 

アイデアのつくり方

アイデアのつくり方

 創造力を強くする方法について考えたり、調べたりした結果をまとめていくエントリーです。

 今後、このエントリーに対して追記したり、修正をしたりしていきます。

Rに関するメモ書き

■パスを指定してcsvをデータフレームに変換

x<-read.csv("C:/Users/****/Desktop/motodata.csv", header=TRUE)

 

以下、x はデータフレームとする。

 

■データフレームに新しく列を追加
transform(x, new=0)

 

■データフレームの行数を取得
nrow(x)

 

■余計な列(ここでは列iranai)を削除

x$iranai<-NULL

ターミナルに文字が出力されない...。

 ターミナルでコマンドを実行しても文字が正しく出力されなくて、しばし困ってしまった。

 しかし、ターミナルの環境設定→設定→詳細→言語環境→文字エンコーディング、でUnicodeUTF-8)にしたらなおった。

 

 なんともつまらないことで時間を無駄にしてしまった・・・という訳でメモ。