2014年9月20日土曜日

上場企業の株価取得

前回は上場企業をの株価データをすべてcsvファイルにするプログラムのhtmlを取得するところまで、作成しました。
今回はこれまで同様、html株価データの抜き出しと、csvファイルへの書き出しなのですが、
これらの2つは以前作成した1企業の株価の過去データを抜き出すものと同じやつを使います。
http://mosirobo.blogspot.jp/2014/09/html.html
http://mosirobo.blogspot.jp/2014/09/csv.html

なので、mainループを作成したので、そのプログラムを記載します。

上場しているすべての会社の株価をすべて取得するプログラムを作る

これまでのところでは1会社分の1日分のデータを取得するプログラム
http://mosirobo.blogspot.jp/2014/09/javahtml.html
http://mosirobo.blogspot.jp/2014/09/javacsv.html
http://mosirobo.blogspot.jp/2014/09/javahtml_4.html

と、1会社の過去の株価すべてを取得するプログラムの2つを作成しました。
http://mosirobo.blogspot.jp/2014/09/blog-post.html
http://mosirobo.blogspot.jp/2014/09/html.html
http://mosirobo.blogspot.jp/2014/09/csv.html
データを解析し、株ロボットを作るにはなるべく多くの会社の株価がほしいのですが、
全て手作業でやっていては非常に面倒です。
ですのでループを回して、すべての証券コードを入力していこうと思います。

2014年9月19日金曜日

javaでカンマの除去

これまでのところで一会社分の過去データをすべて読み込み、csvファイルにするところまで出来ました。
作成したプログラムではcsvファイルの区切りをタブで分けています。
(本来はカンマで区切るのが正解らしいのですが…)
ただ、数字が3桁を超えると千くらいにカンマが入力されてしまいます。
これはヤフーファイナンスの仕様上しょうがないことなのですが、邪魔なので除去しようと思います。

2014年9月13日土曜日

過去データの取得 -csvに格納

前回前々回でhtmlから株価の過去データを取得し、配列に格納することが出来ました。
今回はcsvファイルに入れていきます。
今回はその変数を配列に変更し、ループで回すだけです。

過去データの取得 -htmlの正規表現

前回に引き続き、株価の過去データを取得する続きです。
これまでは1日分のデータだったので、変数に入れて、それを引き出すだけでよかったのですが、
過去何年分のデータを入れるのに変数を使うと大量の変数が必要になります。
そこで、これまで変数を使用していたところを配列にして順次格納していこうと思います。

過去データすべてを取得する -urlからhtmlの取得

前回までのところで株価データを一日分取得することが出来ました。
http://mosirobo.blogspot.jp/2014/09/javahtml_4.html
http://mosirobo.blogspot.jp/2014/09/javahtml.html
http://mosirobo.blogspot.jp/2014/09/javahtml.html
しかし、一日のデータのみで今後の傾向をつかむことはできないと思いますので、
できればこれまでのデータが全て欲しいです。
ということでそうなるように改良していこうと思います。

2014年9月8日月曜日

JAVAでつまずいたこと-参照渡し

続きまして、つまずいたところは参照渡しです。
参照渡しに関しては、色々なページが有ったのですが、ちょっとわかりづらかったです。
最初はcのポインタの方がわかりやすいのではないかとも思ったのですが、
使いづらいこともないですね。

JAVAでつまずいたところ-文字列を加算

さて、データをwebから取得するプログラムをある程度のところまで書くことが出来ました。
今回は初心者の僕がネットで調べても基本的なこと過ぎて調べるのが大変だったものを紹介しようと思います。
まず最初によく分からなかったことは、
文字列の結合です。

JAVAで抜き出したデータをcsvファイルに格納する。

これまでのところでネットに繋ぎhtmlを取得し、必要な情報をhtmlから抜き出すことが出来ました。

ただ、データを文字列として持っていては非常に扱いにくいと思いますので、
csvファイルに格納していこうと思います。

2014年9月4日木曜日

JAVAでhtmlから必要な情報を抜き出す。

前回はurlからhtmlを入手しました。
今回は入手したhtmlから必要な情報を抜き出していきます。
htmlの情報はタグで囲まれており、
必要な情報は<td>2014年9月2日</td><td>148</td><td>151</td><td>148</td><td>151</td><td>18,000</td><td>151</td>の部分です。
この行を正規表現で抜き出し、それぞれを変数に格納していこうと思います。

ちなみに抜き出す部分はブラウザで言うと下の部分です。