@CyberMameCANです。

突然、スクレイピングなるものを試してみたくなりました。

Nokogiriを最初考えていたのですが、
Hpricotも良さ気と評判なので、こちらを試してみることにしました。

RubyでHTMLとWebを操作するためのライブラリ、HpricotとWWW::Mechanize
参考にさせていただいたサイトです。ありがとうございます。

環境

Mac OS X ( Snow Leopard )
ruby 1.9.3p194

Hpricotのインストール

薩摩地方の地域時系列予報を取得

天気などを部分的に取得できたら嬉しいな、ということで気象庁のHPよりデータを取得したいと思います。
今回は練習なので出来るだけ簡単に済ませたいので、
地域時系列予報 : 鹿児島県より
一番最初に出てくる鹿児島県薩摩地方の地域時系列予報を取得します。

取得と切り取り処理は5行で終わってます。
凄いですね〜Hpricot。

実行

今回はリダイレクションでHTMLファイルとして出力しました。

出力されたhtmlです。
改行無いのはご愛嬌(^^;

ブラウザで開いてみると薩摩地方の地域時系列予報を取得できていました。
だいたい1時間くらいで出来ました。

もっと勉強すれば凄く強力なことが出来そうですね。
簡単に使えるようになりたいスキルです。


こういうブログもありました。

人気のあるブログ: