#4884

文字列加工遊び


ちょっとした雑用でサイトの情報をローカルで横断的に処理する必要性が出てきて、
何か良いツールはないかなと思って探していたら
』というプログラミング言語が見つかりました。
とりあえず何も分からないままにインストール。
Rubyで面白いなと思ったのは、ライブラリなどを包括して管理できる『Gem』というもの。
これも一緒にインストールしておくと、
コマンドプロンプトから『Gem (ライブラリ名)』と叩くだけで、
いちいちWebサイトに行かなくてもインストールすることができます。これは便利。
今回試したのは『Nokogiri』というライブラリで、
ネット上のWebサイトのHTMLなどを部分的に取得できるというものです。
いわゆるWebスクレイピングというやつで、
個人的には2008~2009年のデスクトップカスタムでは似たような技術にお世話になりました。
これを応用すればサイトに行かずとも必要最小限の情報を入手することができます。
RSSを配信していないような小さなサイトや、
ある数字だけ見るために巡廻しているようなサイトの必要な情報を
抜き出して一元管理したりするのに使えそうです。

といっても結局今回はこれっきりということだったので
作業自体はプログラムを使わず、妥協してExcelゴリ押しで解決してしまったのですが。
しかし考えてみれば、せっかく特設サイトをきっかけに少しずつWebプログラミングに触れているのに
ローカル作業は相変わらずのゴリ押しだったなと。
例えば未だに続いている音楽再生数統計もこういうものを駆使すれば自動化できるんだろうか?
そういえばこのブログはローカル用のアーカイブを未だに手作業で保存し続けていますが、
まさにこの『Nokogiri』を使えば自動化できるのでは……?
ちょっと時間が空いたときにいじってみたいところです。