PHPやるお

うおおおおおおおおお!

スクレイピングの続きをいろいろ

参考になったサイト

ウェブ上の必要なデータを抽出する方法-スクレイピング- | PHPサンプル実験室
1ft-seabass.jp.MEMO - PHPでpreg_match関数、URLの比較してUnknown modifier ‘/’ inエラーが出てしまう時の原因と対処法
正規表現:正しいURLかどうか調べる - phpspot

この記事が、とくに参考になった。
HTML からリンクのタイトルと URL を PHP Simple HTML DOM Parser を使って取得する | ウェブル

PHP Simple HTML DOM Parserを利用して、
idがhogeのなかにある3番目のa属性からURLを抽出したいときは……

$var = $html->find( '#hoge', 0)->find( 'a', 2 )->href;

こうかけば良い。1番目なら0、2番目なら1、そして3番目が2。配列のあれと同じ。 url抽出は、いろんなことに応用できるので覚えておきたい。