#! /usr/local/bin/perl ## ## 指定された HTML ファイルから、リンク部分文字列を抽出 ## quick hack なので取りこぼしあります (-_-) ## while(<>) { s/[\r\n]+/ /g; $buf .= $_; } while($buf =~ /([Aa][ \t]+[Hh][Rr][Ee][Ff]|[ \t]+[Ss][Rr][Cc])[ \t]*=[ \t]*/) { local($mae,$ato) = ( $`, $', ); if($ato =~ /^\"/) { $ato = $'; if($ato =~ /\"/) { $href = $`; $ato = $'; } else { $href = $ato; $ato = undef; } } else { if($ato =~ /[ \t>]/) { $href = $`; $ato = $'; } else { $href = $ato; $ato = undef; } } if($href !~ /^http:\/\//) { $href = './' . $href; } print "$href\n"; $buf = $ato; }