#! /usr/local/bin/perl
##
## 指定された HTML ファイルから、リンク部分文字列を抽出
## quick hack なので取りこぼしあります (-_-)
##
while(<>) {
s/[\r\n]+/ /g;
$buf .= $_;
}
while($buf =~ /([Aa][ \t]+[Hh][Rr][Ee][Ff]|[ \t]+[Ss][Rr][Cc])[ \t]*=[ \t]*/) {
local($mae,$ato) = ( $`, $', );
if($ato =~ /^\"/) {
$ato = $';
if($ato =~ /\"/) { $href = $`; $ato = $'; }
else { $href = $ato; $ato = undef; }
}
else {
if($ato =~ /[ \t>]/) { $href = $`; $ato = $'; }
else { $href = $ato; $ato = undef; }
}
if($href !~ /^http:\/\//) { $href = './' . $href; }
print "$href\n";
$buf = $ato;
}