HTML Tidyがあった

すみっこ

トラックバックありがとう。tidyコマンドをすっかり忘れていた。

HpricotがすべてのXPathを受け付けてくれない問題で悩んでいたから、Hpricotでのパーズ失敗したらfallbackで「tidy→rexml」でXPathを取ってみようというアプローチをとった。しかし、入力するHTMLによってtidyがエラーを出したらなにも出力してくれないからこの場合は使えない。やはりHpricotがXPathをきちんと受け付けてくれるのを待つしかないようだorz 暇ならパッチ書きたいのだが…