血統の森+はてな

旧はてなダイアリーの自動インポートによるアーカイブです。

OmegaTのHTMLファイルフィルタのメモ

ついったー上で私がボロカスに言ってるOmegaTですが、ぶっちゃけHTML解析が腐ってまして、デフォルトだとiframe要素のsrc属性とか、object要素のdata属性を読み込んでくれないので、直接ソースHTMLを書き換えないといけないというかなりお馬鹿な細工をしてました。


で、HTMLのフィルタを細工すればいいじゃん?って話なんですけど、設定ファイルの類いではなくコードを書き換えないといけないとorz

HOWTO:Creating a new file filter
http://www.omegat.org/ja/howtos/new_filter.html

まあ、javaのソースなんて読めるかよバーカバーカって感じですが、/src/org/omegat/filters3/xml/xhtml/XHTMLDialect.javaの112行目をこんな感じで細工してコンパイルしたり。(img要素のsrc属性とかぶってるじゃねーか、というツッコミをさておき。動けばええんや(ぁ)

defineIntactTags(new String[] { "style", "script", "object", "embed", "src", "data" });

というか公式に誰か文句を投げてください(ください)。