血統の森+はてな

旧はてなダイアリーの自動インポートによるアーカイブです。

競馬データの標準化的なもの

id:arikui:20060118:1137512320より。
昔、どっかにそれっぽいものがあった気がするけど、今はないみたいですね。いろいろあると思いますが、競馬データはその辺に転がってるんで、まずはその解析からじゃないですかね。つまり、

妥当かどうかさておき、ある程度HTMLでマークアップされているものがあるのだから、それらを比較検討して、必要があればXHTMLで再マークアップした上でXML化してしまう。

のが王道なのかな、という気がしなくもないですが。ただ、XHTMLをあえてかますSQLなんかのデータベースにやさしいかどうかはわかりませんし、XMLの妙味を損ねる可能性もなきにしもあらずと。目に見える形でのマークアップを目指すという意味で、わかりやすい完成形であるにはあるんですが。また、競馬データを標準的に扱えればうれしいことがあるかもしれませんが、何に使うのか、どこまでデータを収録するのかといったことも念頭に置くべきでしょう。