たぶんHTMLでもない
SGMLとして扱えない文書なのに、HTMLを利用する意義ってなんでしょう? それが「Web標準」とかいう、変な意識だからですか?
文脈をぶった切って無理やりパロってみたけど、こう考えるとDTDを用意する意味って無いよね。ずっとHTML5が公式にDTDなりschemaを公式に用意する気がない*1理由の一端が分かった気分になった(今更感もあるけど)。
schemaが存在しないと言うことは、少なくとも古典的な方法でparserがMarkup Languageをvalidかどうか判定する術がないはず。そして、XMLで言うところのwell-formedであることですら難しい(text/htmlなら、そもそもwell-formedという概念がないけれども)から、validとなることはあり得ない。仮にapplication/xhtml+xmlとしてparserに解析させたとしても、well-formedで無いと怒られるところから始まる訳なので。
だから、DTDやschemaが存在しないという点においてHTML5は古典的なSGMLでもXMLでもない。少なくとも、公式にはそういう範疇には入らないだろうし、Relationship to XML and SGMLなんて項目は今のところ無い*2。その代わり、web browserはきちんと描画してくれるだろう。
たとえschemaが存在したとしても、HTML5の仕様を全て満たすような完璧なschema言語は今のところないと思われる。
ただ、文章をタグで意味付けしたいだけなのに、どうしてうまくいかないのでしょうか…。
読み直したら、結構おかしなことを言ってるという罠。
*1:Ian Hicksonは必要なら自分でDTDを書いてねと考えてるみたい http://lists.whatwg.org/htdig.cgi/help-whatwg.org/2009-March/000192.html
*2:http://www.w3.org/TR/2009/WD-html5-20090212/introduction.html