血統の森+はてな

旧はてなダイアリーの自動インポートによるアーカイブです。

言語タグを拡張する案に関するメモ

ソースは@_masaka氏のつぶやきより。ノリと勢いで勝手に解釈したものなので、間違いがあればどしどし指摘しちゃってください。

現在、2つの言語タグの拡張案がRFCのdraftとして提出されている模様。


前者のものは、新橋をローマ字で音訳(Transliteration)する際、ヘボン式(Hepburn)と訓令式(Kunrei)とで音訳(Transliteration)することができる。

<dt>新橋</dt>
<dd lang="ja-Latn-s-Hani-t-Hepburn">Shimbashi</dd><!--漢字表記の日本語を、ヘボン式でローマ字表記したもの-->
<dd lang="ja-Latn-s-Hani-t-Kunrei">Sinbasi<dd><!--漢字表記の日本語を、訓令式でローマ字表記したもの-->

という感じか。ものすごく学術的な感じ。


後者のものは音訳とか翻字とか翻訳とかひっくるめて、

<dt lang="en">Boys, be ambitious</dt>
<dd lang="ja-t-en">少年よ、大志を抱け</dd><!--和訳-->

という感じか。前者に比べ、わかりやすい?

ちなみにXML方面では

RFC 6067 - BCP 47 Extension U
とかいうのが2010年12月にRFCになっている。
UTS #35: Unicode Locale Data Markup LanguageUnicodeコンソーシアムによる仕様書あり。
Common Locale Data Repository - Wikipediaによれば、これはoooロケール情報などに使われるとかなんとか。

HTMLではここまで厳密なものは使わないと思います、たぶん(仕様を読む気がないともいう)。