血統の森+はてな

旧はてなダイアリーの自動インポートによるアーカイブです。

lang属性/日本語に関係する言語タグ の覚え書き のつけたし

日本語を公用語にしてる国って「日本」だけだから、英語みたいに地域で区別する必要はないって思ってた。でも、同じ日本でも、アイヌ語や沖縄の方言は、共通語とかけ離れてるから区別すべきだね。同様に、古語と現代語も区別すべきだ。

うーん、なんだか微妙。もちろん、ついったーなので発言した人の言いたいことが全部言い切れるとは思いませんが、元エントリーでわかりやすさのために端折った部分が、微妙に違う方向に解釈されている気がしないでもないので付け足しということで。


まず、日本語を公用語にしてる国って「日本」だけだから、英語みたいに地域で区別する必要はないって思ってた。とありますが、方言を言語コードで区別したい、という需要はあるのではないでしょうか。たとえば、標準語と関西弁を区別したい、とか。ここで、地域(それは都道府県かもしれませんし、旧国名かもしれません、あるいは〜地方というくくりかもしれません)という概念が出てくるわけですが、少なくとも、JIS X 0401(ISO 3166-2:JP)は言語タグのregion副タグとしては使えない、と本エントリーであえて書き記したのは、方言の問題がある(少なくとも私自身がわかるようにメモしておいた)という側面はあったり無かったり。


次に、同じ日本でも、アイヌ語や沖縄の方言は、共通語とかけ離れてるから区別すべきだね。ですが。アイヌ語と日本語は全く異なった言語です。例えるなら、日本語と英語ぐらい違ったものなので、区別されてしかるべきです。ところが、琉球語は日本語の方言なのか、日本語とは別の言語なのか、という問題に決着はついていません。(参考:琉球語 4 言語か方言か
また、2009年にされた朝日新聞の報道ですが、世界2500言語消滅危機、ユネスコ「日本は8語対象」 - 投錨備忘録これによると、八丈島や南西諸島の各方言も独立の言語と見なされとあります。でも、八丈島の言語タグはISO 639-3にはありません。その意味では、エスノローグ*1と整合性をとったために、ISO 639-3が少し歪んでいる面は否めないのかなと。


最後に、同様に、古語と現代語も区別すべきだ。とありますが、じゃあ、どこからどこまでが古語で、どこからが現代語なのか?という問題があります。以下年代とかはwikipediaから適当に拾ってきました。目安程度に考えてください。

  • 秋の田の かりほの庵の 苫をあらみ 我が衣手は 露にぬれつつ (天智天皇[626年-672年]御製/後撰集[951年頃?])
  • 春は、あけぼの。やうやう白くなりゆく山ぎは 少し明りて紫だちたる雲の細くたなびきたる。(清少納言[生没年不詳、10世紀後半-11世紀初期]/枕草子[996年頃?])
  • つれづれなるまゝに、日ぐらし硯に向かひて、心にうつりゆくよしなしごとをそこはかとなく書き付くれば、あやしうこそ物狂ほしけれ。(吉田兼好[1283年頃?-1352年以後]/徒然草[1330年頃?])
  • 広ク会議ヲ興シ万機公論ニ決スヘシ(五箇条の御誓文[1868年])
  • 国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。(川端康成[1899年-1972年]/雪国[1937年])

少し違った角度から見れば、「常用漢字・現代仮名遣い」と「正字正かな」*2とを区別したくても現状では'x'扱いするしかないとか、これまた問題があるわけで。


結局のところ、日本語を言語タグでもって細かく区別する必要性があるのかどうか?という問題が前提にあって、かつ、上手い具合に言語タグを活用できるシーンが少ない(筆者はあまり思い浮かばない)ために、「〜する必要がある」とか「〜すべきである」といった表現は筆者はいまいちしっくりきません。「〜することができる」程度に捉えてもらうのが適当だと思っています。