2008年8月16日

オリンピック!

2008 Olympics Opening Ceremony [boston.com]

開幕してから一週間が経過しました。北京は程よい時差のようで、遅く帰ってもテレビで何かの種目を中継してくれています。 もちろん、生中継だと思って見ていたらYahoo!のトピックスなどに結果が掲載されていることも多々ありますが、それはご愛嬌ということで:-)

国際的なイベントの場合、普段はあまり気にならないことが気になります。 boston.com の記事の場合、閲覧環境によっては、いくつかのコメントは文字化けしています。まさか!と思って、繁体中国語と簡体中国語と切り替えて見たら正常(?)に表示されました。このWebサイトは主に英語圏の人向けでしょうから、あまり国際化などは考えていないのかもしれません。みんなでもっとUTF-8を使って欲しいものです。とはいえ、UTF-8を使えば万々歳かと言うとそういうわけでもありません。正規化できるとか、NFC/Dを使えばどうとかNFKC/Dを使えばどうとか、、、コンピューターで文字を扱う方法も奥が深いというか面倒臭いというか、、、なんだか仕事の話のようです。 テレビの花火もなんとかできる程に便利なコンピューターの技術ですが、細かいところまで気を配るとなると大変ですね。。。

特に、翻訳は人間が一つずつ行うしかありませんので、意識的に気をつけるなくてはいけません。 元素記号ですと、金属の金、銀、銅は次のように対応します。

  • 金: Au
  • 銀: Ag
  • 銅: Cu

ところが、メダルの場合は単語が異なります。まぁ元素記号と比較するのがナンセンスと言えばナンセンスですが。。。

  • 金: Gold
  • 銀: Silver
  • 銅: Bronze

Yahoo!ですら、去年は間違えていたようです。お祭り気分とはいえ、変なところで間違えないように気をつけて欲しいものです。

ともあれ、選手には頑張ってほしいですね!

2 件のコメント:

Unknown さんのコメント...

DB屋さん(俺は違うんだけどねw)からするとエンコードの問題はだいぶでかいです。
UTF-8を使うだけでDBのサイズが最悪1.5倍になるんで、物理設計するときになかなか悩ましいよ。

Shigeru さんのコメント...

データの保存領域を優先するか、データの処理時間を優先するか...悩ましい問題ですねぇ。
ただ、近年の傾向はHDDの性能向上が圧倒的なので、効率的に処理できる方法を採用する場合が多いのではないかなーと。

とはいえ、大量のユーザーが長期間に渡ってシステムを利用することを考えるとデータ量が膨大になるかんね。悩ましい。。。

早く、全てのOSの標準がユニコードになってくれると嬉しいのかなぁ。MacOSXは一部で変なコード体系を使っているけどねw