• メールアドレス:
  • パスワード:

ウェブで利用される文字コード、UnicodeがASCIIを上回る--グーグルが明らかに

文:Stephen Shankland(CNET News.com)
翻訳校正:編集部
2008/05/07 12:08

 UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。また、UnicodeはASCIIだけでなく、Western Europeanもほぼ同時に追い越している。

Unicodeの増加 ※クリックすると図が拡大されます
Unicodeの増加
提供:Google

 Unicodeは多くの言語に対応した標準文字コード体系で、発音区別符号などを利用したローマ字なども扱っている。何十年も前に定められたASCIIコードは128文字あるいは256文字(ASCIIで128 文字、拡張ASCIIで256文字)しか表現できず、タイプライターの影響を受けた同文字コードの拡張は苦戦している。

 UnicodeがASCIIとWestern Europeanを追い越したのは12月で、双方が追い越された日は10日も違わなかった。

 Unicodeの動きについて、同氏は「Unicodeが他を単純に上回ったことよりも、これが起きたスピードが印象的だ」と述べている。

 GoogleはUnicodeを積極的に使用している。Googleはウェブサイトからのデータを処理する際、UnicodeでなければまずこれをUnicodeに変換する。これにより、言語をまたがった検索機能が向上するからだ。

 「Unicodeの利用が継続的に増えてきているため、Googleがカバーする多くの言語の処理が容易になる」とDavis氏は述べた。

 同氏はさらにGoogleがUnicode 5.1をサポートし始めたことも付け加えた。「このおかげでマラヤーラム語を話す人たちは、新しい文字を含んだ単語を検索することが可能になる」(Davis氏)

 ASCIIと比べたときのUnicodeの短所としては、ローマ字を格納するのに2倍のメモリ容量を必要とする点が上げられる。これはUnicodeがより多くの文字記号に対応するため、文字をより多くのバイト数で表現するためである。

この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ


関連記事
この記事を読み解くキーワード:
調査・レポート
ZDNet用語検索
企業情報
キーワード
関連ホワイトペーパー
関連製品

注目記事

企画特集

ZDNet Japan Green ITZDNet Japan Green IT
洞爺湖サミット目前!環境に配慮したGreen ITとは?
Techno ExchangeTechno Exchange
全体最適化で進めるCTCのグリーンIT戦略
「未来の、その先」をどう提言していくか「未来の、その先」をどう提言していくか
クラウドコンピューティングが導く新しいシステム
今知るべき仮想化情報今知るべき仮想化情報
インフラからアプリケーションまで、これを知らずに仮想化は語れない
DELL連載第4回〜「Microsoft System Center」DELL連載第4回〜「Microsoft System Center」
PowerEdgeサーバに最適な運用管理ソリューション後編
ブログ RSS Feed
洞爺湖と環境と私
裏方の裏方日記〜日々是広報 2008/05/20 12:57
プロがなぜ、二次創作を願うのか--Gacktが歌い、三浦建太郎が描く「がくっぽいど」
ミュージシャンのGacktさんと漫画家の三浦建太郎さんという2人のプロが参加しながらも、ユーザーが自由に作品を公開できるという歌声合成ソフト「がくっぽいど」。この開発経緯を開発元に聞いた。
iPhone、月額通信料金は7280円からに--ソフトバンクモバイルが発表
UPDATE ソフトバンクモバイルはiPhoneの通信料金プランを発表した。月額980円のホワイトプランに、データ定額制プラン「パケット定額フル」、「S!ベーシックパック(i)」をあわせ、月額7280円からとなる。
ジョブズ氏引退後のアップルを考える
カリスマ的な創業者が社を去った後、会社の業績が低迷する事例は、ハイテクだけでなく、さまざまな業界で見られる。アップルは「ジョブズ氏後」に備えているのかどうか検討する。