ウェブで利用される文字コード、UnicodeがASCIIを上回る--グーグルが明らかに

文:Stephen Shankland(CNET News.com) 翻訳校正:編集部

2008-05-07 12:08

 UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。また、UnicodeはASCIIだけでなく、Western Europeanもほぼ同時に追い越している。

Unicodeの増加 ※クリックすると図が拡大されます
Unicodeの増加
提供:Google

 Unicodeは多くの言語に対応した標準文字コード体系で、発音区別符号などを利用したローマ字なども扱っている。何十年も前に定められたASCIIコードは128文字あるいは256文字(ASCIIで128 文字、拡張ASCIIで256文字)しか表現できず、タイプライターの影響を受けた同文字コードの拡張は苦戦している。

 UnicodeがASCIIとWestern Europeanを追い越したのは12月で、双方が追い越された日は10日も違わなかった。

 Unicodeの動きについて、同氏は「Unicodeが他を単純に上回ったことよりも、これが起きたスピードが印象的だ」と述べている。

 GoogleはUnicodeを積極的に使用している。Googleはウェブサイトからのデータを処理する際、UnicodeでなければまずこれをUnicodeに変換する。これにより、言語をまたがった検索機能が向上するからだ。

 「Unicodeの利用が継続的に増えてきているため、Googleがカバーする多くの言語の処理が容易になる」とDavis氏は述べた。

 同氏はさらにGoogleがUnicode 5.1をサポートし始めたことも付け加えた。「このおかげでマラヤーラム語を話す人たちは、新しい文字を含んだ単語を検索することが可能になる」(Davis氏)

 ASCIIと比べたときのUnicodeの短所としては、ローマ字を格納するのに2倍のメモリ容量を必要とする点が上げられる。これはUnicodeがより多くの文字記号に対応するため、文字をより多くのバイト数で表現するためである。

この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. セキュリティ

    KADOKAWAらの事例に学ぶ、2024年サイバー攻撃の傾向と対策

  2. セキュリティ

    MDMのよくある“12の悩み”を解決!Apple製品のMDMに「Jamf」を選ぶべき理由を教えます

  3. ビジネスアプリケーション

    CIO必見、経営層に響く「AIエージェント導入」説明--7つの役職別シナリオで解説

  4. セキュリティ

    セキュリティ担当者に贈る、従業員のリテラシーが測れる「情報セキュリティ理解度チェックテスト」

  5. セキュリティ

    「100人100通りの働き方」を目指すサイボウズが、従業員選択制のもとでMacを導入する真の価値

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]