本当に意味のある性能評価か--PCのベンチマークを再考する

David Bennett (AMD)

2014-12-28 12:00

 ネットが普及した社会で買い物をする際は、ブラウザとネット接続さえあれば、クレジットカード決済する前に簡単にオンライン検索することで、ほぼすべての疑問に対する答えを見つけることができます。PC市場では長年にわたり、ベンチマークによる性能評価が重要な役割を果たしてきました。

 しかし、実際にベンチマークは私たちに何を教えてくれるのでしょうか。また、どのベンチマークを信頼するべきなのでしょうか。

 PCの評価基準が時代とともに変化してきたことはよく知られています。長い間、プロセッサのクロック周波数は、PCを購入する際の主要な基準になっていました。

 しかし、クロック周波数が上昇を続け、多様なアーキテクチャが登場すると、クロック周波数とユーザーが体感する性能との相関関係は次第に弱まっていきました。さらに、電力消費が増え、クロック周波数が性能に直結しづらくなったことで、クロックスピードが性能の基準だった時代は終わりを告げました。

 代わりに、多くのメインストリームユーザーに対するアピールポイントになったのは、マイクロプロセッサのコア数でした。

 ベンチマークはそもそも、周波数やコア数による性能の変化を推定し、ハードウェアのエコシステムに属さない第三者による客観的な指針を提供するために開発されたものです。しかし、ソフトウェア企業が自身のベンチマークソフトウェアをスタンダードとして定着させるための策略をめぐらせ、ハードウェア企業が高スコアを得るための最適化を競うようになったことで、このモデルの欠陥が表面化しました。これにより、クロック周波数の性能基準としての信頼性は失われてしまったのです。

 プロセッサのアーキテクチャの進化に追い付いていないベンチマークもありますが、こうしたベンチマークは依然として意思決定者にとって、コンピュータの性能判断に欠かせない要素になっています。今日のPCユーザーの要望に応えるためには、グラフィックスプロセッシングユニット(GPU)やGPUの大規模並列演算処理能力など、これまで利用されていなかったリソースに注目しなければなりません。

 アクセラレーテッドプロセッシングユニット(APU)のような新しいプロセッサは、中央演算装置(CPU)やGPUと専用のビデオやオーディオのハードウェアをすべて備えています。これらが一体となってユーザーエクスペリエンスを高め、ワークロードを効率的に処理するため、わずかな消費電力で優れた性能を発揮するのです。

 現代のユーザーは充実したビジュアル体験を期待しており、コンピュータとの関わり方もこれまでとは変わりました。タッチパネルや音声、ジェスチャを通じてコンピュータと対話し、高品質のオーディオやビデオを消費、創造、統合、共有するようになっています。

 モニタの裏側で起きていることへの興味は薄れ、家庭でも職場でも、自分のシステムが優れたユーザーエクスペリエンスを提供してくれさえすればいいと考えるユーザーが増えていくでしょう。

 利用形態や求められるユーザーエクスペリエンスの劇的な変化を考慮すると、当然ベンチマークも、テクノロジやユーザーのニーズと期待を反映するよう変わってくるのが当然だと思われるでしょう。しかし残念なことに、旧態依然としたベンチマークも少なくありません。

 これらのベンチマークは、単一のタスクやシングルコアのCPUなど単一のアーキテクチャの処理性能を測定するため、システム性能の一面しかとらえていません。これだけでは、ユーザーが本当に知りたがっている使い勝手を評価することはできません。

 プロセッサの一面だけを測定したり、めったに使わないアプリケーションだけを取り上げたりするベンチマークに基づいてPCを選ぶのは、理にかなっているでしょうか? ディーラーで車を買うとき、検討するのは車窓のステッカーに表示された馬力だけですか?

 結局、ユーザー自身が自分にとって何が一番良いのかを決めるのです。理想を言えば、最も実践的なコンピュータの評価基準とは、それが自分のニーズに合うかどうかでしょう。シンプルなことです。

 ネットが普及した現在では、必ずしもPCの実践的な評価が現実的だとはいえないため、依然としてベンチマークは重要な役割を果たしています。現在、個人ユーザーやビジネスユーザーの一般的なワークロードに基づいてコンピューティングアーキテクチャをバランスよく提供すると思われるベンチマークが、3つあります。

 そのうち2つは、欧州を拠点とするPC業界団体であるFuturemarkが提供しています。Futuremarkが最近発表したベンチマークスイート「PCMark 8 v2」は、家庭用やビジネス用のPCの総合的なベンチマークとして、DellやHewlett-Packard、Lenovo、Microsoftなど最大手のPCメーカーや多くの半導体メーカーの協力を得て開発されました。

 システム性能の全体像を捉えるには、グラフィックス性能とGPU演算処理性能を測定するFuturemarkの「3DMark」、総合的なシステムの処理能力を測定するRightwareの「Basemark CL」などを追加するといいでしょう。

 現代の典型的なワークロードを取り上げ、ユーザーのニーズを正確に捉える優れたベンチマークを生み出すには、業界全体を巻き込まなければなりません。このことは、IDG ConnectのMartin Veitch氏をはじめとした業界の多くの専門家の一致した意見です(以下がVeitch氏の意見)。

適切な要素を測定し、同時にオープンかつ公平な立場に立つことのできる専門家が必要です。それがなければ、個人も企業も莫大なお金をムダに捨てることになるでしょう。これは民間セクターだけでなく、入札文書で選択が歪められ、一部のベンダーが締め出される事態が起きやすい政府や公共セクターにも当てはまります。全国規模か地域規模かにかかわらず、入札文書にFuturemarkを導入する組織が増えています。これには賛否両論があり、状況は常に流動していますが、はっきりしていることが一つあります。それは、ベンチマークは重要だということです。そして掛け金が高いゲームでは、信頼できるスコアラーが不可欠なのです。

 業界が一致団結しない限り、現実的なタスクを取り上げることはできず、一部のハードウェアベンダーが有利になるような偏ったベンチマークになりかねません。こういった例は以前もありました。あるハードウェアベンダーだけが勝者となることも起こり得ます。しかし、真の敗者となるのは、性能に関する偏った数値を提示され、それに基づいてお金を支払う消費者ではないでしょうか。

 業界が協力をすれば、消費者にも有益がもたらされます。欧州委員会は最近、政府のPC調達にPCMarkの使用を義務付ける決定をしました。これはFuturemarkだけでなく、正確にシステム性能を測定したいユーザーにとっても勝利を意味します。PCMarkが正確かつ典型的で偏向のないベンチマークであり、最も厳密な精査に耐えうるという評判を持っていることがわかれば、ユーザーも安心できるはずです。

 ベンチマークは購入決定プロセスでの貴重なツールであり、最終決定に大きな役割を果たします。しかし結局のところ、最も優れ、最も厳しいベンチマークは、ユーザー自身の判断だと言えるでしょう。

David Bennett
AMD アジア太平洋日本地域担当バイスプレジデント
オーストラリア、インド、インドネシア、日本、韓国、マレーシア、ニュージーランド、フィリピン、シンガポール、タイ、ベトナムなどでのAMDの事業展開、販売活動を指揮している。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]