DWHの課題を一挙に解決する
真のクラウド型DWH、
Snowflakeとは何者か

ビッグデータ活用の重要性が指摘されて久しい。しかし、日本企業は欧米企業と比較し、ビッグデータ活用の取り組みが遅れていると言われている。自社でシステムエンジニアを擁することが少ない日本企業にとって、データウェアハウス(DWH)の運用・管理はハードルが高い。導入検証をしたものの、その効果測定ができず頓挫しているケースも少なくない。では、DWHを選択する際には何を基準にすべきなのか。2019年11月に満を持して日本法人を設立したSnowflakeで、日本法人の代表を務める東條英俊氏とソリューションアーキテクトを務める本橋峰明氏に話を聞いた。

データドリブン経営成功の可否は企業の存続を左右する

 今、多くの企業は、データ分析から得られた洞察を基にビジネスを駆動する、「データドリブン経営」への転換を図っている。IoT(Internet of Things)やウェブログなど、さまざまなリソースからデータを収集し、そこから得られる知見を活用して新たなビジネスモデルを構築する。こうした動きは、グローバル規模で加速している。

 例えば、車両に取り付けたセンサーデータを分析し、ドライビングデータを測定することで自動運転の開発に役立てたり、生産設備の稼働データを基に故障予兆を検知したりする施策は活発化している。

日本法人の代表を務める東條英俊氏
日本法人の代表を務める東條英俊氏

 しかし、日本国内を見ると、ビッグデータを活用してビジネスを加速させ、競争力を強化している企業は少数だ。Snowflake日本法人で代表を務める東條英俊氏は、その背景について次のように指摘する。

 「収集したデータがサイロ化し、最適な分析ができないケースは多々あります。また、ビッグデータを蓄積するデータウェアハウス(以下、DWH)の運用・管理にも手間とコストが掛かり過ぎるといった課題があります」(同氏)

 そうした課題の解決策として注目されているのが、「クラウド対応DWH」だ。しかし、Snowflake日本法人でソリューションアーキテクトを務める本橋峰明氏は、「クラウド対応DWHをうたう製品やサービスは複数ありますが、その選定には注意が必要です」と警鐘を鳴らす。

 「クラウド対応DWHと称するほとんどの製品は、いずれもクラウドネイティブのDWHとは言えません。なぜなら、これらDWHのアーキテクチャーは、15年以上前のデータベースの思想に基づいて設計されているからです。オンプレミスで稼働していたDWHをクラウドにシフトしただけであれば、現在お客さまが抱える課題を何一つ解決できません」(同氏)

 保守・運用コストの削減やコンピューター・リソースの拡張性などの観点から、クラウド対応DWHを選択する企業は多い。しかし、いざ運用開始すると、オンプレミス環境よりもコスト高になったり、コンピューター・リソースを自由に増減できなかったりといった課題に直面するケースも少なくない。

 本橋氏は「Snowflakeであれば、こうした課題は一気に解決します」と胸を張る。

コンピュートとストレージを独立したリソースとして分離

 2012年に3人のデータベース・エキスパートがシリコンバレーで設立したSnowflakeは、クラウドで利用できるSQLベースのフルマネージドDWHだ。クラウド技術をベースに、ゼロスクラッチで開発した独自アーキテクチャーを採用しており、膨大なワークロードに対応する高速処理が特徴。現在は1日に3億クエリーを処理し、最大テーブル行数は68兆行に及ぶ。シングルテナントの最大データボリュームは55PB(ペタバイト)で、同テナントの最大実行ユーザー数は1万に上る。

日本法人でソリューションアーキテクトを務める本橋峰明氏
日本法人でソリューションアーキテクトを務める本橋峰明氏

 既に海外では4,000以上の顧客企業を擁している。日本法人の設立は、2019年11月だが、製造業や調査会社などでも既に導入されている。「先行導入しているグローバルな日本企業と合わせると、あらゆる業種・業態で活用していただいている」(東條氏)という。

 Snowflakeの最大の特徴は、コンピュートとストレージでリソースを完全に分離した独自のアーキテクチャーで、複数のワークロードを大規模並列処理できることだ。独自のマルチクラスター共有データアーキテクチャーが、複数のコンピュートクラスターを構成することを可能にしている。このため、多数のユーザーから同時にリクエスト処理があっても、遅延や中断が発生せず、パフォーマンスを低下させることがない。

 また、データを1つのストレージで一元管理しながら、個別のアプリケーション単位でコンピュートクラスターを用意し、DWHを構成できるのもSnowflakeならではの優位性だ。


※クリックすると拡大画像が見られます

 オンプレミス型DWHでは ピーク時のパフォーマンスを予測してキャパシティープランニングをする必要がある。指数関数的にデータ量が増加する現在では、ワークロード情報の収集やサイジング、評価・チューニングが困難だ。また、最大負荷を想定してハードウェアを購入するので、そのコストも膨大になる。

 さらにクラウド対応DWHであっても、コンピュートリソースとストレージを自由に拡張することが難しく、使用していない間も稼働せざるを得なかったり、オンプレミス型DWHとほぼ変わらない運用が必要となるものも多い。

 しかし、Snowflakeであれば、こうした手間やコストは一切不要だ。SnowflakeはAmazon Web Services(AWS)、Microsoft Azure、Google Cloud Platform(GCP)いずれのパブリッククラウド基盤でもサービス提供されており、インフラ部分は全てSnowflake側が運用・管理する。そのため、調達・保守・運用にかかるコストを大幅に削減できる。クラウド技術を基盤としているので拡張性が高く、同時処理の需要に応じた自動スケーリングも可能だ。例えば、処理が集中する時間帯はコンピュートリソースを増やし、少ないときは減らすといった調整も透過的に実行できる。また、クラウドをまたがってデータをレプリケーションすることもできるため、特定のクラウドプロバイダーに障害があった場合でもサービスを継続させることができる。


※クリックすると拡大画像が見られます

 東條氏は、「オンプレミス環境では、ハード(リソース)の調達に1カ月かかるケースもありました。しかし、Snowflakeであれば、スケールアップ/アウトは自由自在です。キャパシティーが必要な場合でも、一瞬で拡張できる。既存のオンプレミス環境と比較し、管理コストを3分の2まで削減した顧客事例もあります」と説明する。

 もう1つ、Snowflakeの優位性として挙げられるのが、強固なエコシステムである。テクノロジーパートナーとのエコシステムでは、ETL(抽出/変換/格納)・ELT(抽出/格納/変換)やBI(ビジネスインテリジェンス)、ML(機械学習)といったツールとネイティブに接続し、データ分析に関わる全てのワークロードのパフォーマンスを最適化する。東條氏は「お客様が現在利用しているツールは、そのまま利用できます」と説明する。


※クリックすると拡大画像が見られます

 課金体系も独自性がある。ユーザーがリソースを利用している時間を秒単位で計算し、ノードのサイズに応じて課金される仕組みだ。稼働した時間に対して課金が発生し、処理が発生せず、稼働がない場合には自動的に停止するので、費用が発生することはない。

老舗銀行もベンチャー・プラットフォーマーも導入

 Snowflakeの優位性は先行企業の導入事例からもうかがえる。

 例えば、米国の金融大手「Capital One」は、Snowflakeで10以上の基幹業務のデータを統合してDWHを構築した。同行では数千人のユーザーと数百TBのデータを抱えており、スキーマ内にある20万以上のテーブルを対象に、複雑なクエリーが発生していた。そのため、クエリーの遅延やユーザーエクスペリエンスの低下を招いていたという。さらに金融機関であることから、セキュリティおよびリスク要件を満たすために「シングルテナントソリューション」であることも絶対条件だった。

 同行はSnowflakeを導入したことで、こうした課題を一挙に解決した。ワークロードを分離したことで、パフォーマンスは4~6倍に向上した。マルチクラスターによるスケールアウトが可能なので、同時実行性の課題も解消されたという。なお、同行ではディザスタリカバリー環境を構築し、1週間単位で切り替え運用を実施しているとのことだ。

 また、英国のフードデリバリーDeliverooは、顧客の行動の分析と市場動向を把握し、リアルタイムでの意思決定を実現している。同社では週末が繁忙期で月曜朝にETLと分析の処理でワークロードが急増する課題を抱えていた。そのため、経営陣は週末の結果を見ることがでず、アナリストは翌週の計画が立てられなかったという。

 Snowflakeを導入したことで同社は、ETLクラスターをスケールアップして週末のデータを処理したり、BIクラスターをスケールアウトしたりして、アナリストユーザーの数とアクティビティーの急増にも対応できるようになった。なお、現在はリアルタイムの物流アルゴリズムを利用し、配送の効率化に役立てる施策も実施している。本橋氏は「ミッションクリティカルな基幹システムから、成長著しいベンチャーのプラットフォームまで、あらゆるニーズに対応できるのがSnowflakeの最大の強みです」と力説する。

 Snowflakeの将来は、クラウド型フルマネージドDWHの枠にとどまらない。東條氏は今後、Snowflakeがクラウドデータプラットフォームとして活用されることに期待を寄せる。また、Snowflakeユーザー同士がデータ共有/交換できる「データエクスチェンジ」も提供している。ユーザー同士のエコシステムが確立すれば、Snowflakeユーザーである価値をさらに享受できる。

 「多くのお客さまは、現在のデータ量を基準にデータプラットフォームやデータレイクの構築を考えていらっしゃいます。しかし、現時点で分析できる状況であっても、数年後にはデータ量が爆発的に増加し、DWHの機能やキャパシティーが追いつかなくなるのは明らかです。また、今後は第三者とのデータ交換やデータ共有など、さらに一歩進んだデータ活用が求められます。ぜひ、5~10年のスパンでデータドリブン経営を鳥瞰し、真のクラウドネイティブなDWHを選択していただきたいです」(東條氏)

 最後に本橋氏は、「クラウド移行の気運が高まっている日本ですが、『Snowflakeは海外のベンチャーだから不安』という声もあるかもしれません。グローバル企業での導入事例だけでなく、日本で導入した実績もあります。是非、トライアルでSnowflakeを体験してほしいです。われわれの国内販売パートナーは、日本企業が抱えるデータ活用課題を熟知しており、支援体制は十分整っています」とその優位性を訴えた。

インフォメーション

提供:Snowflake Inc
[PR]企画・制作 朝日インタラクティブ株式会社 営業部  掲載内容有効期限:2020年10月31日
このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]