Snowflakeは2月14日、年次カンファレンス「SNOWDAY JAPAN」を都内で開催した。基調講演やセッションでは、データアナリティクス、データエンジニアリング、データサイエンス、アプリケーション開発などをテーマにした同社の最新技術が数多く披露された。基調講演はハイブリッドで開催され、オンラインと会場を合わせて2600人以上が参加した。
基調講演にも登壇したSnowflake 製品担当上級副社長のChristian Kleinerman(クリスチャン・クライナーマン)氏に同社の技術革新や注力分野、今後の展望などを聞いた。
Snowflake 製品担当上級副社長のChristian Kleinerman氏
--Snowflakeの技術革新と最近の注力分野について教えてください。
Snowflakeが進めてきた技術革新の歴史は大きく3つの波に分けることができる。1つ目の波はデータウェアハウス(DWH)とビッグデータの世界における変革。2つ目はデータを使ったコラボレーションの変革。そして3つ目はアプリケーション開発の変革だ。
われわれはこれまで、単一のプロダクト、単一の処理エンジンを開発し、そこにさまざま機能を載せていくというアプローチをとってきた。技術革新の中では、パフォーマンスを継続的に向上させていくために投資を続けてきた。Snowflakeの課金モデルは仮想ウェアハウスを起動している時間をベースにしているため、クエリーへの応答が早くなれば、それだけサービスの経済性が高くなる。データガバナンスも非常に重視しており、セキュリティやプライバシーに関するポリシーの充実を図ってきた。
Snowflakeのプラットフォームの中核は「クロスクラウド」であり、グローバル規模の単一のシステムとして、お客さまはデータをどのリージョンのどのクラウドでも格納しておくことができる。これを可能にする技術が「Snowgrid」で、データやアプリケーションを共有・売買できる「Snowflakeマーケットプレイス」でも活用されている。
もう1つ重要なのが、Snowflake上でどのようにリソースが消費されているかといった可視性を高めることだ。リソースは足りなくても困るし、膨大でありすぎても管理が大変になる。リソース消費の詳細な情報を入手できるようにすることで、支出の最適化や投資対効果(ROI)の最大化が可能になる。
先ほど3つ目の波として紹介した開発手法の変革は、データパイプライン、機械学習モデル、アプリケーションなどの開発を簡素化する取り組みである。その戦略の核となっているのが開発者向けフレームワーク「Snowpark」で、Python、Java、Scala、SQLといったプログラミング言語に対応している。「Snowflake for Python」は2022年11月に一般提供を始めている。
また、アプリケーション開発者やデータサイエンティストに対するユーザーエクスペリエンス(UX)を高めるため導入したのが「Worksheets For Python」である。これによってSnowflake上での開発効率が格段に向上する。アラートとイベントに関する機能も追加した。データの品質に問題などがあるとそれを検出し、メールやメッセージで通知できる。他にも「Dynamic Tables」という技術も導入した。これはデータの変更やその差分を検知・理解して、自動的に最新のデータに更新するというもの。
2022年3月にはStreamlitを買収した。Pythonベースのウェブフレームワークで、ユーザーインターフェース(UI)に優れたアプリケーションを開発できる。今後はSnowflakeとの機能統合を進めていく。