日本オラクルは12月16日、年次イベント「Oracle CloudWorld 2022」で発表された「MySQL HeatWave Lakehouse」について国内の報道機関向けに説明会を開催した。
MySQL HeatWave Lakehouseは、CSVやParquetなどオブジェクトストレージ上に保存されたファイル形式のデータをSQLで分析可能にするサービス。「Amazon Aurora」「同Redshift」のバックアップデータにも対応する。数百テラバイト(TB)級のデータを高速に処理でき、現在はベータ版で提供されている。2023年前半に一般提供を開始する予定。
「MySQL HeatWave」は、トランザクション処理(OLTP)や分析処理(OLAP)、機械学習(ML)に対応するインメモリー型のクエリーアクセラレーターで、超並列アーキテクチャーによって高速な分析処理を可能にする。
MySQL HeatWaveの概要
MySQL HeatWave Lakehouseの概要
MySQLデータベースに保存されているOLTPデータのクエリーを実行し、オブジェクトストレージに保存されているデータと結合することも可能。OLTPデータに加えた変更はリアルタイムに更新され、クエリー実行結果に反映される仕組みになっている。
「MySQL Autopilot」は、機械学習技術を活用してMySQL HeatWaveの運用効率と処理性能を向上する機能であり、MySQL HeatWave Lakehouse向けに多数の新しい機能が追加されている。
例えば、ファイルデータとデータベース内のデータ型のマッピングを自動的に推論したり、オブジェクトストレージの性能に合わせて処理速度を最適化したり、データロードにかかる時間を予測してデータロードのためのスクリプトを自動生成したりする機能がある。クエリー実行時にも継続的に統計情報を収集し、将来の実行計画の改良に活用しているという。
適切なMySQLサーバーのインスタンスのタイプを推奨する「Auto Shape Prediction」、OLTP向けに持続的でより高性能なスループットを提供する「Auto Thread Pooling」などの機能も紹介された。
MySQL Autopilotの概要
MySQL HeatWaveは、「Oracle Cloud Infrastructure」(OCI)だけでなく、「Amazon Web Services」(AWS)と「Microsoft Azure」でも利用可能になっている。「Oracle Dedicated Region Cloud@Customer」を使用することで、オンプレミス環境でも導入できる。
また、MySQLの機械学習プラットフォームとして「HeatWave AutoML」がある。機械学習の工程が自動化されており、外部にデータを出さずにHeatWave上で処理可能であるといった特徴がある。実業務に活用できる説明可能性をサポートし、高性能・高精度なモデル生成を誰でも実行できるインターフェースを搭載するとしている。パラメーターやアルゴリズムの選択などの専門的な知識は不要で、トレーニングの高速化によって迅速なモデル生成を支援する。
HeatWave AutoMLの概要