Airbnbは、入ってくるあらゆる旅行関連データの活用をさらに推し進める2つの新プロジェクトをオープンソース化する。
新興企業ながら宿泊施設仲介サービスで成功しているAirbnbは、サンフランシスコで米国時間6月4日に開催したエンジニアリングサミット「OpenAir 2015」で、自社開発したデータマイニング製品のうち、「Airflow」と「Aerosolve」をオープンソース化すると発表した。
Airflowは、データパイプラインを規模に応じてタイムリーにオーサリング、スケジューリング、モニタリングするワークフロー管理プラットフォームで、過去数年間で爆発的に成長したAirbnbにとっては不可欠の存在だ。
Airbnbによると、Airflowは社内のデータエンジニアリングチームにとって、多くのプロセスを効率化する役に立っているという。
だが、Airbnbの秘められた仕組みを探っている外部の人間にとって、さらに大きな機会はAerosolveにある。Aerosolveは、ビッグデータ処理エンジン「Apache Spark」向けの機械学習パッケージで、人々が複雑なデータセットを解釈する方法を改善するために設計された。
たとえば、Airbnbのエンジニアリングチームがブログ投稿でアピールしたところによると、Aerosolveを利用することで同社は、ある市場における宿泊料金と、その宿泊先に対して求められる要素との関係を認識して、より深く理解できるようになったという。
Airbnbのエンジニアたちは、さらに次のように説明している。
ある宿泊先に対する需要を予測するには多くの特性が関わってくるが、中でも重要なのが季節、その宿泊先ならではの特徴、そして価格だ。これらの特性は複雑に影響を与え合っており、解釈が難しい機械学習モデルが生成される可能性がある。そこでわれわれは、もっと容易に解釈や理解ができるようにしてくれる機械学習モデルを生み出すパッケージの開発に取りかかった。これはわれわれや開発者に加えて、当社のユーザーにとっても有益だ。解釈した内容を使って、需要がなぜ思ったよりも高くなる(または低くなる)のか、ホストに説明できる。
Aerosolveは、GitHubで提供が始まっている。
提供:Airbnb
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。