ここまでのサンプルは、局所的なデータであるが、例えば日射量は雲によって左右され、雲の流れは風速にも影響を受ける。そういった物理量も考慮する際には、人工衛星の取得しているデータを用いることも可能である。


データ分析環境は500円でも作れる
今回、東京電力が公開しているオープンデータと気象庁のデータを併せて使用することで、電力需給と気温や日照の関係を分析した。
例えばこの結果に人工衛星データを加えることで、より詳細に、あるいは全球レベルでのよりグローバルな解析も可能になる。
最後に、実はこれまでのビジュアライゼーションや機械学習による予測は、オープンデータにオープンソース(自由に使用可能な言語やライブラリ)を使用しており、解析環境自体も、月額500円程度で構築したサーバを使用したものである。
データの公開が進むにつれ、さまざまな方向からの解析が可能になっていくだろう。冒頭で述べたように、社内でのデータ共有を進めることや、省庁や研究所を中心として公開されているオープンデータを用いて新たなビジネスチャンスをつくることも可能である。
あるいは、データの使用方法や解析に関する知見やソフトウェアのソースコードは「オープン」に公開されているが、導入・保守・運用、あるいはカスタマイズを行うビジネスモデルも考えられる。
そういう意味で、既存の商用データやパッケージソフトと、オープンデータやオープンソースは共存可能であるし、必要に応じて使い分けることが、今後のビジネスにおいて重要になっていく。
入手可能なデータも公開されており、データを分析する環境自体も低コストで構築可能であるから、実際にデータ分析を試してみてはいかがであろうか。
データを使ったビジネスが盛んになるほど、データの共有も活発になり、オープンデータ、オープンソースを扱えることはもちろん、そこから価値を生み出せる人材の重要性は高まると筆者は考えている。
- 大友 翔一
- 大学院修了後、独立行政法人宇宙航空研究開発機構に勤務し、科学衛星データの運用・保守や並列計算機の構築を行った後、慶應義塾大学研究員、ソニー株式会社でのデータサイエンティストを経て、現職である東京電力ホールディングス株式会社に勤務。
- 著書に「[オープンデータ+QGIS]統計・防災・環境情報がひと目でわかる地図の作り方」(共著、2014年、技術評論社)などがある。
