Fusion ioはMySQLのストレージディスクとして使っています。一般的なシステムと比較して10倍以上は速い。速くするところはわれわれのサービスにとって価値なので、お金をかけています。また、コンテンツ配信ネットワーク(Content Delivery Network:CDN)も最近使い始めました。特に一番最近問題になっていたのが海外への送信の遅さで、それを解決するためにAkamaiのCDNを使っています。今はすべて日本のひとつのデータセンターのシステムで海外展開しています。
ただ、今後米国などに進出したときには、日本と米国ではネットワークの遅延が頻繁に発生するので、そこについては米国にデータセンターを作るかも知れません。できるだけ日本で一括管理する方がコストが安くなるので、CDNを使って高速にできればと考えています。
逆にNewsPicksはいつユーザーが入ってくるかわかりませんし、機会損失を避けるためにクラウドでいつでもサーバを追加できるようにしています。ただ、NewsPicksについては自動化を進めていて、朝8時にプッシュ通知を送ると一気にアクセスがあるので、その前にサーバ台数を倍にして、落ち着いてきたら元に戻すといったことを自動化しています。そのため1~2名のスタッフで対応しています。
SPEEDAで情報を集める仕組みは、基本的にはすべてのデータをユーザベースのシステムに入れおり、APIは使っていません。データは各サプライヤーからファイル転送プロトコル(FTP)などでCVSでファイルをもらえるので、サプライヤーごとにユーザベースのデータ形式に合わせて変換してデータベースに格納します。頻度は基本的に1日1回です。サプライヤーごとに時間が違うため、どの時間にどのファイルを処理するということをすべて記述してやっています。
SPEEDAは性能重視、NewsPicksはトラフィック重視ということですね。あとはコストです。特殊な用途のサービスは基本的に高いので、自分たちで購入して導入した方が安いですし、SPEEDAは継続性のあるサービスなので自社で持つ方がいいというわけです。もちろん、セキュリティ対策として、攻撃を受けても問題がないようにはしていますし、こういうアクセスが来たときにはこういうアラートを上げるといったイベント管理システムは自分たちで作っています。
--情報産業は今後どうなっていくと思うか。
インターネットが普及することで、データを集めやすくなりました。たとえば会社の情報はXBRLというデータ形式で、システムで解析することを目的として提供されています。どんどん入手しやすくなるので、それに対してSPEEDAやNewsPicksがどう付加価値を生んでいくかを考えていかなければなりません。それは検索のさせ方や見せ方、それに加えて、そこでは手に入らないデータをどんどんかき集めてくることが重要だと思っています。
また、企業情報のオープンデータ化も将来的には当然起こると思います。ただ、システム化が進んでいない国はまだまだたくさんあって、例えば東南アジアの国では紙のデータしかなかったりします。PDFになっていたとしても、スキャンしたものしか提供されていなかったりします。
そういう国の情報を取ろうとすると、こういったシステムはまだまだ必要だと思います。ユーザベースはそこに付加価値を与えることで優位性を維持していきます。ただ、競合は絶対に出てくるので、技術的なアドバンテージを常に意識しています。