Microsoftは、企業間におけるデータ共有をより容易にして促進しようと取り組む中で、障害となりかねない点を把握してきた。中でも障害となりがちなのは、整合性のある標準化されたデータ共有の条件とライセンス契約が存在しない点だ。同社は米国時間7月23日、この空白の解消につながりそうな最初の一歩を踏み出した。
Microsoftは23日、3種類のデータ共有契約書の原案を公開した。今後数カ月、コミュニティーからこれらの原案に対するフィードバックや意見を求めていく。3案はそれぞれ、(個人間ではなく)企業間で生じる特定のデータ共有の場合を想定して策定されており、Creative Commons(CC)ライセンスの下で公開されている。これらの契約書の一部は、Microsoftが所有するコード共有サイトGitHubで公開されている。
このような契約書によって、企業同士が何カ月も何年も交渉してデータ共有の管理契約書を作成する必要性を低減できるとの考えをMicrosoftは示した。
Microsoftでコーポレートバイスプレジデント兼知的財産(IP)グループ主任法務顧問を務めるErich Andersen氏によると、同社は、こうしたデータ共有契約書にオープンソースライセンスに似た構造をもたらそうとしているのだという。Open Source Initiative(OSI)は、「Apache License」「BSD License」「MIT License」など、多くの承認済みライセンスを管理している。企業は、ソースコードをライセンス供与する際にこれらのライセンスを利用できる。
「オープンソースがコードで行ったことをデータで行おうとしている」(Andersen氏)
Microsoftは、このような契約書について、顧客データに関する考え方の統一を目指すOpen Data Initiative(ODI)の参加企業に役立つだろうと期待している。Microsoft、Adobe、SAPが2018年秋に設立したODIは、顧客関係管理(CRM)や基幹業務システム(ERP)、商取引、販売、製品の利用などのデータを、どのようなデバイスからでも利用できる単一のデータビューに統合できるようにすることで、企業が「顧客体験管理(CXM)を再考する」手段として考え出された。
Microsoftが公開した3種類のデータ共有契約書の原案は以下の通りだ。
- データのオープンな利用に関する契約(O-UDA):無制限に利用できるデータを所有している、あるいは配布できる権利を有する個人や企業による利用を意図した契約。「1対多」を想定した契約であり、プライバシーや機密保持に関する懸念のないデータの利用を意図したものだ。
- データのコンピューター的な利用に関する契約(C-UDA):データを提供する個人や組織が保有するものではない素材を含む可能性があるが、合法的に一般に利用可能な情報源から集められたと考えられるデータセットの利用を意図した契約。「コンピューター的な目的」(コンピューターによる分析のためのデータ利用を可能にするために必要な活動など)のみで一般利用が可能となる。「1対多」を想定した契約であり、プライバシーや機密保持に関する懸念のないデータの利用を意図したものだ。
- オープンなAIモデル開発のためのデータ利用契約(DUA-OAI):他の組織がAIモデルを訓練するためにデータを利用できるようにすることを目的に、組織によるデータ共有を管理するための条件を提示する契約。訓練されたモデルはオープンソースとなる。「1対1」を想定した契約であり、プライバシーや機密保持に関する懸念のある可能性のあるデータの共有を考慮したものだ。
Microsoftは先ごろ、データ共有に絡む問題を解消するための新たなサービス「Azure Data Share」(現在はプレビュー版)を発表している。Azure Data Shareは、FTPやウェブAPIを利用するよりも安全な方法でビッグデータセットを企業間で共有できるようにする。「Azure Blob Storage」や「Azure Data Lake Storage」とともに利用できる。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。