はじめに
「元・東大理系弁護士が解説!法務担当者向けAI・ディープラーニングの基礎知識」では、「AIは、具体的に何を計算しているのか?」という観点から、AI技術の基礎を解説しました。従来のソフトウェア開発が演繹的に行われるのと異なり、AI開発は、随分と帰納的、経験的に行われていることがわかりました。
では、そのようなAI開発の特性は、従来型のソフトウェア開発との比較において、具体的にどのような点に特徴となって現れ、そして、AIの開発や利用に関する契約書を交わす際に、これらの特徴をどのように考慮し反映させたらいいのでしょうか?
もし、このような点について理解が曖昧・不十分なまま契約書の作成・リーガルチェックを行っているならば、AI開発プロジェクトやAIを利用したビジネスにおけるリーガルリスクの洗い出し、評価、対応策等、リーガルリスクマネジメントが不十分になるおそれがあります。
そこで、この記事では、
経済産業省・2018年「AI・データの利用に関する契約ガイドライン」(以下「契約ガイドライン」といいます。)
と、
経済産業省・特許庁・2021年「研究開発型スタートアップと事業会社のオープンイノベーション促進のためのモデル契約書ver1.0」のモデル契約書(AI編)(以下「2021年モデル契約書といいます。)
を参考に、AI開発の特徴、契約ガイドラインの考え方、2021年モデル契約書のポイントを、わかりやすく解説します。
読者の方達が、AI開発の特徴、AI開発プロジェクトやAIを利用したビジネスに関する契約書の作成・リーガルチェックのポイントを理解し、自社のリーガルリスクマネジメントの質を向上させるに当たり、お役立てれば幸いです。
なお、この記事ではわかりやすさを優先して記載しています。必ず原典である契約ガイドラインや2021年モデル契約書に当たってご確認ください。
また、契約書作成・リーガルチェック一般(非専門家による失敗例の紹介を含む。)については、「トラブル未然防止だけじゃない!リスクマネジメントから事業価値の向上まで。参議院法制局で法律案を作っていた企業法務弁護士による契約書作成・リーガルチェック(レビュー)」をご覧ください。
AI技術を利用したソフトウェア開発の特徴
まずは、AI技術を利用したソフトウェア開発の特徴と契約において特に留意すべき点を確認しましょう。主なものを整理すると、次のようになります(契約ガイドライン18ページ以下参照)。
- 学習済みモデルの内容・性能等が契約締結時に不明瞭な場合が多いこと
- 事前の性能保証が性質上困難であること
- 求められる精度等の学習済みモデルができあがるか事前予測することが困難(開発対象確定の困難さ)
- 未知の入力データに対する挙動が不明確で性能保証が困難(性能確定・保証の困難さ)
- 事後的な検証等が困難であること
- 不具合があっても原因(学習用データセットの問題か、ハイパーパラメータ(人の手で設定するパラメータ)の問題か、プログラムのバグか等)の切り分けが困難なときもあること
- (事前予測・事後検証が困難であることから)探索的な開発がなじむ。
- 事前の性能保証が性質上困難であること
- 学習済みモデルの性能等が学習用データセットによって左右されること(統計的な性質を利用していることによる原理的な限界)
くだけた表現をしますと、「やってみなければどんなものができるかわからないし、できあがったものの性能が期待するほど良くなかったとしても原因を解明してブラッシュアップすることが難しいこともある、だから探索的な開発が良さそうですよ。」というイメージになります。
次に、これらAI技術を利用したソフトウェア開発の特徴を踏まえて、契約ガイドラインと2021年モデル契約書はどのような考え方をし、どのような特徴を有しているか見ていきましょう。
契約ガイドラインと2021年モデル契約書の考え方と特徴
「探索的段階型」の開発方式の採用
「探索的段階型」の開発方式の概要
このような「やってみなければどんなものができるかわからないし、できあがったものの性能が期待するほど良くなかったとしても原因を解明してブラッシュアップすることが難しいこともある。」というAI開発の特性から、契約ガイドライン(42ページ以下)は、ウォーターフォール型の開発がフィットしないことも多いとして、「開発プロセスを別個独立した複数の段階に分けて探索的に開発を行う『探索的段階型』の開発方式を採用することを提唱」しています。
具体的には、次表のようなアセスメント段階、PoC段階、開発段階、追加学習段階の4段階による開発方式を提案しています(契約ガイドライン44ページの表を参考に作成)。
アセスメント段階 | PoC段階 | 開発段階 | 追加学習段階 |
---|---|---|---|
一定量のデータを用いて学習済みモデルの生成可能性を検証する | 学習用データセットを用いてユーザが希望する精度の学習済みモデルが生成できるかを検証する | 学習済みモデルを生成する | ベンダが納品した学習済みモデルについて、追加の学習用データセットを使って学習をする |
秘密保持契約書等 | 導入検証契約書等 | 契約ガイドラインではソフトウェア開発契約書、2021年モデル契約書では共同研究開発契約書 | 保守運用契約、学習支援契約、新たなソフトウェア開発契約等。2021モデル契約書では利用契約書 |
そして、2021年モデル契約書も、契約ガイドラインと同様に、アセスメント段階、PoC段階、開発段階、利用段階(追加学習を含む。)という4つの段階に開発プロセスを分け、それぞれの段階に応じて各種のモデル契約書を提案しています。
なお、各段階は、必ずしも明確に区別されるものではないですし、各段階の中で数回に分けて契約を締結することも考えられます。また、いきなりPoC段階からスタートする場合やアセスメント段階とPoC段階を一体として行う場合も考えられます(契約ガイドライン44ページ参照)。
「探索的段階型」の開発方式のメリット
そして、「探索的段階型」の開発方式のメリットは、次のように考えられます(契約ガイドライン43ページ参照)。
- 開発対象・性能について事前予測が困難な中、開発を複数段階に分けて各段階における達成目標を明確にすることにより、ベンダとユーザとの間の認識ギャップを減らすことができること
- 十分な性能を備えた学習済みモデルの生成が困難であることが判明した場合には傷が浅いうちに手を引くこととしてリスクヘッジを図れること
小括
ここまでは、契約ガイドラインと2021年モデル契約書が「探索的段階型」の開発形式を採用して、開発のプロセスを複数の段階・契約に分けていることについて解説しました。
次に、AIの開発・利用に関する契約においてしばしば問題となりうる論点、すなわち、ベンダの完成義務・性能保証、知的財産権の帰属・利用、学習済みモデルの利用に関して生じる責任について解説していきます。
完成義務を負わず、性能保証をしないこと
契約の法的性質(準委任型)
求められる精度等の学習済みモデルができあがるか事前予測することが困難で、未知の入力データに対する挙動も不明確で性能保証が難しいというAI開発の特性から、開発段階については、具体的な仕事の完成を目的とし、一定の契約不適合責任を伴う請負型の契約にはなじみにくく、準委任型の契約が親和的だと考えられます(契約ガイドライン48ページ以下参照)。
そして、開発段階において準委任型のソフトウェア開発契約を締結する場合、請負型の契約と異なり、ベンダは、仕事の完成義務、契約不適合責任を負わないことになります。
なお、請負と準委任の違いの詳細については、「請負と準委任の違いをご存知ですか?元・企業内弁護士が業務委託契約書のポイントを解説」をご覧ください。
完成義務を負わないこと、性能保証を行わないことの確認
そこで、契約ガイドラインのソフトウェア開発契約は、準委任型を採用するとともに、その7条2項において、「ベンダは、本件成果物について完成義務を負わず、本件成果物等がユーザの業務課題の解決、業績の改善・向上その他の成果や特定の結果等を保証しない」旨を確認しています。
また、2021年モデル契約書は、後述のように、開発段階の契約として、共同研究開発契約という準委任契約の性質を有する契約類型を採用するとともに、その6条2項は、スタートアップ(ベンダ)が成果物について完成義務を負わないこと及び当該成果物が特定の成果や結果を保証しないことを明記しています。
知的財産権の帰属、利用条件についての考え方
権利の帰属について
知的財産権の帰属は、交渉のプロセスにおいて当事者双方の立場が鋭く対立する論点です。
しかし、2021年モデル契約書の利用契約書(7ページ)は、
「このように『どちらが権利を持っているか』(権利の帰属)に双方がこだわっている限り双方の溝は埋まらず、交渉に多大な労力と時間がかかり結局双方が競争力を失うことになる。」と強い懸念を示し、
「権利帰属」と「利用条件」を分離し、利用条件について柔軟な条件設定を行っています(なお、前者は共同研究開発契約書に、後者は利用契約書にそれぞれ定められています。)。
なお、契約ガイドライン(28ページ以下)も、同様に、「権利帰属」と「利用条件」を分離して柔軟な条件設定を行うことを提案しています。
権利の利用条件について
そして、契約ガイドライン(29ページ以下)は、次のように、利用条件の主な交渉ポイントを提示しており、実務上参考になると思われます。
- 利用目的(契約に規定された開発目的に限定するか否か)
- 利用期間
- 利用態様(複製、改変及びリバースエンジニアリングを認めるか)
- 第三者への利用許諾・譲渡の可否・範囲(他社への提供(横展開)を認めるか、競合事業者への提供を禁じるか)
- 利益配分(ライセンスフィー、プロフィットシェア)
学習済みモデルの利用に関して生じる責任についての考え方
ユーザ・ベンダ間の関係
未知の入力データに対する挙動も不明確で性能保証が難しいというAI開発の特性から、学習済みモデルの利用に伴う責任について、契約ガイドライン(34ページ)は、「現在の実務上、契約においては、ベンダ側の責任を一定の範囲に限定する規定を設ける等の対応に留まっていると思われる」と指摘しています。
第三者との関係
未知の入力データに対する挙動も不明確であるというAI技術の特性から、結果予見性がなく、過失がないと判断されたり、損害との因果関係が認められなかったりし、ベンダの第三者に対する不法行為責任が否定される場合があると考えられます(契約ガイドライン34ページ以下参照)。
小括
以上、契約ガイドラインと2021年モデル契約書の考え方と特徴について、「探索的段階型」の開発方式の採用、完成義務を負わず、性能保証をしないこと、知的財産権について「権利帰属」と「利用条件」を分離して柔軟な条件設定を行うこと、学習済みモデルの利用に関して生じる責任を中心に見てきました。
次に、2021年モデル契約書の意義、その秘密保持契約書、技術検証(PoC)契約書、共同研究開発契約書、利用契約書の各ポイントを見ていきましょう。
2021年モデル契約書の意義
2021年3月29日、公正取引委員会と経済産業省が、「スタートアップとの事業連携に関する指針」を発表しました。
この指針は、
「事業連携によるイノベーションを成功させるため、スタートアップと連携事業者との間であるべき契約の姿・考え方を示すことを目的と」するもの
です(同指針1ページ)。
そして、同指針は、
「昨今の技術の急速な発展によって、ビジネスの競争軸が『市場適応』から『価値創造』へと一気にシフトする中、企業が競争力を維持・強化するためには、実現・提供しようとする価値に応じて自社の既存の事業領域を超えた多様なリソースを掛け合わせ、かつスピーディに製品・サービスを提供することが不可欠となった。」
「そのため、他社との協業によって価値創造を行うオープンイノベーションを推進し、その成功確率を高めることが、我が国企業の今後の競争力を左右する必須課題ともいえる状況となっている。」
「オープンイノベーションは単発で終わるものではなく、中長期的な価値創造パートナーを探索する活動であり、双方が協力することでユニークな価値を生み出し、その対価を適切にシェアし、もって新たな活動に繋げていく取組であ」り、「たった一度の協業において『この企業とは二度と一緒にやりたくない』と思われた企業は、そのネガティヴ・レピュテーションによってオープンイノベーションの機会を失い、ひいては企業競争力を失う結果となる。」
という背景認識の下、
という価値観を、オープンイノベーションにおいて協業する双方において拠り所とすべきである、という考え方に基づいています(「スタートアップとの事業連携に関する指針(別添)~オープンイノベーションの契約にかかる基本的な考え方~」1ページ)。
そして、2021年モデル契約書は、研究開発型スタートアップと事業会社の連携において、共同研究契約等を交渉する際に留意すべきポイントについて解説したものであり、同指針(別添)の価値観や考え方を「一貫して意識」して作成されたものであるとのことです(同指針(別添)1ページ)。
以下では、2021年モデル契約書の秘密保持契約書、技術検証(PoC)契約書、共同研究開発契約書、利用契約書の各ポイントを見ていきます。それらは、既に述べたAI開発の特性に由来するもののほか、中長期的な価値創造パートナーを探索するオープンイノベーションを成功に導くための視点も含んでおり、いわゆる「攻めの法務」という観点からも参考になると思われます(以下、これらの契約書をそれぞれ「本秘密保持契約書」、「本PoC契約書」、「本共同研究開発契約書」、「本利用契約書」ということがあります。)。
なお、これまで当事者を表すために「ベンダ」「ユーザ」という用語を使用してきましたが、2021年モデル契約書の解説に合わせて、それぞれ「スタートアップ」「事業会社」という語を使用するので、ご注意ください。
アセスメント段階における秘密保持契約書(2021年モデル契約書)
(注)秘密保持契約書(NDA)一般については、「元・企業内弁護士が解説!企業価値毀損を防ぐ秘密保持契約(NDA)の11のポイント」をご覧ください。
はじめに
アセスメント段階において、スタートアップは、事業会社から限定的なサンプルデータの提供を受けて、スタートアップの保有するAI技術の事業会社への導入可能性を検証します。
そのため、主にスタートアップが情報受領者となることが多いと考えられます。
これは、秘密保持義務等を負担する当事者が主としてスタートアップ側であることを意味し、秘密保持契約書の作成・リーガルチェックを行う際の基本的な視点となります。
目的の定義(前文)
秘密保持契約(NDA)の基本的な構造は、一般的に、次のとおりです。
- 開示者が、特定された目的のために秘密情報を開示等する
- 受領者は、秘密情報を、この目的遂行のために必要な範囲に限り関係者に開示でき、また当該目的以外での使用が禁止される
そこで、目的外利用として禁止する範囲を明確にするため、秘密情報の使用目的を定めることが必須となります。
この点、本秘密保持契約書の前文は、目的を次のように詳細かつ具体的に定めており、目的の定義規定を起案する際に参考になると思われます。
秘密情報の定義(1条)
およそ全ての開示情報が秘密情報に該当するとなると、情報管理コストが大きくなり、秘密情報管理体制に割り当てるリソースも乏しいスタートアップには負担が大きすぎる場合があります。
そこで、「秘密情報」の限定と明確化の観点から、1条1項前段は、「秘密情報」を次のものに限定しています。
- 文書等により開示等された情報であって、秘密であることが明記されたもの
- 口頭等、無形の方法により開示等された情報であって、開示等の時から14日以内に文書等により秘密である旨通知されたもの
さらに、データ上に「Confidential」や「秘」等の表示を行うことが困難な場合に備え、提供するデータを限定列挙し、これらは「Confidential」や「秘」等の表示がなくても秘密情報に該当することを定めています(1条1項後段、別紙)。これは、秘密保持契約(NDA)において、しばしば用いられる手法ですね。
スタートアップにとっての情報公開の必要性(2条6項)
スタートアップは、出資を受け入れたり、プロダクトをリリースしたり、事業連携等を行ったりする際、積極的に公表を行って、利用者や投資家等へのアピールを行っていますよね。
しかし、このような情報公開が秘密保持義務に反するかが曖昧であるため公開を躊躇したり、事業会社に事前に同意を求めていたものの社内決裁が長引き、タイミングよく公表できないこともあります。
そこで、スタートアップと事業会社との間で合意ができるのでしたら、2条6項のように、相手方の事前承諾を得ず、AI技術の導入可能性の検討を開始した事実を公表することができる旨を明示的に定めることが考えられます。
PoC段階・共同研究開発段階への移行に向けた努力と通知(7条)
スタートアップについては、キャッシュフローが潤沢ではなく、また黒字転換もまだまだ先であって、「時間との闘いだ。」という状況がしばしば見受けられます。資金ショートする前に一刻も早く実績を作って、次の資金調達ラウンドに進む必要があり、時間を無駄にできません。
ですので、スタートアップとしては、秘密保持契約を締結したものの音沙汰がなく、かと言って他の企業とのアライアンスの検討・協議をするわけにもいかず、待つしかないという状況は、可能な限り避けたいところです。
そこで、7条は、当事者に「PoC契約または共同研究開発契約の締結に向けて最大限努力」すること、次のステップに進むかどうか未確定なままで時間が経過することを避けるため、事業会社に対し一定期間内に「PoC契約または共同研究開発契約を締結するか否かを通知する」ことを定めています。
秘密情報に基づき新たに発生した知的財産権の取扱い
知的財産権の発生について見通しがつかない段階で、その帰属等について合意してしまうと、当事者の意思に反する結果をもたらしたり、これを事後的に変更しようとしても変更合意が成立しなかったりして、お互いに不幸になる可能性があります。
また、タフな交渉をして秘密保持契約書で知的財産権の帰属を定めたのに、結局、アセスメント段階において新たな知的財産権が発生しなかったら(むしろ発生するケースが少ない)、交渉に無駄な手間と時間とお金をかけたということにもなりかねません。
そこで、本秘密保持契約書は、知的財産権の帰属条項を、追加オプション条項として示すに留めています。
PoC段階における技術検証(PoC)契約書(2021年モデル契約書)
はじめに
技術検証(PoC)契約は、開発段階に移行するか否かを検討する前提として、スタートアップの保有している技術の開発可能性、導入可能性等を検証するための契約です。
そして、本PoC契約書(3ページ以下)は、PoC契約の意義が、次のようなトラブルを未然に防止することにある旨を指摘しています。
- 本開発への移行をちらつかされながら、次から次へと無償でPoCを依頼され、にもかかわらず本開発に移行せず、その結果、スタートアップがPoCにかかるコストを回収できないケース(いわゆる「PoC貧乏」)も散見される。「PoC貧乏」のために資金が尽きてしまうこともある。
- PoCの過程で得られた知見について、相手方に対して譲渡を強要されたり、無断で出願されてしまったりするなどの紛争が生じるケースもある。
そこで、曖昧な状態でPoCを行うのではなく、PoC契約を書面で締結し、その対象範囲と対象期間等を明確にしておくことが重要です。
PoCの内容、期間、対価の有無の定め(2条、3条、4条)
通常の業務委託契約でも業務の範囲が曖昧だと、「この対価に対してどこまでやらないといけないのか?どこからが別料金になるのか?」等を巡ってトラブルになりえます。
PoC契約でも「本検証および本報告書の内容を一定程度詳細に特定しておかないと、後々トラブル(いつまで経っても検証がまだ終わっていないとして追加の作業や報告が発生するなど)が生じる可能性があ」ります(本PoC契約書6ページ)。
そこで、忘れずにPoC契約を交わして、PoCの作業体制・作業内容・スケジュール等の詳細事項を特定することが重要となります。
なお、本PoC契約は、その成果物として、具体的に検証結果を記載したレポートを想定しています(2条3項)。
PoC段階においてスタートアップが生成した学習済みモデルのプロトタイプのソースコードの引渡しを事業会社が要請することについて
このような要請があった場合について、本PoC契約書(9ページ)は、次の理由により、スタートアップとしては、学習済みモデルのソースコードを引き渡すことは、避けることが望ましい旨を指摘しています。
- 学習済みモデルのソースコードを、仮に検証目的だとしても引き渡し対象とすることはPoC契約の目的を超えるものであり不合理である。
- 次段階に移行するか否かについては、報告書のみで判断可能なのであって、仮に報告書だけでは判断できないのであれば、それは報告書に盛り込むべき項目に不足があったということを意味しているに過ぎない。
- ソースコードの流出や他目的での利用等、スタートアップにとって致命的な事態を招くリスクが大きい。
共同研究開発段階への移行に向けた協議と通知(6条)
PoC契約の目的は、開発段階に移行するか否かを検討する前提として、スタートアップの保有している技術の開発可能性、導入可能性等を検証する点にありました。
そこで、6条1項は、実効性が確認された場合には、当事者は共同研究開発契約締結に向けて速やかに協議を開始することを定めています。
また、PoC後に開発に進むかどうか未確定なままで時間が経過することを避けるため、6条2項は、事業会社は一定期間内に共同研究開発契約を締結するか否かの検討結果を通知することを定めています。
スタートアップにとっての情報公開の必要性(9条6項)
本秘密保持契約書と同様、本PoC契約書9条6項も、相手方の事前承諾を得ずに、技術検証が開始された事実を公表することができる旨、明示的に定めています。
報告書及びPoC遂行に伴い生じた知的財産権の帰属(11条)
検証の過程で生じる知的財産権の取扱いについて、契約において規定しておくことが重要です。
本PoC契約書では、検証作業の主体がスタートアップであること、報告書により導入可否の検討という目的を達成し得ることから、報告書及びPoC遂行に伴い生じた知的財産権はすべてスタートアップに帰属することとしています(11条1項)。
共同研究開発契約書(2021年モデル契約書)
契約の法的性質(開発委託か共同研究開発か)
契約ガイドラインの開発段階の契約がソフトウェア開発委託契約であるのと異なり、2021年モデル契約書の開発段階の契約は、共同研究開発契約となっています(8ページ)。
これは、一方的な委託ではなく、事業会社も事業領域に関する知識・ノウハウやデータを提供し、共同で研究開発を進める場面を想定しているためです。
事業会社側の役割及び善管注意義務(1条、3条、6条)
共同研究開発契約においては、「一体、誰がこれをやるんだ?」との疑念やトラブルを防止するため、「各当事者に与えられた役割の範囲」を明確に規定する必要があります。
そこで、3条、別紙(1)の5は、共同研究開発にあたっての双方の役割分担を定義しています。
また、6条4項は、事業会社も自らの役割を履行するに際して善管注意義務を負うことを確認しています。
学習済みモデルの定義(2条6項)
学習済みモデルが成果物の中心的な要素であることに鑑みると、学習済みモデルの定義が曖昧である場合、当事者間に認識の不一致が発生しトラブルを招くリスクがあります。
そこで、2条6項は、「本学習済みモデル」を定義し、当事者の共通理解を促進して紛争予防を図っています。
成果物の完成義務等(6条)
共同研究開発契約は準委任契約の性質を有します。
そのため、各当事者は完成義務を負うものではありません。
また、AI開発には、求められる精度等の学習済みモデルができあがるか事前予測することが困難で、未知の入力データに対する挙動も不明確で性能保証が難しいという特性がありました。
そこで、6条2項は、「スタートアップが本件成果物について完成義務を負わないこと」と「本件成果物が特定の成果や結果を保証しないこと」を明示しています。
この点、本共同研究開発契約書(17ページ)は、次の理由から、「事業会社が一方的にスタートアップに完成義務や性能保証を求めるのは妥当ではない」と指摘しています。
- 事業会社においては、一定の性能が得られることについてPoC段階で既に確認をした上で共同開発に移行している
- 共同開発とは、技術や事業領域についての情報・知識を有する事業会社とスタートアップが互いにリスクテイクして開発を推進する開発形態であって、事業会社が一方的にスタートアップに完成義務や性能保証を求めるのは妥当ではない。
- そのような共同研究開発の性格から、AI開発以外の共同研究開発においても、一般的に、成果物の完成義務やその保証を求めない事例も広くみられるところである。
もっとも、スタートアップは、6条1項が確認的に規定しているように、情報処理技術に関する業界の一般的な専門知識に基づいた善管注意義務を負います。
したがって、スタートアップは、成果物が完成しなかった場合、その過程に善管注意義務違反が認められるときには、債務不履行責任を負う可能性があります。
成果物等の知的財産権の帰属(17条、18条)
著作権の帰属
本共同研究開発契約書(31ページ)は、著作権は特許権等と異なり開発完了時点において発生することがほぼ確実であること、著作権については帰属先を事前に明確にしておきたいニーズが強いと考えられることから、著作権の帰属に関する規定と、著作権以外の知的財産権の帰属に関する規定を分けて定めています(17条、18条参照)。
そして、17条1項は、想定シーンの取決めのとおり、連携システム、連携システムに関連するドキュメントの著作権は事業会社に、本学習済みモデルを含むそれ以外の成果物等に関する著作権はスタートアップに帰属する旨を定めています。
なお、17条3項は、事業会社に配慮し、スタートアップに経済的不安が生じた場合には、事業会社が、スタートアップから研究成果に係る著作権の譲渡を受けることができる旨を定めています。
著作権以外の知的財産権の帰属
これに対し、本共同研究開発契約書18条は、特許権等については、そもそも発生するか否かが不明確であることから、その帰属について、特許法の原則どおり発明者主義を採用しています(18条)。
もちろん、当事者が、契約締結時に特許権等の権利帰属について定めることを希望するのであれば、そのような規定を設けることも考えられますし、逆に、開発段階における契約締結時に、特許権等の権利帰属について定めることが難しい場合には、両者協議して決定する旨を定めることも考えられます。
成果物の提供方法(10条)
学習済みモデルを判読可能・二次利用可能な態様等で提供するかどうかは、スタートアップの知的財産(ノウハウを含みます。)の保護レベルに影響を与えることとなります。
例えば、APIを通じて出力の内容のみを提供するケース、暗号化・難読化したコードを提供するケース、バイナリコードを提供するケース、ソースコードを提供するケース等、色々な提供方法が想定されますが、スタートアップの知的財産の流出や事業者による契約違反のリスクは、それぞれ異なります。
したがって、学習済みモデルの提供方法については、十分に検討を行うことが重要です。
本共同研究開発契約書では、学習済みモデルについて、その著作権がスタートアップに帰属し、かつAPI連携の方法で学習済みモデルの出力結果のみを提供することとなっているので、本共同研究開発契約における提供方法に関しても、確認期間中、スタートアップのサーバ上でAPI提供可能な状態に置く旨を定めています(10条1項)。
学習用データセットの取扱い(13条)
学習用データセットは、事業会社から提供を受けた生データに対し、スタートアップが加工・前処理を行ったデータの集合体です。
このような加工・前処理にはスタートアップのノウハウが反映されるところ、スタートアップにとって、このようなノウハウを秘密として保護する必要性が高いことがあります。
他方、学習用データセットは事業会社から提供を受けた生データから派生したものです。
そこで、13条は、スタートアップのノウハウの保護のため、スタートアップは事業会社に対し学習用データセットを開示等する義務を負わないこととしつつ、
スタートアップは、学習用データセットを、共同開発の遂行の目的を超えて利用できない旨を定めています。
もちろん、当事者間で合意できれば、共同開発以外の目的でスタートアップが学習用データセットを利用することができる旨を定めることも、ありうる選択肢です。
共同研究開発の作業期間(5条)
締切りも切らずに開発を進めては、スタートアップとしては、想定以上の時間を費やしたにも関わらず追加の委託費用をもらえないという事態も起こり得ますし、事業会社としても、想定した期間内までに開発の成果を得られないという事態が起こり得えます。
また、ベンチャーキャピタル等から資金調達を受けているスタートアップは、一定の期間内にIPOまたはM&Aによるエグジットを目指さなければならない状況にあります。
そこで、5条、別紙(1)の7は、共同研究開発の目安となるスケジュールとして、共同開発の作業期間を定めています。
利用契約書(2021年モデル契約書)
契約の法的性質(ライセンス契約かサービス提供契約か)
学習済みモデルの知的財産権をスタートアップに帰属させた場合、スタートアップと事業会社との間の学習済みモデルの利用契約の類型としては、大別して、次表のライセンス契約とサービス提供契約が考えられます(表は本利用契約書18ページを参考に作成)。
本利用契約は、API経由でデータの送信を受けその処理結果を提供するサービス利用契約となっています。
ライセンス契約 | サービス利用契約 |
---|---|
学習済みモデルのプログラム(コード)をスタートアップが事業会社に提供したうえで、事業会社が同プログラム(コード)を複製(場合によっては改変を含む。)・使用する契約形態 | スタートアップが事業会社には学習済みモデルのコードを提供せず、「APIを通じて事業会社から処理対象となるデータの提供を受けたうえで同モデルを利用した処理結果を事業会社に提供する」という内容の「サービス」を提供する形態 |
(メリット)コードを提供することで、事業会社での利用可能範囲が拡大され、それに伴ってスタートアップが得られるライセンスフィーが増加する可能性 | (メリット)コードの提供を伴わないため漏洩リスク等がない点、APIを通じての提供であるため、再販売を含めて画一的かつ大量にサービス提供・サービス提供範囲の拡大ができ、かつその利用状況をスタートアップ自身が把握できる点 |
(デメリット)コードの開示等を伴うため、その無断複製や漏洩、目的外利用のリスクが常に存在 | (デメリット)提供・処理内容を個々の顧客ごとにカスタマイズすることは前提としていないため、カスタマイズを希望する顧客の希望には応えづらいという限界 |
成果物の利用条件
上記のとおり、契約ガイドラインと2021年モデル契約書は、当事者が、成果物の権利を自己に帰属させることに固執し、交渉に多大なコストがかかり、結局、双方が競争力を失うということを回避する観点から、「権利帰属」と「利用条件」を分離して柔軟な条件設定をすることを提案しています。
そこで、上記のとおり、2021年モデル契約書の共同研究開発契約書17条と18条は、「権利帰属」に関する条項を定めていました。
そして、本利用契約書は、次のとおり、成果物の「利用条件」を柔軟に定めています。
サービス提供の非独占性(3条1項)
事業会社が、学習済みモデルの利用を「うちだけに使わせてよ。他社には使わせないでよ。」と、独占的なサービス提供を求めることがあり得ます。
そして、仮に、スタートアップが当該学習済みモデルを事業会社に対してのみ(独占的に)提供することとした場合、当該スタートアップは、他のクライアントとの間でも、各社ごとに学習済みモデルを生成して、その利用を各クライアントに対してのみ独占的に提供するというビジネスモデルを採用することになると考えられます。
そうすると、スタートアップが独自の研究開発に基づきアップデートを継続的に行うとすると、各社ごとの学習済みモデルについてアップデート、メンテナンスを行う必要があり、管理コストが増加します。
しかし、事業会社が高い利用料設定に応じることは通常、考え難いですよね。
その結果、スタートアップとしては、将来にわたって低水準の利益率で苦しむおそれがあります。
サステナブルではなさそうな匂いがしてきます。
そのため、複数の事業会社からデータ提供を受けて学習済みモデルを生成し、これを利用したサービスを各事業会社に提供するというビジネスモデルをスタートアップが展開する場合、データ提供の有無を問わずどの事業会社に対しても学習済みモデルを利用したサービスを提供できる、とするのが通常は合理的だと考えられます(本利用契約書8ページ以下)。
そこで、3条1項は、スタートアップが、事業会社以外の第三者に対して、学習済みモデル・追加学習済みモデルを用いたサービスを提供することができる旨定めています。
事業会社の貢献を反映したサービス利用料(8条)
事業会社によるデータやノウハウの面での貢献を反映するため、8条は、事業会社に対して、
旨の条項(最恵待遇条項(MFN条項)にディスカウントを組み合わせたもの)を採用しています。
他にも、本利用契約書(10ページ以下)では、利用条件の設定について、例えば次のような観点を示しており、実務上参考になると思われます。
- 時の経過とともに、初期ユーザが提供したデータが学習済みモデルの精度向上に寄与する割合は減少していくことから、ディスカウント率も下げていくことが考えられること
- 分野ごとに事業の利益率が異なることから、MFN条項の対象となる分野を特定する必要があること
- AI業界の進歩のスピードが速いことから当初のモデルの陳腐化のスピードも速く、また、事業会社の初期の貢献度も時の経過とともに減少していくことから、MFN条項の適用年限を限定する必要があること
- 意図せずMFN条項が発動してしまうことを防止するため、最低価格を参照する対象となる事業者を適切に設定する必要があること
- たとえ特定の事業領域であっても、学習済みモデルの独占利用を認めることは、スタートアップとしては、他の事業者との取引機会を失う等、事業戦略へ支障が生じる可能性があるので、極めて慎重な検討を要すること
追加学習の内容(4条等)
学習済みモデルを利用したデータ処理サービスにおいては、未知のデータを含む追加データにより、その学習済みモデルを追加学習し、精度の維持・向上を図ることが必要となります。
そして、追加学習を行う際は、学習済みモデルの生成という面を有しているのでこれと同様、次の事項について合意する必要があります(本利用契約書15ページ参照)。
- 追加学習に利用するデータの範囲
- 事業会社からデータ処理のために提供されたデータの利用目的
- 追加学習によって生じる学習済みモデルの権利帰属・利用条件
そして、本利用契約書の想定は、複数の事業会社から提供を受けたデータを利用して1つの高精度なモデルを生成して、複数の事業会社に利用させるというものでした。
そこで、4条2号は、「追加学習に利用するデータ」を、事業会社が提供したデータ及び第三者が提供したデータである旨を定めています。
また、5条1項3号は、「事業会社からデータ処理のために提供されたデータの利用目的」に、第三者に対する、学習済みモデル・追加学習済みモデルを用いたサービスの提供が含まれることを定めています。
そして、「追加学習によって生じる学習済みモデルの権利帰属・利用条件」について、4条7号以下は、既に合意済みの共同研究開発契約と同様の内容を定めています。
リバースエンジニアリング等の禁止(11条)
スタートアップの知的財産(ノウハウを含みます。)を保護するため、11条は、
- リバースエンジニアリング等の手段により本学習済みモデルまたは追加学習済みモデルのソースコードを得ようとすること(3号)
- 蒸留行為(本学習済みモデルへの入力データと、本学習済みモデルの処理結果を新たな学習用データセットとして新たな学習済みモデルを生成する行為)(4号)
を禁止事項に掲げています。
これらの行為は、著作権等の知的財産権によりストップさせることができないことがあるので、契約書に禁止行為として定めておくことにご利益があります。
非保証(12条)
学習済みモデルを利用したサービス提供ついて、一般的に、その精度や水準について保証をすることは技術的に困難であることから、
12条1項は、そのサービスが事業会社の特定の目的に適合することを保証しない旨を定めています。
また、12条2項は、「本サービスの利用が第三者の…知的財産権を侵害しないことを保証しない」旨も定めています。これは、そのような保証を行うことは、スタートアップにとって負担が重く、またリスクが高いからです。
仮に、そのような保証をするとしても、「知る限り」等の文言によって限定することが考えられます。
ただし、著作権侵害に限っては、原著作物に依拠しなければ(例えば、原著作物を見てさえいなければ)侵害は成立しないので、非侵害を保証をすることも、実務上、ありうる選択肢です。
損害賠償(17条)
AI技術の特性に、学習済みモデルの性能等が学習用データセットに依存すること、処理結果も(未知の)入力データの品質に依存すること等がありました。
そのため、利用者が何らかの損害を被った場合、そのすべてについてサービス提供者が責任を負担すると解釈するのは困難と考えられます。
また、サービス提供者が全責任を負担するとなると、そのリスクは利用料金額に反映され、結局は利用者の負担となります。
そこで、契約当事者間のリスク配分の観点から、17条は、スタートアップに故意重過失がない限り、その損害賠償責任の範囲を、事業会社に現実に発生した直接かつ通常の損害に限定し、また、損害賠償額に上限を設定しています。
まとめ
この記事では、契約ガイドラインと2021年モデル契約書を参考に、AI開発契約のポイントとして、次の事項を解説しました。
AI開発の特徴、AI開発プロジェクトやAIを利用したビジネスに関する契約書の作成・リーガルチェックのポイントを理解し、貴社のリーガルリスクマネジメントの質を向上させるに当たり、お役立てれば幸いです。
AI開発契約では、様々な条件・事項を契約相手方と協議・調整し条文に落とし込むという複雑な作業が伴いますので、弁護士のアドバイス等を得ながら契約書作成・リーガルチェック(レビュー)を行うことをお勧めします。
弊所では、法律案立案の経験を有し、契約書の作成・リーガルチェックに関する豊富な実務経験と実績を有する理系出身弁護士が、AI開発契約に関する助言、作成・リーガルチェックを行っています。
- AI技術を利用したソフトウェア開発の特徴
- 事前の性能保証が性質上困難であること
- 事後的な検証等が困難であること 等
- 契約ガイドラインと2021年モデル契約書の考え方と特徴
- 「探索的段階型」の開発方式の採用
- 完成義務を負わず、性能保証をしないこと
- 知的財産権の帰属、利用条件についての考え方
- 学習済みモデルの利用に関して生じる責任についての考え方
- 2021年モデル契約書の秘密保持契約書、技術検証(PoC)契約書、共同研究開発契約書、利用契約書のポイント