← AI法務ラボへ戻る
Insight
法務における生成AI活用法AIサービス法務

生成AIと著作権・学習データのチェックポイント|開発者・利用者別の実務論点

こんにちは!Legal Agent 代表弁護士の朝戸です。

生成AIを使う企業から、著作権と学習データに関する相談が増えています。「インターネット上の文章や画像を学習に使ってよいのか」「AIが作った文章や画像を商用利用してよいのか」「他社の著作物に似た出力が出た場合、誰が責任を負うのか」といった相談です。

このテーマは、法務の現場でかなり誤解が起きやすいと感じています。日本の著作権法には、情報解析や機械学習に関係する規定があり、一定の範囲で著作物の利用が認められる可能性があります。一方で、それを「AI学習なら何でも自由」と読むのは危ういです。学習段階、モデル提供段階、出力生成段階、出力利用段階で、問題になる法的論点が違うからです。

また、著作権だけを見ればよいわけでもありません。データ取得元の利用規約、秘密保持義務、個人情報保護法、不正競争防止法、営業秘密、肖像権・パブリシティ、商標、契約上の利用制限も関係します。文化庁を含む公的機関の考え方や裁判例の蓄積も、今後変化する可能性があります。企業は、実際に利用する時点で、最新の法令、公式ガイダンス、サービス規約、業界慣行を確認する必要があります。

今回は、生成AIと著作権・学習データの基本、なぜ企業法務で重要になるのか、チェックリスト、AI開発者・AI提供者・AI利用者別のリスク、AIでレビューする際の注意点を整理します

この記事で分かること

この記事では、生成AIと著作権・学習データのチェックポイントについて、基本的な意味、レビューで問題になりやすい条項、立場ごとの注意点、AIで確認するときに人が見落としてはいけない点を整理します。最初に全体像をつかみ、その後にチェックリストで実務上の確認順序を追える構成にしています

最初に確認するポイント

  • AIに入力されるデータに、秘密情報、個人情報、第三者の著作物が含まれるか
  • AIの出力結果を、誰が、どの業務で、どの範囲まで利用するのか
  • 外部送信、学習利用、ログ保存、再利用の扱いを契約や社内ルールで説明できるか
  • 利用規約、プライバシーポリシー、社内ポリシー、ベンダー契約が同じ前提でそろっているか
  • AIの回答をそのまま採用せず、最終判断者とレビュー手順を決めているか

生成AIと著作権・学習データとは

生成AIの著作権問題は、大きく分けると、学習データの利用と出力結果の利用に分かれます。

学習データの利用とは、文章、画像、音声、動画、コード、契約書、社内文書などを、AIモデルの学習、追加学習、評価、検索拡張生成、プロンプト改善などに使うことです。日本の著作権法上、著作物に表現された思想又は感情を享受する目的ではない利用について、一定の範囲で権利制限規定が適用される可能性があります。もっとも、利用目的、利用態様、著作権者の利益を不当に害するかどうかなどによって評価が変わり得るため、個別に見る必要があります。

出力結果の利用とは、AIが生成した文章、画像、コード、音楽、契約文案、広告コピー、記事、提案書などを、自社の業務や外部公表物に使うことです。この段階では、AIの出力が既存著作物に類似していないか、既存著作物に依拠していると評価される可能性がないか、利用者がどのようなプロンプトや素材を入力したのかが問題になります。

さらに、企業実務では、学習と出力の間に、サービス利用規約という層があります。AIサービス提供者が、入力データをモデル改善に使うのか、学習利用をオプトアウトできるのか、出力結果の権利をどう扱うのか、第三者から権利侵害を主張された場合にどのような補償をするのかは、サービスによって異なります。

したがって、生成AIと著作権・学習データの検討では、「法律上できるか」だけでなく、「契約上できるか」「顧客に説明できるか」「事業上受け入れられるリスクか」を分けて考える必要があります

企業法務で重要になる理由

生成AIと著作権・学習データが重要になるのは、AI活用の価値が、データの量と質に大きく左右されるからです。

自社の過去契約書、ナレッジ、顧客対応履歴、開発ドキュメント、営業資料をAIに参照させれば、業務効率は大きく上がる可能性があります。広告制作、記事作成、デザイン、プログラム開発でも、生成AIを使うことで初稿作成のスピードは上がります。しかし、そのデータの中に第三者の著作物、顧客から預かった資料、秘密情報、個人情報が含まれている場合、自由に学習・入力・再利用できるとは限りません。

特に、企業が注意すべきなのは、外部から取得したデータと、社内で保有しているデータを混ぜて考えてしまうことです。インターネット上で公開されているからといって、利用規約や技術的制限を無視してよいわけではありません。顧客から受領した資料も、自社が保有しているからといって、AI学習に使ってよいとは限りません。契約上の目的外利用や秘密保持義務違反になる可能性があります。

また、AIの出力結果をそのまま外部に出すことにも注意が必要です。生成AIは、既存作品に似た表現、コード、画像、キャラクター、文章構成を出す可能性があります。利用者が特定の作家名、作品名、競合サービス名、既存キャラクター名をプロンプトに入れた場合、依拠性や類似性の問題が強く意識される場面があります。

企業法務としては、生成AIを禁止するだけでは事業に合いません。一方で、現場任せにすると、知らないうちに権利処理が曖昧なデータが学習・入力・公表に使われる可能性があります。だからこそ、学習データ、入力データ、出力利用を分けたルール作りが重要になります

著作権・学習データのチェックリスト

まず確認すべきは、利用するデータの種類です。自社作成データ、顧客提供データ、第三者著作物、公開ウェブデータ、購入データセット、オープンソースコード、画像素材、動画素材、音声、SNS投稿、論文、契約書、社内ナレッジを分類します。分類しないまま「データ」と一括りにすると、法務レビューが粗くなります。

次に、データの取得経路を確認します。どこから取得したのか、利用規約はあるのか、スクレイピングやAPI利用が認められているのか、商用利用できるのか、再配布や機械学習利用が制限されていないかを見ます。ウェブ上で閲覧できる情報でも、取得方法や利用目的によって問題が変わる可能性があります。

学習・入力の目的も重要です。基盤モデルの学習なのか、社内検索用のRAGなのか、特定顧客向けの要約なのか、プロンプト内で一時的に参照するだけなのか、モデル改善に使うのかで、リスクの性質が変わります。特に、顧客資料や契約書を外部AIサービスに入力する場合は、サービス提供者による保存・学習利用の有無を確認する必要があります。

著作権法上の検討では、学習段階と出力利用段階を分けます。学習段階では、権利制限規定の適用可能性、著作権者の利益を不当に害するかどうか、契約上の制限を検討します。出力利用段階では、既存著作物との類似性、依拠性、プロンプトの内容、出力物の修正有無、商用利用の範囲を確認します。

権利侵害主張への対応も事前に考えるべきです。AIサービス提供者の補償条項、利用者の義務、問題ある出力を停止・削除する手順、問い合わせ窓口、ログ保存、プロンプト記録、制作過程の記録を確認します。後から「どのように作成したのか」を説明できないと、社内外への説明が難しくなることがあります。

最後に、社内教育と承認フローを置きます。従業員が、著名キャラクター風の画像、既存ブランドに似たロゴ、競合サイトに似たコピー、第三者コードに似た実装を安易に使わないよう、具体例で教育することが大切です。高リスクな外部公表物については、法務・知財・広報・事業部門の確認を入れる設計が実務に合っています

開発者・提供者・利用者別のリスク

AI開発者側では、学習データの由来と管理が中心的なリスクになります。データセットの取得元、ライセンス、利用規約、削除要請への対応、学習除外、データクレンジング、評価データの権利関係を記録しておく必要があります。後から顧客や投資家に説明する場面では、「適法と考えた理由」を抽象論ではなく、データ単位で説明できることが重要です。

AI提供者側では、利用者に何を説明するかが問題になります。入力データを学習に使うのか、保存期間はどれくらいか、オプトアウトできるのか、出力結果の権利を誰が持つのか、第三者の権利侵害が主張された場合にどこまで補償するのかを、利用規約やサービス資料で整理します。曖昧なまま販売すると、営業説明と契約条項がずれる可能性があります。

AI利用者側では、入力してよい情報と出力をどう使うかが重要です。契約書、顧客資料、未公表の事業計画、他社から受け取った提案書、購入した画像素材、外部ライターの原稿をAIに入力する場合、契約上の利用目的や秘密保持義務に反しないかを確認する必要があります。出力を広告、記事、製品UI、コード、顧客向け資料に使う場合は、既存著作物との類似やサービス規約上の制限を確認します。

委託取引では、さらに注意が必要です。制作会社、開発会社、ライター、デザイナー、コンサルタントがAIを使う場合、委託者としては、AI利用の可否、利用するAIサービス、入力する資料、生成物の権利帰属、第三者権利侵害時の責任、制作過程の記録を契約で確認したい場面があります。受託者側では、AI利用を全面禁止されると業務効率が落ちるため、許容範囲と確認手順を明確にすることが重要になります。

著作権・学習データのリスクは、立場によって見え方が違います。法務では、自社がデータを提供する側なのか、AIを開発する側なのか、AIサービスを販売する側なのか、単に成果物を利用する側なのかを、案件ごとに切り分ける必要があります

AIで著作権・学習データをレビューする際の注意点

生成AIは、著作権や学習データに関する契約レビューの初動には役立ちます。利用規約から、学習利用、入力データ、出力結果、補償、禁止用途、ログ保存、サブプロセッサ、国外移転に関する条項を抽出し、論点候補を整理できます。

ただし、AIの回答だけで著作権の結論を出すことは危険です。著作権侵害の判断では、対象となる著作物、創作性、類似性、依拠性、利用態様、権利制限規定、契約上の制限などを具体的に検討する必要があります。AIは一般論を示すことはできますが、実際の画像、文章、コード、制作過程、プロンプト、修正履歴を踏まえた判断は、人間の専門的確認が必要になる場面が多いです。

また、AIは最新の公的資料や裁判例を反映していない可能性があります。生成AIと著作権に関する考え方は、文化庁の資料や裁判例、業界実務、海外動向の影響を受けて変化する可能性があります。企業としては、AIの出力をそのまま信頼するのではなく、現在の公式情報と自社の利用実態を照らして確認する必要があります。

LegalAgentでは、生成AIと著作権の相談を、単なる「使える・使えない」の二択では見ません。どのデータを、どの目的で、どの環境に入れ、どの出力を、どの範囲で使うのか。ここを分解したうえで、契約書、社内ポリシー、制作フロー、顧客説明に落とすことが重要だと考えています

LegalAgentの関連サービス

この記事のテーマに関連するLegalAgentのサービスは、以下のページで詳しくご確認いただけます。

キーワード
著作権・学習データ
キーワード一覧から探す
AI法務ラボで他の記事を見る お問い合わせ