Insight 2026.06.13

生成AIと著作権・学習データのチェックポイント｜開発者・利用者別の実務論点

この記事を書いた人 朝戸統覚 Legal Agent法律事務所代表弁護士 / Founder & CEO

企業法務、M&A、スタートアップ法務、契約レビュー、生成AIを活用した法務体制づくりを支援しています。

こんにちは。LegalAgent 代表弁護士の朝戸です。

「日本の著作権法にはAI学習を認める規定があるから、学習に使う分には何でも自由だ」。生成AIと著作権の相談で、この理解に出会うことが少なくありません。たしかに日本の著作権法には、情報解析や機械学習に関係する規定があり、一定の範囲で著作物の利用が認められる可能性があります。しかし、そこから「AI学習なら何でも自由」まで飛躍するのは危ういです。学習段階、モデル提供段階、出力生成段階、出力利用段階のそれぞれで、問題になる法的論点が違うからです。

実際に受ける相談も、この段階ごとに分かれます。「インターネット上の文章や画像を学習に使ってよいのか」は学習段階の問題です。「AIが作った文章や画像を商用利用してよいのか」「他社の著作物に似た出力が出た場合、誰が責任を負うのか」は出力段階の問題です。同じ生成AIの話でも、検討する条文も契約も別物になります。

見るべき法領域も著作権にとどまりません。データ取得元の利用規約や秘密保持義務、個人情報保護法、肖像権・パブリシティも関係します。文化庁を含む公的機関の考え方や裁判例の蓄積も、今後変化していきます。だからこそ、企業は実際に利用する時点で、最新の法令や業界慣行を確かめておきます。

学習データの利用と出力の利用は別の問題

生成AIの著作権問題は、大きく分けると、学習データの利用と出力結果の利用に分かれます。

学習データの利用とは、文章や画像、コードなどの素材を、AIモデルの学習や評価、プロンプト改善などに使うことです。日本の著作権法上、著作物に表現された思想又は感情を享受する目的ではない利用について、一定の範囲で権利制限規定が適用される可能性があります。ただし、利用目的や利用態様、著作権者の利益を不当に害するかどうかによって評価が変わり得るため、個別に見ます。

出力結果の利用とは、AIが生成した文章や画像、コードなどを、自社の業務や外部公表物に使うことです。この段階では、AIの出力が既存著作物に類似していないか、利用者がどのようなプロンプトや素材を入力したのかが論点になります。

そして企業実務では、学習と出力の間に、サービス利用規約というもう一つの層が挟まります。AIサービス提供者が入力データをモデル改善に使うのか、学習利用をオプトアウトできるのか、出力結果の権利をどう扱うのか、第三者から権利侵害を主張された場合にどのような補償をするのかは、サービスによって異なります。「法律上できるか」と「契約上できるか」と「顧客に説明できるか」と「事業上受け入れられるリスクか」は、それぞれ答えが違い得る別の問いであり、分けて検討する必要があります。

データの量と質に価値があるからこそ起きる衝突

このテーマが企業法務で軽視できないのは、AI活用の価値が、データの量と質に大きく左右されるからです。

自社の過去契約書やナレッジ、開発ドキュメントをAIに参照させれば、業務効率は大きく上がります。広告制作やデザインでも、生成AIを使えば初稿作成のスピードは上がります。しかし、そのデータの中に第三者の著作物や、顧客から預かった秘密情報が含まれている場合、自由に学習・入力・再利用できるとは限りません。価値の源泉であるデータほど、権利や契約の制約が付いて回るという構図です。

企業が特に注意すべきなのは、外部から取得したデータと、社内で保有しているデータを混ぜて考えてしまうことです。インターネット上で公開されているからといって、利用規約や技術的制限を無視してよいことにはなりません。顧客から受領した資料も、自社の手元にあるからといってAI学習に使ってよいとは限らず、契約上の目的外利用や秘密保持義務違反になり得ます。「手元にあるデータ」と「使ってよいデータ」は別物です。

出力側にも同じ緊張があります。生成AIは、既存作品に似た表現やキャラクター、文章構成を出すことがあります。利用者が特定の作家名や既存キャラクター名をプロンプトに入れた場合には、依拠性や類似性の問題が強く意識される場面が出てきます。

では全面禁止すればよいかというと、それでは事業に合いません。禁止一辺倒の会社では、現場が個人アカウントで黙って使い始め、かえって統制が失われます。一方で現場任せにすれば、権利処理が曖昧なデータが知らないうちに学習・入力・公表に使われます。学習データ、入力データ、出力利用を分けたルール作りが必要になるのは、この二つの失敗を両方避けるためです。

確認は、データの分類から始める

最初の作業は、利用するデータの分類です。自社作成データ、顧客提供データ、公開ウェブデータ、購入データセットといった種類ごとに分けます。分類しないまま「データ」と一括りにすると、法務レビューが粗くなり、本当は問題のある一部のデータが、問題のない大多数に紛れて通ってしまいます。

次に、データの取得経路を追います。どこから取得したのか、利用規約はあるのか、商用利用できるのか。ウェブ上で閲覧できる情報でも、取得方法や利用目的によって問題の有無が変わります。

学習・入力の目的も確かめます。基盤モデルの学習なのか、社内検索用のRAGなのか、特定顧客向けの要約なのか、プロンプト内で一時的に参照するだけなのか、モデル改善に使うのか。目的が変わればリスクの性質が変わります。顧客資料や契約書を外部AIサービスに入力する場合は、サービス提供者による保存・学習利用の有無を必ず確認します。

著作権法上の検討では、学習段階と出力利用段階を切り分けます。学習段階では、権利制限規定の適用可能性や、著作権者の利益を不当に害するかどうかを見ます。出力利用段階では、既存著作物との類似性や依拠性、商用利用の範囲を見ます。

権利侵害を主張された場合への備えも、事前に用意しておく事項です。AIサービス提供者の補償条項や、問題ある出力を停止・削除する手順、制作過程の記録を確認します。後から「どのように作成したのか」を説明できないと、侵害の成否を検討する以前に、社内外への説明で行き詰まります。

仕上げは社内教育と承認フローです。従業員が、著名キャラクター風の画像、既存ブランドに似たロゴ、競合サイトに似たコピー、第三者コードに似た実装を安易に使わないよう、具体例で教育します。高リスクな外部公表物については、法務・知財・広報・事業部門の確認を挟む設計が実務に合っています。

開発者・提供者・利用者・委託取引、それぞれのリスク

AI開発者側では、学習データの由来と管理が中心的なリスクになります。データセットの取得元やライセンス、評価データの権利関係を記録しておきます。顧客や投資家に説明する場面で求められるのは、「適法と考えた理由」を抽象論ではなくデータ単位で示すことです。

AI提供者側では、利用者に何を説明するかが問われます。入力データを学習に使うのか、保存期間はどれくらいか、オプトアウトできるのか、出力結果の権利を誰が持つのか、第三者の権利侵害が主張された場合にどこまで補償するのか。ここを曖昧にしたまま販売すると、営業説明と契約条項がずれ、トラブル時にどちらの説明が契約内容なのかという二次紛争を抱えます。

AI利用者側では、入力してよい情報と出力の使い方が中心です。契約書や顧客資料、外部ライターの原稿をAIに入力する場合、契約上の利用目的や秘密保持義務に反しないかを確認します。出力を広告や製品UI、顧客向け資料に使う場合は、既存著作物との類似やサービス規約上の制限を確認します。

委託取引が絡むと、確認事項はさらに増えます。制作会社やライターがAIを使う場合、委託者としては、AI利用の可否や生成物の権利帰属、第三者権利侵害時の責任を契約で押さえたい場面があります。受託者側では、AI利用を全面禁止されると業務効率が落ちるため、許容範囲と確認手順を契約段階で明確にしておく実益があります。

このように、著作権・学習データのリスクは立場によって見え方が違います。法務では、自社がデータを提供する側なのか、AIを開発する側なのか、AIサービスを販売する側なのか、単に成果物を利用する側なのかを、案件ごとに切り分けることになります。

AIに著作権の結論を出させてはいけない理由

生成AIは、著作権や学習データに関する契約レビューの初動には役立ちます。利用規約から、学習利用や出力結果、国外移転に関する条項を抽出し、論点候補を並べるところまでは速いです。

しかし、AIの回答だけで著作権の結論を出すことは危険です。著作権侵害の判断では、対象となる著作物や創作性、依拠性を具体的に検討します。AIは一般論を示せますが、実際の画像や文章、制作過程を踏まえた判断には、人間の専門的確認が必要になる場面が多いです。

AIが参照している情報の鮮度にも限界があります。生成AIと著作権に関する考え方は、文化庁の資料や裁判例、海外動向の影響を受けて変化する可能性があります。AIの出力をそのまま信頼せず、現在の公式情報と自社の利用実態を照らして確かめます。

LegalAgentでは、生成AIと著作権の相談を「使える・使えない」の二択にしません。二択で答えると、使える場合の条件と、使えない場合の代替手段が全部落ちてしまうからです。どのデータを、どの目的で、どの環境に入れ、どの出力を、どの範囲で使うのか。ここまで分解したうえで、契約書、社内ポリシー、制作フロー、顧客説明に落とし込むことを大切にしています。

こうした生成AIと著作権・学習データの検討は、単発の質問対応よりも、日常の契約審査やポリシー整備とあわせて進める方が結果的に早く固まります。LegalAgentでは、法務アウトソーシングとスタートアップ法務・資金調達支援の中で、この領域のご相談をお受けしています。

キーワード

著作権・学習データ

キーワード一覧から探す