AIの著作権侵害:何をするとアウトなのか?トムソン・ロイター訴訟が示すNG行為とは

AI

AI技術の進化に伴い、著作権の問題がより深刻になってきています。特に、AIの学習データとして著作物を無断使用することが、どこまで許されるのかが大きな論点となっています。

今回、Thomson Reuters(トムソン・ロイター)がRoss Intelligenceを相手取った訴訟で勝訴したことで、AIのトレーニングにおける「公正利用(フェアユース)」の範囲が明確になりました。

では、具体的に「何をするとダメなのか?」を解説していきます。


1. 他社の著作物を無断でAIのトレーニングに使用するのはNG

Ross Intelligenceは、Westlawの判例要旨(ヘッドノート)を無断で利用し、AIのトレーニングデータとして使っていました。

しかし、裁判所はこれを「公正利用」に該当しないと判断。理由は次の通りです。

  • AIが元データの市場を奪う可能性がある

    • Ross IntelligenceのAIツールは、Westlawと競合する形で提供されていた。
    • これは、Thomson Reutersの市場価値を直接損なうものと判断された。
  • データの取得方法が不適切

    • Ross Intelligenceは、直接Westlawからデータを取得したわけではなく、LegalEase Solutionsから購入した「Bulk Memos」を使用。
    • しかし、その内容がWestlawのヘッドノートと酷似していたため、実質的なコピーと見なされた。

結論:AIの学習データとして著作物を使う場合は、事前に許諾を得ることが必須!


2. 著作物を言い換えただけでも著作権侵害になる可能性がある

「そのままコピーしなければ大丈夫」と思っていませんか?実は、著作物を言い換えたとしても、著作権侵害にあたる可能性があります。

裁判では、「Ross IntelligenceのAIが出力するデータが、Westlawのヘッドノートに似すぎている」と指摘されました。

  • 元データを直接コピーしなくても、AIの出力が類似していれば違法と判断される可能性がある。
  • 単なる言い換え(パラフレーズ)では、著作権の問題を回避できない。

結論:AIの出力内容が元の著作物に酷似している場合、著作権侵害と判断される可能性がある!


3. AIトレーニングデータの取得方法にも注意が必要

AIの開発者は、「直接コピーしなければ問題ない」と考えがちですが、それも危険です。

今回の訴訟では、Ross Intelligenceが直接Westlawからデータを取得したのではなく、第三者(LegalEase Solutions)からデータを購入していました。

しかし、そのデータが実質的にWestlawの内容と一致していたため、著作権侵害と判断されました。

  • 第三者からデータを入手したとしても、そのデータが著作権侵害に基づくものであれば違法。
  • 「他社が提供したデータだから知らなかった」は通用しない。

結論:AIトレーニングデータの出所を明確にし、正規のライセンス契約を結ぶことが必須!


4. AIによる著作物の生成もリスクあり

AIが生成したコンテンツが、著作権で保護された作品に似ていた場合、それも問題になる可能性があります。

現在、以下のようなケースでAI企業が訴訟を受けています。

  • The New York Times vs. OpenAI & Microsoft

    • ChatGPTがNew York Timesの記事を学習し、類似した文章を生成した可能性があるとして提訴。
  • Getty Images vs. Stability AI

    • AIが無断でGetty Imagesの写真を学習し、著作権侵害をしているとして訴訟。

結論:AIが出力する内容が、既存の著作物とどれくらい似ているかを慎重にチェックする必要がある!


5. 企業やクリエイターとライセンス契約を結ぶのが安全策

多くのAI企業は、著作権問題を回避するために、コンテンツ提供者と正式なライセンス契約を結び始めています。

例えば、

  • OpenAIは、Axios・Hearst・CondeNastとライセンス契約を締結
  • Perplexityは、FortuneやTimesとパートナーシップを構築

このように、合法的にデータを利用するためには、著作権者と協力関係を築くことが重要です。

結論:ライセンス契約を結ぶことで、著作権リスクを最小限に抑えられる!


まとめ|AI著作権侵害でNGな行為とは?

今回の訴訟は、AI業界にとって重要な判例となりました。では、AI開発において絶対に避けるべきことをまとめます。

著作物を無断でAIのトレーニングデータに使用する
「言い換え」や「パラフレーズ」でも著作権侵害の可能性がある
第三者からのデータ提供でも、著作権侵害を回避できるとは限らない
AIが著作権で保護されたコンテンツと酷似した出力をするのはリスク大

ライセンス契約を結び、合法的にデータを活用するのが最善策!

AI技術は急速に進化していますが、法律の壁を無視することはできません。

これからの時代、AIを開発・運用する企業は、著作権リスクを理解し、適切な対応を取ることが求められます。

あなたのAI開発は、大丈夫ですか?👀🚀

最新情報をチェックしよう!