IA générative et droits de propriété intellectuelle

Dans Juridique
Par Constantin Pavléas

L’avènement de l’intelligence artificielle générative accessible au grand public pose une série de questions en matière de propriété intellectuelle. Les créateurs de grands modèles de langage peuvent-ils utiliser les données disponibles sur le web pour entraîner leurs algorithmes ? A quelles obligations de transparence sont-ils astreints ? Quelle rémunération pour les détenteurs des données concernées ? La directive européenne E-copryight du 17 avril 2019 et l’IA Act, dont l’accord politique a été acté en décembre 2023 et qui devrait être promulgué , ont tranché en partie ces questions.

Par ailleurs, les « créations » réalisées par des systèmes d’intelligence artificielle avaient déjà suscité des questions par le passé quant aux droits de propriété intellectuelle qui pourraient naître de ces créations, mais également la rémunération des auteurs dont les œuvres ont inspiré la machine.

IA générative et rémunération des auteurs et détenteurs des données ayant servi à l’entraînement des algorithmes

Réglementation européenne

La Directive e-copyright crée une exception aux règles du droit d’auteur pour la fouille de textes et de données (Text and data mining (TDM)). Cette pratique désigne la mise en œuvre d’une technique d’analyse automatisée de textes et données sous forme numérique afin d’en dégager des informations, notamment des constantes, des tendances et des corrélations. Les reproductions et extractions effectuées dans ce cadre peuvent être conservées aussi longtemps que nécessaire aux fins de la fouille de textes et de données. L’exception légale est soumise à la possibilité pour les auteurs de contenu de s’opposer à l’utilisation de leurs données (opt-out). La directive e-copyright ne crée pas un droit à rémunération spécifique des auteurs en cas de TDM. En pratique, les auteurs ou leurs ayants-droits (sociétés de presse, sociétés de gestion collective) qui se seront opposés au TDM pourront négocier ad hoc une rémunération pour donner accès à leurs données.

L’IA Act ne déroge pas à l’exception instituée par la directive e-copyright. Par conséquent, sauf opposition des auteurs, l’exception instituée par la directive e-copyright permet aux créateurs de modèles de langage d’entraîner leurs algorithmes sur les données disponibles sur le web, sans rémunérer les auteurs de contenu.

Or, afin que les auteurs puissent identifier si leur contenu a été utilisé par les algorithmes d’intelligence artificielle, le législateur européen a institué des obligations de transparence au titre desquelles les créateurs de grands modèles de langage d’IA doivent établir et publier « un résumé suffisamment détaillé » du contenu utilisé pour entraîner leurs algorithmes.

Ainsi, les auteurs qui se seront opposés à la pratique du TDM et qui auront identifié leur contenu dans la liste rendue publique, pourront revendiquer une rémunération pour laisser les algorithmes d’IA générative s’entraîner sur leurs œuvres.

Enfin, il doit être relevé que selon l’article 3 de la directive e-copyright, la pratique du TDM est autorisée, sans consentement ou droit d’opposition des auteurs – et donc sans droit à rémunération – sur les reproductions et les extractions effectuées par des organismes de recherche et des institutions du patrimoine culturel à des fins de recherche scientifique.

Dans le domaine de la recherche médicale et scientifique, cette exception est très importante dans la mesure où elle permet aux organismes de recherche d’entraîner librement des grands modèles de langage à la fois sur les publications scientifiques et sur les données publiquement disponibles en ligne. On a vu des avancées époustouflantes réalisées par l’IA dans le domaine scientifique, et notamment dans le domaine médical. Pour ne citer qu’un exemple récent, l’IA a été capable de discerner des cerveaux féminins et masculins à partir de l'analyse d'IRM cérébrales. L'algorithme a notamment utilisé certains réseaux du cerveau liés aux émotions .

Mais au-delà des questions relatives à la rémunération des auteurs dont le contenu a servi pour entraîner des grands modèles IA, la production d’images et de textes générée par l’IA nous amène à nous interroger sur la possibilité d’attribuer un droit d’auteur au créateur de la machine, voire à la machine elle-même pour ces créations.

Positions des auteurs en France

Face à cette situation, les artistes et ayants-droits font valoir leur point de vue. Pour le droit d’utilisation des images, c’est l’ADAGP, la société des auteurs dans les arts graphiques, plastiques et photographiques, dont la mission principale est de percevoir et de répartir les droits d’auteur de ses adhérents dans le monde entier, qui nourrit la réflexion. Elle préconise que les évolutions attendues du cadre législatif prennent en compte trois dimensions du problème : le consentement des auteurs, leur rémunération, et la transparence des systèmes d’IA.

1- Le consentement des auteurs : si le système de l’opt-out, c’est-à-dire le droit d’utiliser les œuvres tant que l’auteur ne s’y oppose pas, est pour le moment en vigueur, il est difficilement applicable pour des images qui peuvent être diffusées sur des milliers de sites et sous des formats différents. En attendant la mise en place éventuelle d’un opt-in, aux termes duquel l’œuvre n’est utilisable que si l’auteur donne son accord, l’ADAGP préconise, dans le cadre d’accords conclus entre les sociétés d’auteur et les opérateurs d’IA, la mise en place de mesures plus abouties permettant de rendre l’opt out effectif pour les auteurs.

2- Une juste rémunération des auteurs : la solution pourrait passer par la mise en place d’un mécanisme légal de rémunération obligatoire, permettant de compenser le préjudice subi par les auteurs, ou par la conclusion de contrats de licence, comme c’est le cas pour les plateformes musicales de streaming.

3- La transparence des systèmes d’IA : certains géants de la tech commencent à répondre à cette attente. C’est par exemple le cas de Google, qui a annoncé en août 2023 avoir créé un système de watermarking pour déterminer la provenance et l’origine d’une œuvre, et donc de mieux la protéger. Cette transparence est désormais renforcée par les obligations imposées par l’IA Act aux créateurs de modèles d’IA à usage générique d’établir et de publier une liste suffisamment détaillée des contenus utilisés.

Face à des acteurs de pointe de l’IA générative comme OpenAI ou Stability AI, qui permettent de produire à l’infini du texte, des vidéos, des images et du code, les plaintes commencent à se multiplier. L’UE se devait donc de définir au plus vite des règles qui protègent les ayant-droits, tout en préservant le potentiel d’innovation des leaders européens de l’IA confrontés à leurs puissants concurrents américains ou chinois.

Fonds européen d’indemnisation des auteurs

Concrètement, laisser aux auteurs le soin de négocier avec les géants de la technologie, en ordre dispersé, une rémunération spécifique pour laisser les grands modèles de langage s’entraîner sur leur contenu, est tâche ardue. Nous appelons de nos vœux la création d’un droit dérivé pour rémunérer les auteurs de contenu dont l’œuvre a été utilisée à des fins d’entraînement des algorithmes, à l’instar du droit voisin institué pour les éditeurs de presse (art 13 de la Directive e-copyright de 2019). Aussi, pour éviter l’écueil d’interminables négociations entre les parties prenantes dans chaque pays de l’Union européenne, le nouveau droit voisin pourrait être rémunéré par un fonds européen d’indemnisation des auteurs de contenu financé par l’industrie de la tech.

Vers un nouveau régime des créations réalisées par l’intelligence artificielle ?

Cela fait déjà plusieurs années que les développements spectaculaires de l’intelligence artificielle s’appliquent à la création d’œuvres d’art et que l’on sait que cela aura des répercussions sur les règles qui gouvernent le droit d’auteur.

Dès 2020, le Conseil Supérieur de la Propriété Littéraire et Artistique (CSPLA) a rendu un rapport sur l’utilisation de l’intelligence artificielle dans la culture qui énonce que le droit positif doit accueillir les réalisations assistées par intelligence artificielle, tout comme il a pu accueillir d’autres évolutions technologiques dans le passé. Dans cette optique, un droit spécial devrait permettre une protection ajustée.

Jusqu’à une période récente, la titularité du droit d’auteur rattaché à une œuvre créée par ordinateur ne faisait pas de doute, le programme informatique étant un simple outil mis au service du processus créatif, au même titre qu’un pinceau ou une feuille de papier. Aujourd’hui, les modèles d’intelligence artificielle comme ChatGPT, Gemini ou Copilot changent la donne car le programme informatique utilisé ne sert plus simplement d’outil. Il peut prendre à sa charge les décisions liées au processus créatif sans entraîner d’intervention humaine.

Jusqu’ici, selon les cas et les pays, les législations en cours sur le droit d’auteur traitaient de deux façons distinctes les œuvres créées avec l’aide de l’IA : soit pour décréter que l’œuvre créée par une machine ne pouvait être protégée au titre du droit d’auteur, soit pour déterminer que la paternité de l’œuvre revenait au concepteur du programme. Dans ce dernier cas, la question restait néanmoins ouverte de savoir qui serait considéré, en droit, comme la personne ayant pris les dispositions nécessaires pour créer l’œuvre.

Aujourd’hui, avec la généralisation du recours à l’intelligence artificielle par les auteurs, et du fait du perfectionnement des machines et des algorithmes de création, la situation se complexifie. La frontière entre une œuvre réalisée par une personne et une œuvre produite par ordinateur devient de plus en plus floue. Il est même devenu très aléatoire de faire la différence entre deux contenus, l’un inventé par l’homme, et l’autre créé par un ordinateur. Dans ces conditions, la question se pose : les ordinateurs pourront-ils à l’avenir bénéficier du même statut et des mêmes droits que les personnes ?

Faire évoluer la législation

En France, les dispositions actuelles du code de la propriété intellectuelle s’appliquent à la protection du droit des auteurs sur toutes les œuvres de l’esprit, quels qu’en soient le genre, la forme d’expression, le mérite ou la destination, mais elles n'évoquent d'aucune manière les œuvres générées par l'IA. Et pour cause, le droit d’auteur est réservé aux êtres humains !

Des élus s’en sont inquiété en affirmant que, face à l’IA, un écosystème qui avance à pas de géant, le législateur doit impérativement protéger les auteurs et artistes de la création et de l’interprétation, en accord juridique avec le Code de la propriété Intellectuelle. Selon eux, il faut trouver une parade pour endiguer ce qui semble être une menace et éviter ce qui pourrait être un désastre à venir pour la création, qu’il s’agisse des arts plastiques, de l’image photographique, des livres, de la musique, des articles scientifiques ou de presse. Ils soulignent que ces secteurs déjà précaires sont fragiles économiquement car soumis, en termes de rémunération, aux droits d’auteur à la française. D’où une proposition visant à répondre au flou juridique qui entoure les œuvres générées par l’IA générative grâce à un système de traçabilité des œuvres, dans le but de collecter plus facilement les rémunérations perçues sur celles-ci et garantir une rémunération juste et équitable pour leur exploitation. L’objectif est que les œuvres de l’esprit créées à l’aide de modèles d’IA soient protégées par le droit d’auteur et, à ce titre, soumises aux dispositions générales du code de la propriété intellectuelle, c’est à dire à autorisation des auteurs ou ayants droit. Dans ce cas, il deviendrait obligatoire d’apposer la mention « œuvre générée par IA » et d’insérer le nom des auteurs des œuvres qui ont permis d’aboutir à une telle création.

Dans l’éventualité où une œuvre de l’esprit est engendrée par un dispositif d’intelligence artificielle à partir d’œuvres dont l’origine ne peut être déterminée, une taxation destinée à valoriser la création serait instaurée au bénéfice de l’organisme chargé de la gestion collective. En clair, il s’agirait d’inciter n’importe quel système d’IA à respecter coûte que coûte le droit d’auteur…

Reste à savoir si - et comment - il pourra être atteint en pratique. Autant de questions qui à restent débattre pour trouver une solution juste pour les auteurs, sans entraver l’innovation technologique.