Una delle questioni più pressanti poste dallo sviluppo dell’intelligenza artificiale riguarda la possibilità, da parte dei titolari di diritti d’autore, di esercitare una riserva (c.d. "opt-out") per impedire che le proprie opere vengano utilizzate per l’addestramento dei sistemi di intelligenza artificiale per finalità generali. Questa facoltà trova le sue basi normative nella Direttiva UE 2019/790, nota anche come Directive on Copyright in the Digital Single Market (DCDSM), e nel più recente Regolamento UE 2024/1689, comunemente denominato AI Act.
In particolare, l’articolo 4, paragrafo 3 della DCDSM ha introdotto a livello europeo la possibilità per i titolari dei diritti di riservare l’uso delle proprie opere rispetto alle pratiche di estrazione automatizzata di dati e contenuti (Text and Data Mining - TDM). Si tratta di processi automatizzati di analisi di grandi volumi di dati e testi digitali, spesso utilizzati per addestrare modelli di intelligenza artificiale o per effettuare analisi di pattern. Tale previsione è stata poi rafforzata e integrata dall’articolo 53, paragrafo 1, lettera (c) dell’AI Act, che impone ai fornitori di modelli di intelligenza artificiale per finalità generali l’adozione di policy efficaci per garantire il rispetto della disciplina UE in materia di diritto d’autore e diritti connessi.
L’introduzione e la garanzia del diritto di riserva risulta fondamentale anche in virtù dell’eccezione a favore del TDM delineata agli articoli 3 e 4 della DCDSM. L’articolo 3 consente l’utilizzo, senza consenso, di contenuti protetti dal diritto d’autore per finalità di ricerca scientifica, e non può essere oggetto di opt-out. L’articolo 4 invece permette l’uso anche per scopi ulteriori, ad esempio commerciali, ma consente al titolare del diritto di opporsi. Il diritto di opt-out permette quindi ai titolari di escludere le proprie opere dal TDM per gli usi rientranti nell’art. 4, ma non per quelli dell’art. 3.
In Italia, già prima dell’entrata in vigore del Regolamento europeo, l’articolo 70-quater della legge 22 aprile 1941 n. 633, introdotto con il D. Lgs. 8 novembre 2021 n. 177 in attuazione della DCDSM, riconosceva il diritto di riserva per le opere e i materiali protetti presenti online o in banche dati. Questa disposizione nazionale si ritiene applicabile anche ai casi in cui i fornitori di IA raccolgono dati in fase di addestramento dei modelli per finalità generali.
La nuova disciplina europea ha il merito di rafforzare e armonizzare a livello comunitario questa tutela, offrendo maggiore certezza e uniformità agli operatori del settore. Un ulteriore tassello normativo è rappresentato dal processo di redazione del Codice di Buone Pratiche in materia di Intelligenza Artificiale per Scopi Generali (CPAI), attualmente giunto alla terza versione del draft, che si concluderà nel mese di maggio 2025. Questo documento, elaborato con il coinvolgimento della Commissione Europea e degli stakeholder del settore, mira a definire in modo operativo le disposizioni dell’AI Act. La versione attuale del draft include già una serie di misure (I.2 – I.2.6) che impegnano i firmatari a garantire la conformità alla normativa UE in materia di diritto d’autore.
L’aspetto più dibattuto riguarda le modalità concrete attraverso cui i titolari di diritti possono esercitare il diritto di opt-out, e come i gestori dei modelli IA possano rilevarle e rispettarle. Attualmente, lo strumento più diffuso è il Robot Exclusion Protocol, noto come robots.txt, che consente di limitare l’accesso dei web crawler ai contenuti online. Tuttavia, essendo un protocollo informatico pensato per i motori di ricerca degli anni ‘90, risulta almeno in parte inadeguato rispetto alle esigenze attuali.
Per questo motivo, si discute se una riserva espressa in linguaggio naturale (anziché informatico) possa essere considerata valida. Una prima indicazione giunge dalla giurisprudenza tedesca, con la pronuncia del Tribunale di Amburgo nel caso Kneschke/LAION del 27 settembre 2024, secondo cui, in via obiter dictum, anche una riserva espressa in linguaggio naturale può essere considerata "machine-readable" alla luce delle tecnologie attuali. Questo principio è coerente con l’art. 53, par. 1, lett. (c) dell’AI Act, che impone ai fornitori l’adozione di strumenti tecnologici "all’avanguardia" per rilevare eventuali riserve, indipendentemente dalla forma espressiva. Tuttavia, va precisato che tale interpretazione, espressa in via obiter dictum dal Tribunale di Amburgo, non ha ancora valore vincolante a livello dell’Unione Europea e costituisce un orientamento giurisprudenziale emergente, in attesa di un consolidamento normativo o giudiziale.
Negli ultimi anni sono infatti emersi strumenti più avanzati rispetto al robots.txt:
meta tag: elementi HTML che possono contenere istruzioni per i motori di ricerca e i crawler, compresa la riserva sui diritti;
ai.txt: file collocabile nella root del sito con istruzioni specifiche per i crawler di IA;
Spawning: piattaforma che consente agli artisti di verificare se le proprie opere sono nei dataset IA e di opporsi all’uso;
tdmrep.json: protocollo web per esprimere la riserva TDM;
C2PA Content Credentials: metadati inseriti nel file stesso (immagini, video, testi) con indicazioni sull’uso consentito.
Inoltre, molte piattaforme, incluse alcune app e social media, hanno introdotto meccanismi per l’opt-out sui contenuti caricati dagli utenti.
Rimane tuttavia irrisolta la questione della mancanza di uno standard unico e interoperabile che renda il diritto di opt-out inequivocabile e facilmente rilevabile da parte dei soggetti che utilizzano tecniche di web scraping per l’addestramento di modelli IA. Fino all’introduzione di un registro centralizzato, i fornitori di modelli di intelligenza artificiale sono comunque tenuti ad adottare tecnologie "all’avanguardia" per rilevare e rispettare le riserve, come previsto anche dagli obblighi di trasparenza agli articoli 53, par. 1, lettere (a) e (b) dell’AI Act.
In questo contesto si inserisce l’iniziativa della Commissione Europea del 23 gennaio 2025, che ha pubblicato un bando per valutare la fattibilità tecnica e giuridica di un registro digitale centralizzato per le riserve TDM. Un simile registro permetterebbe una comunicazione più efficace tra titolari dei diritti e fornitori di IA, semplificando la gestione delle richieste di esclusione.
Non è ancora stato deciso quale ente sarà incaricato della gestione di tale registro. Tra i candidati figurano l’EUIPO (Ufficio dell’Unione Europea per la Proprietà Intellettuale) e il nuovo Ufficio Europeo per l’Intelligenza Artificiale, istituito nel 2024 per supervisionare l’applicazione dell’AI Act.
In conclusione, il diritto di opt-out rappresenta un elemento centrale nel bilanciamento tra innovazione tecnologica e tutela della proprietà intellettuale. Sebbene le basi normative siano ormai solide, la sfida più grande resta quella di sviluppare strumenti tecnici accessibili, chiari e standardizzati che consentano l’effettiva applicazione di questo diritto in un contesto digitale in rapida evoluzione.