L’addestramento dei modelli di intelligenza artificiale generativa richiede l’accesso a vasti insiemi di dati, spesso provenienti da contenuti protetti da copyright. Questo ha portato a una serie di accordi tra aziende tecnologiche e editori, nonché a dibattiti legali e etici riguardanti l’uso di tali materiali.
Accordi tra aziende tecnologiche ed editori
Con l’aumento della popolarità dell’IA generativa, diverse aziende tecnologiche hanno cercato di utilizzare contenuti protetti da copyright per addestrare i loro modelli. Ad esempio, Microsoft ha stretto un accordo da 10 milioni di dollari con l’editore accademico Taylor & Francis per utilizzare i suoi articoli nell’addestramento dei propri sistemi di IA. Allo stesso modo, Wiley ha annunciato di aver guadagnato 23 milioni di dollari da un accordo con un’azienda anonima che sviluppa modelli di IA generativa. Questi accordi evidenziano una tendenza crescente tra gli editori a monetizzare i propri contenuti attraverso licenze con aziende tecnologiche.
Resistenze e preoccupazioni degli editori
Non tutti gli editori sono favorevoli a concedere in licenza i propri contenuti per l’addestramento dell’IA. Penguin Random House, ad esempio, ha adottato una politica per proteggere le opere dei suoi autori dall’uso non autorizzato da parte delle piattaforme di IA. La casa editrice ha modificato la pagina del copyright di tutti i suoi libri, aggiungendo una clausola che vieta espressamente l’utilizzo dei testi per l’addestramento di sistemi di IA. Questa decisione riflette le crescenti preoccupazioni riguardanti l’utilizzo di opere protette da copyright per addestrare modelli di intelligenza artificiale senza il consenso degli autori.
Azioni legali e richieste di compensazione
Le preoccupazioni degli editori hanno portato anche a azioni legali. Il New York Times, ad esempio, ha inviato una lettera di diffida alla startup Perplexity per aver utilizzato i suoi articoli per addestrare il proprio modello di IA senza autorizzazione. Inoltre, 13.500 artisti, scrittori e attori, tra cui Thom Yorke dei Radiohead e Julianne Moore, hanno firmato una dichiarazione contro l’uso non autorizzato delle loro opere per l’addestramento dell’IA generativa, sottolineando la minaccia che ciò rappresenta per le industrie creative.
Posizioni delle aziende tecnologiche
Dal canto loro, le aziende tecnologiche come OpenAI sostengono che l’addestramento dei modelli di IA su contenuti disponibili pubblicamente rientra nel “fair use” e non viola il copyright. In un documento inviato all’Ufficio Brevetti degli Stati Uniti, OpenAI ha affermato che l’addestramento dei modelli generativi utilizzando informazioni condivise pubblicamente sul web non costituisce una violazione del diritto d’autore, poiché tali attività sono considerate un uso equo.
Per affrontare queste sfide, si stanno esplorando vari modelli di licenza che potrebbero bilanciare gli interessi degli editori e delle aziende tecnologiche. Alcuni suggeriscono l’adozione di modelli simili a quelli dell’industria musicale, dove autori e distributori condividono i ricavi. Altri propongono licenze annuali illimitate o basate sulla condivisione dei ricavi. Tuttavia, la definizione di standard di pagamento universalmente accettati rimane una questione complessa, e le negoziazioni tra le parti sono ancora in corso.
L’uso di contenuti protetti da copyright per l’addestramento di modelli di intelligenza artificiale generativa solleva questioni legali, etiche ed economiche. Mentre alcuni editori vedono opportunità di monetizzazione attraverso accordi di licenza, altri esprimono preoccupazioni riguardo alla protezione dei diritti degli autori. Le aziende tecnologiche, d’altra parte, cercano di bilanciare l’accesso ai dati necessari per l’addestramento dei loro modelli con il rispetto delle leggi sul copyright. Il futuro di queste interazioni dipenderà dalla capacità di sviluppare modelli di licenza equi e sostenibili che soddisfino le esigenze di tutte le parti coinvolte.
Fonte: NATURE