News Tecnologia

La scienza svela come smascherare un testo scritto da un’IA

ai-scienza-arxive

Immagina di essere un esaminatore, intento a scoprire chi ha scritto un certo testo. Sarebbe utile sapere come riconoscere se è stato scritto da un’intelligenza artificiale, per smascherare i furbacchioni? 

Un recente studio ha passato al setaccio ben 14 milioni di articoli scientifici.  Gli scienziati hanno scoperto che certi termini stanno diventando molto più frequenti rispetto al passato. Questo potrebbe essere il segno che dietro c’è lo zampino di un’IA. E c’è di più: hanno scoperto che circa il 10% delle pubblicazioni scientifiche dal 2022 in poi sono quasi certamente state scritto con l'”aiutino” della intelligenza artificiale

L’Idea nata dal Covid-19

I ricercatori delle università di Tubingen e Northwestern si sono ispirati alle “morti in eccesso” registrate durante la pandemia di Covid-19 per trovare un metodo per individuare i testi scritti da IA. Hanno analizzato le “parole in eccesso” generate da modelli linguistici avanzati come ChatGPT e Gemini.

Parole in eccesso: la prova

Questi scienziati hanno scoperto che l’avvento degli LLM (Large Language Models) ha portato a un brusco aumento di alcuni termini specifici, un fenomeno mai visto prima. Nel loro paper pubblicato su arXiv, spiegano di aver confrontato la frequenza di queste parole prima e dopo il 2023. Risultato? Le parole come “approfondisce” sono spuntate 25 volte più del previsto nei paper del 2024. Parole come “evidenziare” e “sottolineare” sono aumentate di nove volte. Altri termini come “potenziale”  “cruciale” e “risultati” hanno visto aumenti significativi.

Perché queste parole?

Ecco perché queste parole sono indizi chiave:

  1. Evoluzione Linguistica: Le lingue cambiano, ma non così velocemente! Studi precedenti hanno dimostrato che le parole usate più spesso cambiano più lentamente. Quindi, vedere un cambiamento drastico è sospetto.
  2. Cambiamenti Radicali: Prima dell’arrivo di strumenti come ChatGPT, solo crisi globali causavano tali picchi nell’uso di certi termini. Ricordi come “ebola” nel 2015 o “coronavirus” nel 2020? Ecco, quei cambiamenti erano legati a eventi mondiali.

Stile vs. contenuto

I ricercatori hanno notato che le “parole in eccesso” dei testi IA sono principalmente verbi, aggettivi e avverbi, non pronomi. Questo conferma che le IA tendono a essere prolisse, riempiendo i testi con dettagli stilistici che spesso un umano eviterebbe.

Individuare un testo scritto da un’IA è complicato, ma non impossibile. Anche se strumenti come GPTZero cercano di smascherare l’uso di ChatGPT, la loro precisione è ancora incerta. Persino OpenAI ha chiuso il suo strumento “AI Classifier” perché non riusciva a distinguere in modo affidabile tra testi umani e IA.

Fonte: https://arxiv.org/abs/2406.07016

Comments

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *