Gli editori vedono nello strumento di ricerca AI di Google un incubo per il loro traffico web

di Keach Hagey, Miles Kruppa e Alexandra Bruell, Wall Street Journal 14/12/2023 20:16

Il prodotto di ricerca AI del gigante tecnologico è in fase di test su circa 10 milioni di utenti. Ma gli editori, per cui Google è un veicolo prezioso per portare traffico sui loro siti, vedono arrivare una tempesta. Ecco perché

Poco dopo il lancio di ChatGPT, il media americano Atlantic ha stilato una lista delle maggiori minacce che l'intelligenza artificiale generativa (IA) può rappresentare per la sua testata, che ha 166 anni. Al primo posto: L'adozione della tecnologia da parte di Google.

Circa il 40% del traffico web della rivista proviene da ricerche effettuate su Google, che portano alla scoperta di link su cui gli utenti fanno clic. Una task force dell'Atlantic ha analizzato cosa potrebbe accadere se Google integrasse l'intelligenza artificiale nella ricerca. Ha scoperto che il 75% delle volte la ricerca alimentata dall'intelligenza artificiale fornirebbe probabilmente una risposta completa alla domanda dell'utente e il sito dell'Atlantic perderebbe il traffico che altrimenti avrebbe ottenuto.

Quella che una volta era una minaccia ipotetica è ora molto reale. Da maggio, Google sta testando un prodotto di intelligenza artificiale denominato "Search Generative Experience" su un gruppo di circa 10 milioni di utenti e ha manifestato l'intenzione di inserirlo nel cuore del suo motore di ricerca principale.

Leggi anche: Mercati, chi paga se l’AI sbaglia a investire? Tutti i nodi dell’utilizzo dell’Intelligenza Artificiale in finanza

I rischi di affidarsi alle big tech

L'integrazione dell'intelligenza artificiale da parte di Google sta mettendo in luce per i media i rischi di affidarsi alle grandi aziende tecnologiche per far arrivare i propri contenuti ai lettori e agli spettatori. Gli editori sono già alle prese con un forte calo del traffico proveniente dai siti di social media, dato che Meta e X, l'ex Twitter, si sono ritirati dalla distribuzione di notizie.

Per quanto grave sia il calo dei social media, la ricerca generativa alimentata dall'intelligenza artificiale di Google è il vero incubo per gli editori. In tutto il mondo dei media, Google genera quasi il 40% del traffico degli editori, rappresentando la quota maggiore dei loro "referral", secondo un'analisi del Wall Street Journal sui dati della società di misurazione Similarweb.

"L'IA e i modelli linguistici di grandi dimensioni hanno il potenziale per distruggere il giornalismo e i brand media così come li conosciamo", ha dichiarato Mathias Dopfner, presidente e amministratore delegato di Axel Springer, riferendosi alla tecnologia che rende possibile l'IA generativa. La sua azienda, uno dei maggiori editori europei e proprietaria delle testate statunitensi Politico e Business Insider, ha annunciato questa settimana un accordo per concedere in licenza i propri contenuti allo specialista di IA generativa OpenAI.

Sebbene Google affermi che la forma finale del suo prodotto di intelligenza artificiale sia ancora lontana dall'essere definita, gli editori hanno visto abbastanza per stimare che perderanno tra il 20% e il 40% del loro traffico generato da Google se qualcosa di simile alle recenti iterazioni si diffonderà su larga scala. Google ha dichiarato di dare priorità all'invio di traffico agli editori.

Leggi anche: Intelligenza artificiale, accordo tra OpenAI e Axel Springer: ChatGpt si allenerà (pagando) sugli articoli dell’editore

Il lungo e difficile matrimonio tra Google e gli editori

L'ascesa dell'intelligenza artificiale è l'ultimo e più inquietante capitolo del lungo e difficile matrimonio tra Google e gli editori, che sono stati legati l'uno all'altro da una transazione di base: Google aiuta gli editori a farsi trovare dai lettori e gli editori forniscono a Google informazioni - milioni di pagine di contenuti web - per rendere utile il suo motore di ricerca.

Secondo i dirigenti dell'editoria, l'adozione dell'intelligenza artificiale nella ricerca da parte di Google rischia di far saltare questo delicato equilibrio, aumentando drasticamente il rischio che le ricerche degli utenti non portino a cliccare sui link che li portano ai siti degli editori. La cosa più irritante per gli editori è che la ricerca AI di Google sia stata addestrata, in parte, sui loro contenuti e su altro materiale proveniente da tutto il web, senza alcun pagamento per l’utilizzo.

Google ritiene che tutto ciò che è disponibile su Internet sia adatto all'addestramento di modelli di intelligenza artificiale. L'azienda cita una dottrina legale che consente l'utilizzo di porzioni di un'opera protetta da copyright senza autorizzazione per casi come la critica, la cronaca o la ricerca.

Le nuove funzioni di ricerca sono anche un gioco di equilibri per Google, che si è mossa rapidamente per rimodellare il suo prodotto di punta, in risposta alla crescente popolarità di chatbot come ChatGPT. Le modifiche rischiano di danneggiare i proprietari di siti web che producono materiale scritto, che è vitale sia per il motore di ricerca di Google che per i suoi potenti modelli di intelligenza artificiale.

"Se Google ammazza troppi editori, non potrà costruire l'LLM", ha dichiarato il consulente per i media digitali Matthew Goldstein, che è stato uno dei primi a lanciare l'allarme sul potenziale impatto sulle attività degli editori.

Liz Reid, vicepresidente di Google che si occupa del motore di ricerca, ha dichiarato che l'azienda è impegnata nel portare traffico agli editori web. Ha dichiarato che Google ha avuto più interlocuzioni con gli editori di quanto non faccia di solito dopo aver introdotto modifiche sostanziali alla ricerca, perché "si tratta di un cambiamento più significativo nell'evoluzione dello spazio web". Non ha fornito alcuna tempistica per l'introduzione più ampia dello strumento di ricerca potenziato dall'intelligenza artificiale da parte di Google.

"Qualsiasi tentativo di stimare l'impatto sul traffico del nostro esperimento SGE è del tutto speculativo in questa fase, poiché continuiamo a evolvere rapidamente l'esperienza utente e il design, compreso il modo in cui vengono visualizzati i link, e monitoriamo attentamente i dati interni dei nostri test", ha dichiarato Reid.

Tutto questo ha portato Google e gli editori a portare avanti un dialogo sempre più complesso. In alcuni incontri, Google sta presentando i potenziali vantaggi di altri strumenti di intelligenza artificiale che sta costruendo, tra cui uno che aiuterebbe a scrivere e pubblicare articoli di cronaca, secondo quanto riferito da persone che hanno familiarità con la questione. Molte testate giornalistiche, da BuzzFeed a Gannett, proprietario di USA Today, stanno già sperimentando strumenti di IA.

Allo stesso tempo, gli editori stanno cercando di ottenere da Google rassicurazioni sulla protezione delle loro attività da uno strumento di ricerca alimentato dall'IA che probabilmente ridurrà il loro traffico, e stanno chiarendo che si aspettano di essere pagati per i contenuti utilizzati nell'addestramento dell'IA. Alcuni editori, tra cui News Corp (proprietario del Wall Street Journal) e il New York Times, hanno già rapporti commerciali con Google. L'amministratore delegato di News Corp, Robert Thomson, ha espresso le sue preoccupazioni riguardo all'IA, tra cui il potenziale di contenuti distorti o inaccurati, la sostituzione di posti di lavoro e l'uso di contenuti degli editori senza autorizzazione.

"L'editoria digitale sta entrando in un periodo di trasformazione ed è sotto attacco", ha dichiarato Ross Levinsohn, ex amministratore delegato del Gruppo Arena, che pubblica Sports Illustrated, The Street, Parade e altre testate.

Leggi anche: Intelligenza artificiale, bene l’accordo sull’AI Act ma la strada è ancora lunga. Ecco perché ora non si deve sbagliare

La promessa di Google

Barry Diller, presidente di IAC ed Expedia, ha dichiarato che tutte le principali aziende di IA, tra cui Google e i suoi concorrenti come OpenAI, hanno promesso che continueranno a veicolare traffico ai siti degli editori. " Ma sono stati molto chiari con noi e con altri editori: come lo faranno, non lo sanno davvero", ha detto.

Secondo Similarweb, molte delle testate di IAC, come Brides, Investopedia e the Spruce, ricevono più dell'80% del loro traffico da Google.

I manager di IAC si sono incontrati con i dirigenti di Google alla conferenza organizzata da Allen & Company a Sun Valley, Idaho, lo scorso luglio, per discutere di AI. Durante l'incontro, secondo le fonti del WSJ, Google ha detto agli editori che non è in grado di rintracciare direttamente le fonti dietro i risultati dei sistemi di IA, nonostante i recenti progressi tecnologici,.

"Al momento, è tutto conciliante", ha detto Diller a proposito del tono che Google e altre aziende tecnologiche hanno assunto negli incontri con gli editori sull'IA.

Ciononostante, alla conferenza a porte chiuse Newsgeist di quest'anno a Phoenix, un evento annuale organizzato da Google e dalla Knight Foundation per gli editori che in passato è stato caratterizzato dall’aver servito cocktail con nomi sfacciati, come "The Angry Editor" e "Missed Deadline", l'atmosfera era meno allegra rispetto agli anni precedenti. In alcune sessioni, i dirigenti dell'editoria si sono lamentati dello strumento di ricerca IA, affermando che avrebbe privato gli editori del traffico e quindi dei ricavi.

Google ha iniziato a distribuire lo strumento di ricerca IA a maggio, consentendo agli utenti di partecipare ai test. Utilizzando un'interfaccia di chat in grado di comprendere le domande più lunghe in linguaggio naturale, mira a fornire quelle che definisce "istantanee" - o sintesi - delle risposte, invece delle risposte più pesanti in termini di link che vengono tradizionalmente fornite nei risultati di ricerca.

All'inizio Google non includeva i link all'interno delle risposte, ma li inseriva in riquadri a destra del passaggio. In seguito, ha aggiunto righe con i link, in seguito al feedback dei primi utenti. Alcune versioni più recenti richiedono agli utenti di fare clic su un pulsante per espandere il riepilogo prima di ottenere i link. Google non descrive i link come materiale di partenza, ma piuttosto come conferma dei suoi sommari.

Durante la recente visita del Presidente cinese Xi Jinping a San Francisco, il bot di ricerca dell'intelligenza artificiale di Google ha risposto alla domanda "Che cosa ha detto il Presidente Xi?" con due citazioni dal suo discorso di apertura. Gli utenti dovevano cliccare su una piccola freccia rossa per espandere la risposta e vedere un link alla storia della CNBC da cui erano state tratte le dichiarazioni. L'articolo della CNBC si trovava anche all'estrema destra dello schermo in un riquadro con un'immagine.

La stessa query nel normale motore di ricerca di Google ha fatto emergere un'altra citazione dalle osservazioni di Xi, ma il link all'articolo di NBC News da cui proviene si trovava sotto il paragrafo, in cima a un lungo elenco di notizie provenienti da altre fonti come CNN e PBS.

Come bloccare Google

La Reid di Google ha dichiarato che l'intelligenza artificiale è il futuro della ricerca e si aspetta che il suo nuovo strumento porti a un numero maggiore di interrogazioni.

"Quello delle richieste di informazioni nel mondo non è un numero fisso", ha detto. "In realtà cresce man mano che le informazioni diventano più accessibili, più facili e più potenti da comprendere". I test hanno suggerito che l'intelligenza artificiale non è lo strumento giusto per rispondere a tutte le domande.

Alcuni editori si stanno concentrando sulla questione legale, ovvero se Google o un'azienda di IA abbia il diritto di raschiare i loro contenuti senza autorizzazione. Diller ha dichiarato di ritenere che gli editori stiano violando i loro diritti d'autore. "Crediamo che questo possa essere corretto in modo relativamente facile e veloce", ha dichiarato.

Molti editori stanno scegliendo di inserire un codice nei loro siti web per bloccare gli strumenti di intelligenza artificiale dal fare crawling dei loro contenuti. Ma bloccare Google è spinoso, perché gli editori devono consentire il crawling dei loro siti, per essere indicizzati dal suo motore di ricerca e quindi visibili agli utenti che cercano i loro contenuti.

Per alcuni protagonisti del mondo dell'editoria, la politica di Google contiene una minaccia implicita: lasciateci fare il training sui vostri contenuti o sarà difficile trovarvi su Internet.

Alla fine dello scorso settembre, Google ha annunciato di offrire agli editori un nuovo strumento chiamato Google-Extended, che avrebbe permesso alle case editrici di esentare i loro contenuti dall'addestramento in alcuni strumenti di Google AI.

Tuttavia, tale esenzione non si applica alla ricerca alimentata dall'intelligenza artificiale, una politica che è diventata un punto di contesa tra gli editori e Google.

Una portavoce di Google ha confermato la politica e ha dichiarato che l'IA è da tempo parte integrante del motore di ricerca dell'azienda.