Alla ricerca del contesto perduto: SEO vs AI… a volte ritornano!

Terzo episodio del dialogo decennale che porto avanti con Marco Varone, registrato il 3 febbraio 2023.

So what:

  1. Le persone che provano un software tipo ChatGPT confondono generazione con comprensione.
  2. I big finanziano l’innovazione, ma non riescono a crearla.
  3. Le aziende hanno bisogno di controllare il rischio, il software NLP può aiutare solo se è specializzato
  4. Le AI generiche mettono a rischio solo una piccola parte dei motori di ricerca, per Google il rischio maggiore resta l’Antitrust.

Capiamoci, un software tipo ChatGPT non “capisce” nulla, c’è una simulazione del processo di comprensione che si nasconde molto bene grazie alla qualità del testo generato. I limiti sono dimostrabili facilmente, per esempio se fai analizzare un testo e fai una domanda su un’informazione che c’è nel testo. Se rifai la domanda subito dopo, la risposta è differente.

Con una vera comprensione non puoi rispondere in modo differente.

Innovazione: OpenAI ha innovato… ma fuori da MS e coi soldi di MS, per fare innovazione si va fuori; è normale, più diventi grande più è difficile innovare. Google ha altri problemi: antitrust.

Noti qualcosa di nuovo nel mercato dell’intelligenza artificiale? (spoiler: no).

In che modo configurare i tool? risposta: te li studi, dato che ognuno si inventa i parametri che vuole (Model, temperature, stop sequence, top p, frequence penalty, presence penalty, best of,  inject start/restart text, show probabilities)

C’è un modo per capire quanto inventa e quanto è dato da riassunto di dati esistenti da qualche parte? – per ora no, è una black-box.

La bellezza è nell’occhio di chi guarda? c’è del senso in questi output di caratteri, o è solo l’ennesimo caso di caos rimescolato così tante volte da creare un pianeta a forma di centro benessere? – La seconda che hai detto.

– Cosa definisce il meglio? Lato utilizzi aziendali pratici, le AI generaliste rappresentano più problemi che opportunità, il valore aggiunto lo ottieni se specializzi. Le aziende migliori sanno valutare rischio, reputazione, qualità, economie, organizzazioni. Tutti ambiti in cui servono dati spiegabili e replicabili (limite attuale delle AI generiche).

– Come andare oltre lo stato dell’arte? Serve la ripetitibilità della risposta. Non puoi avere varianza del risultato. Non c’entrano gli errori, tutto quello che non è auditabile, non è utilizzabile in ambito business.

– Cosa ti aspetti dalle evoluzioni della comprensione? – ottimista, nell’arco di 5.10 anni mi aspetto miglioramenti sulla comprensione, ma non a livello di interazione tra esseri umani.

– Come si nutre di contesto? Metadati? Autorialità: in teoria è possibile, ho impressione che stiano facendo qualcosa. rank e subgroup. Specializzando e potenziando i modelli teoricamente è possibile estendere il valore delle risposte in modo che comprendano anche l’importanza dei brani scritti anche in funzione dell’autore originale.

– L’intelligenza artificiale prenderà il posto dei motori di ricerca? Si, in parte.

– Adversarial, uso dell’AI nel combattere lo spam? Ci sono novità o teorie scientifiche nuove? – poca roba, ho visto solo approcci a forza bruta, transformer (bert).

– A livello legale? Siamo nel farwest, e non è bello. Servirebbe il consenso esplicito sulle opere da destinare all’allenamento di questi software.

Approcci all’innovazione:

– approccio americano con tanti specialisti, scalabile, costosissimo. Hanno ancora spazio prima di arrivare ad un limite.

– approccio europeo? ampiamente migliorabile.

– alcune idee su finanziamenti pubblici:

  • per far crescere startup, escludere grandi aziende.
  • per aiutare le aziende a fare un passo dimensionale: detatassare e no fondi perduti, si a sgravi e sconti per chi co-investe.

Episodi precedenti (2014-2015):

  1. Poca semantica e molta analisi comportamentale
  2. Bruteforce learning
simone
appassionato di seo, linked open data e ambiente