Ti fidi di Google Trends? Io no, e ti spiego perché

Riassunto se hai poco tempo: Google Trends fornisce dati campionati, dai quali si possono fare tante correlazioni e coi quali ci si può divertire molto, ma per analisi serie lo evito.

su Trends i dati sono troppo raggruppati per essere precisi

I dati di Trends sono campionati, manipolati al fine di vendere maggiore pubblicità sulle piattaforme di Google (* mia ipotesi) e inoltre “clusterizzati” cioè riprendono termini veramente digitati dalle persone ma anche termini “ricondotti”, cioè raggruppati per poterne dare una traccia visibile a grafico. Considerate che circa il 15% delle parole chiave che riceve Google ogni giorno, non sono mai state richieste negli anni precedenti (es. errori di battitura, diverso ordine di stesse parole ecc.) un semplice errore di raggruppamento per le parole comporta variazioni anche significative nei grafici di Trend… i quali per di più non forniscono indicazioni numeriche reali (dalle quali sarebbe possibile fare raffronti e stabilire quantomeno il margine d’errore necessario alle analisi quantitative) ma sono sempre ricondotti ad una scala virtuale da 0 a 100.

come fanno le persone a cercare qualcosa

Il modo in cui le persone cercano tra l’altro è ancora oggetto di studio ed è tutt’ora un piccolo mistero dato che risente in primo luogo del livello di cultura di ognuno, oltre che della singola “voglia di cercare” di ogni sessione di ricerca. Una persona che si sta informando su un certo argomento non compie mai una sola ricerca, bensì un grappolo di ricerche, spesso frammentate. Per esempio se cerco “tumore” e tra i risultati delle ricerche vedo un risultato che riguarda i “tumori al seno”, posso cliccare su quel risultato e la mia ricerca si conclude, senza che google possa rilevare nei dati di Trends (che riguardano le sole parole chiave digitate) il fatto che il mio interesse reale non riguardasse il tema generico dei tumori.
Per complicare le cose, va considerato che durante il periodo di “ricerca” le persone chiedono spesso anche ai propri contatti “umani” per poi effettuare nuove ricerche, stavolta più mirate (anche in questo caso, i suggerimenti dei contatti umani creano una specie di “buco” nei dati che Trends può registrare).

Il modo in cui le persone cercano è inoltre soggetto ad un costante apprendimento da parte della popolazione, che utilizza il motore di ricerca in modo sempre diverso ogni anno che passa. Per esempio cercando “tumore” sembra che l’interesse nei tumori degli ultimi 10 anni sia in crescita “blanda” (+15/20% in 10 anni). Cercando però anche “tumore al seno” notiamo che questa ricerca sembra essere in crescita di oltre il 30%. Questo avviene perché le persone sono sempre meno interessate nei termini generici, e sempre più interessate in chiavi ultra precise, per esempio “tumore al seno menopausa diagnosi” delle quali non abbiamo garanzia che vengano prese in considerazione dall’algoritmo che filtra le ricerche per andare a creare il grafico dei dati offerto da Trends.

Inoltre, non è possibile cercare qualcosa della quale non si conosce l’esistenza, se non utilizzando parole molto generiche, e spesso mai raggruppate all’interno delle ricerche di trends. (a riguardo uno studio interessante è quello di Eli Parisier, che ha teorizzato una “filter bubble” cioè uno stato in cui viviamo e nel quale non riusciamo a sapere dell’esistenza di cose troppo lontane dal nostro comprendere).

in pratica?

In pratica è come dire che i dati presenti su Trends riguardano solo le ricerche di persone che sono a conoscenza di un certo soggetto e che necessitano approfondimenti. Per questo motivo spesso i dati di trends risentono di “onde mediatiche” causate da fonti di informazione esterne a Google (vedi ad esempio i picchi in occasione del mese di ottobre per le varie “giornate” indette per parlare di determinate patologie).

La stessa Google che qualche anno fa aveva lanciato in pompa magna il progetto “Google flu” prometteva di prevedere i luoghi nei quali sarebbero arrivate le prossime ondate di febbre/influenza/malaria ha dovuto accantonare il progetto, non potendo realmente prevedere e neppure analizzare gran che (oggi il progetto è in attesa di “contributi scientifici” e accetta iscrizioni tramite questo modulo )

quando usare Trends e soprattutto quando non usarlo

Google Trends è uno strumento commerciale reso molto didattico per massimizzarne l’utilizzo. In questa semplificazione si perde tutta la parte numerica delle informazioni; risultato: viene usato per raccontare storie che non esistono. Ha senso quindi utilizzarlo giusto per individuare “andamenti” (come suggerisce anche il nome), ma non può essere preso come metro di riferimento per fare scelte di business mirate, o peggio analisi scientifiche.

quand’è che un dato può essere considerato affidabile?

  1. Per prima cosa serve che esista un dato, sembra banale vero? Eppure Google Trends non fornisce alcun indice sui volumi delle ricerche. Tutti i grafici sono trasformati su scala 0-100, e non vengono mostrati mai i volumi di ricerca reale (che invece sono presenti all’interno di strumenti a pagamento come Google Adwords).
  2. Serve che per ogni dato campionato sia specificato il margine di errore minimo e massimo (anche questo non viene fornito da Trends).
  3. I dati devono essere correlati alla loro rilevazione, la quale deve avere link specifici (ad esempio in ogni pubblicazione scientifica nella quale siano presenti dei trial vengono indicati i giorni dell’esperimento, il numero di partecipanti, le loro caratteristiche fisiche ecc.)

quindi per fare analisi che dati utilizzi?

Insomma non affido una ricerca “seria” nelle mani dei dati di Google Trends.

Quando svolgo analisi per i clienti (nel 2016 ne ho fatte per IEO e CardiologicoMonzino) preferisco analizzare dati reali e dei quali posso ricostruire la storia di navigazione: le ricerche che arrivano sui vari siti, per analizzare le quali uso Search Console anch’esso offerto da Google, e tuttavia molto più “mirato” rispetto a Trends perchè contiene solo i dati del singolo sito internet. Purtroppo Search Console non permette rapidi raffronti tra dati di più siti, per i quali serve Google Data Studio.

simone
appassionato di seo, linked open data e ambiente