Futuro SEO, cioè Open Data oggi

time google facebook

Breve introduzione: ottimizzare per i motori di ricerca significa andare dove va l’informazione… ed ecco perchè mi interesso di basi di dati 🙂 … spuntano già i primi motori di ricerca specifici per la ricerca su basi di dati, aspettiamo quando lo farà anche Google per decretare il nostro interesse o ci muoviamo già oggi?

La storia dei motori di ricerca (e di conseguenza del posizionamento) è molto recente eppure tutti ne siamo immediatamente coinvolti, dopo ogni singola innovazione. Oggi i motori di ricerca (e Google in primis) rivaleggiano coi social network per la conquista di uno share di utenza, che ricorda quello della televisione. E cosa vogliono gli spettatori di uno share televisivo? Intrattenimento e contenuti. Essendo il primo abbastanza lontano dai miei obiettivi personali, vi racconto la mia esperienza al meeting “fammi sapere” che si è concluso da poco a Senigallia, e che è stato un’incredibile somma di contenuti divulgati in modo aperto e chiaro, con il focus dedicato agli Open Data.

Intrattenimento e/o contenuti

media dati homer contesti e significanti

perchè usare una filosofia di Open Data

  • perchè la disclosure nei siti sta diventando un canone di attendibilità e rispettabilità degli autori che danno informazioni.
  • perchè sono una speranza per un tipo di mercato più aperto
  • perchè creano nuovi mercati
  • perchè un’ottica comune tra tanti micro-conflitti d’interessi aiuterebbe a farsi idee chiare su cosa ci circonda e su come cambiarlo in meglio
  • perchè anche quelli dei “vecchi” mercati dell’informazione vogliono evolvere
  • perchè la grande interconnessione tra i contesti permessa da internet si aspetta nuove regole e nuove etiche
  • perchè i dati aperti sono una delle poche strade verso il crowd sourcing di grandi moli di dati altrimenti non comprensibili
  • rilasciare i dati in formati open significa dialogare con persone attive che vogliono interpretare i vostri dati, li vogliono divulgare, li vogliono poter modificare (cioè interagire)
  • perchè essere aperti non significa esserlo solo quando ti fa comodo, e se fai comodo ad altri c’è speranza di fare un mercato

closed e open data

perchè se ti occupi di SEO prima o poi dovrai occuparti anche di Open Data

Dal momento che i motori di ricerca sono affamati di dati, non appena si troveranno modi di includere le basi di dati aperte anche negli indici dei motori di ricerca (RDFa per esempio è un piccolo caso concreto), si parlerà anche di ottimizzazione dei dati per i motori di ricerca.

Fammi sapere 2010

Gli interventi di Fammi Sapere 2010 sono già disponibili online, vi scrivo i miei punti di vista e pensieri durante il convegno:

open data

Lorenzo Franceschini di Informaetica durante il suo speech ha parlato di etiche in azienda e mi ha fatto pensare che l’etica è un valore quando legato alla condivisione, che noi del SEO chiamiamo poi “link popularity“.  In fondo per un’azienda o per un governo fornire dati aperti significa permettere a tutti di “vedere” che cosa sta succedendo. A volte vedere non serve senza “capire”, e una volta che si è capito per cambiare le cose serve anche agire. Se le azioni sono collegate al punto di vista che le ha generate, fornire dati aperti diventa etico e collaborare, cercando di costruire qualcosa di altrettanto etico con quei dati significa mettere in piedi dinamiche virtuose. Nel SEO non si può parlare esclusivamente di link exchange, dato che il valore di scambio trascende spesso i contenuti che si linkano tramite siti internet, tendendo verso lo scambio di valori umani e quindi sfocia poi nella zona d’influenza delle reti sociali.

Ernesto Belisario nel suo intervento (qui l’abstract e qui lo slidecast) fa l’esempio di un’applicazione per mobile che visualizza le strade sicure. Quella che è un’informazione per la scolaretta che deve tornare a casa la sera comunque, e sceglie all’occorrenza di prendere una strada in base al rating positivo degli altri utenti o della base statistica da cui è stato ricavato il valore “positivo”, è un’informazione anche per il malintenzionato scaltro di turno, che se vorrà essere sicuro di scegliere una vittima ignara, cercherà di coglierla di sorpresa proprio in una zona in cui la vittima si sente sicura. Problemi di contesto dei dati a parte, Ernesto ha fatto vedere la foto di suo nonno durante la presentazione e mi ha scaldato il cuore. Per il SEO qui si tratta di parole chiave fuori contesto, parlare di nonni e di cuore in mezzo a un brano tecnico potrebbe far scendere la “sensatezza” di questa pagina. Il SEO coraggioso comunque rischia, così come rischia la scolaretta che esce di casa, e il supporto statistico in questi casi per quando ben comunicato resta comunque relegato ad un valore di intrattenimento piuttosto che contenutistico.

Alberto Cottica (abstract) ci ha parlato della sua ricerca personale di una canalizzazione dell’intelligenza collettiva, a partire dall’esperienza coi Modena City Ramblers e arrivando fino al Ministero. A volte mancavano un po’ di contesti per i dati citati e c’è stata una piccola imprecisione mentre ci parlava di Wikipedia come di un esempio di assenza di gerarchia. La gerarchia su Wikipedia è infatti onnipresente e legata tra l’altro in modo simbiotico con la tecnologia del wiki, fatto che crea una certa barriera per l’accesso alla pubblicazione. Mi sarebbe piaciuto chiedere ad Alberto il suo punto di vista su come rispettare anche i non rispettosi e soprattutto come fa lui a rispettare i rispettosi che hanno conflitti d’interesse nella distruzione di qualche tipo di informazione, chissà se un paio d’anni fa ci fosse stato anche lui nel progetto di wikidemocracy, magare le cose sarebbero andate diversamente.

Luca Nicotra (abstract) ci ha raccontato esperienze di strada, di sit-in e di dimostrazioni pubbliche di dissenso di massa legate al mondo politico, da lui seguito con molta attenzione anche dall’interno di un partito. La volontà di partecipare attivamente alla politica è un po’ come quando un SEO decide quale dei competitor sfidare per una certa keyword in prima posizione e l’etica vola spesso a tanti kilometri di distanza. Mi è piaciuto l’esempio delle ricerche in diretta su Google News come fonte d’informazioni, anche se è normale che cercando “accesso agli atti” ciò che fa notizia (e che quindi è presente nei risultati) sia soltanto ciò che contiene un messaggio negativo, o meglio allarmistico.

Nicola Mattina (abstract) è entrato nel dettaglio nella psicologia che può appartenere ad un politico di fronte a proposte di liberazioni di dati, facendo presente che il punto di vista del potere è timoroso di cedere dati di qualità. Mi sarebbe piaciuto chiedergli come fa il calore umano delle “regioni succhia soldi” da lui citate a compensare le carenze di un intero stato in crisi, e come considerarlo tra gli interessanti grafici proposti sui temi comuni della politica odierna, anche se le contromisure suggerite sembravano scontate, chi risente dell’eccessiva semplificazione alla fine è l’umanità che si perde tra le analisi. Dal punto di vista SEO è come se facessi un articolo basandomi su un errore di battitura comune e in questo modo influenzassi la conoscenza dei miei lettori.

Aline Pennisi (abstract) ha raccontato i lavori di stesura del bilancio dello Stato all’interno del Ministero dell’economia, proponendo ragionamenti a base di buon senso piuttosto che regole. Ha posto i quesiti base che dovrebbe porti chiunque ti presenti delle cifre a schermo (cit.”non ci interessa quanto, piuttosto il come” e “il bilancio dello stato non è solo uno strumento di controllo, è diventato anche uno strumento per intraprendere azioni” “dopo che lo fa il sito del ministero, gli altri seguono, per emulazione, anche in assenza di obblighi o leggi apposite“). Aline ha chiuso ponendo una serie di domande che da sole potevano dare origine ad un altro convegno, cito quella che mi ha lasciato maggiormente il segno: “se non diamo [rif. il Ministero] una prima interpretazione, come può iniziare il dibattito col pubblico?“. Domanda cosmica che mi ha subito ricordato i consigli di uno dei miei maestri: “la raccolta dei dati fa già parte dell’interpretazione dei dati“. Da SEO penso che l’eterna lotta dei punti di vista sembra aver trovato pace solo dentro alla costante roulette delle SERP. Aline ha concluso anche con una domanda illuminante (almeno per me): “Dare i dati a chi sa capirli e usarli, danneggia gli altri? Sarebbe bello se lo stato pubblicasse i bilanci in forma “comprensibile” ad esempio con un infografico tipo Billion Dollar Gram.

Guglielmo Celata (abstract) mostra la sua idea per osservare i lavori del Parlamento, un aggregatore di dati già pubblici precedentemente non strutturati. Fa anche intuire di essere riuscito a vedere i vari conflitti d’interesse nelle lobby di potere parlamentari, e dice di non poterli pubblicare, per ora. Mentre descrive il suo business model (che mi ha ricordato il business model di WordPress) sembra chiaro che mentre i giornali si mettono a comprare il suo punto di vista “statistico” un errore a monte della catena informativa può avere ripercussioni drammatiche sui punti di vista risultanti. Sarebbe interessante se Guglielmo riuscisse anche ad auto-assegnare ad ogni dato che espone una certa soglia di “attendiblità” dell’informazione, ad esempio se quando fai la classifica dei parlamentari più assenti ti dimentichi di far notare gli incarichi all’estero, rischi di fare inutili danni alle immagini pubbliche dei politici coinvolti. Comunque i suoi strumenti sono in costante sviluppo e questa è la cosa importante. L’opera di Guglielmo rende evidente il concetto, già espresso da Aline, che è essenziale oltre alla divulgazione di dati aperti, fornire anche un punto di vista (più umano) che ne aiuti la comprensione “primordiale”.

Vincenzo Patruno (abstract) ha portato un esempio in diretta di embed su blog di dati erogati dall’ISTAT. Non mi è chiaro come l’utente finale possa anche “dialogare” con la stessa sorgente dei dati (argomento trattato anche successivamente da Paolo Di Pietro). Nel caso di dati mostrati fuori contesto, il contesto di comprensione per l’utilizzatore finale diventa la piattaforma (o blog) che ha caricato l’embed di dati. Il fulcro del discorso sembra essere che quando si parla di Dati Aperti si cerca anche una fiducia negli utilizzatori intermedi. Aline parlava del problema di “manutenzione” dei dati, cioè oltre all’archiviazione come ci si occupa di tenere i dati “puliti” e “aggiornati”. Se l’ISTAT si occupasse di creare anche API per il “dialogo” con gli altri siti, potrebbero raccogliere e ri-distribuire dati occupandosi meno della raccolta. Resta da dire che molta dell’autorevolezza di un dato deriva anche dalla qualità del raccolta e dai campioni scelti. Nel caso di embed evoluti, è possibile anche fornire strumenti di visualizzazione come grafici o infografici (nel caso ci sia anche una redazione a monte degli embed). Nella presentazione di Vincenzo ho apprezzato le slide con la comparativa tra Microdati e Macrodati (nel senso di grandi aggregazioni di dati) spiegati dal punto di vista della privacy dei singoli soggetti da cui i dati sono stati ricavati (siano persone o aziende). Vincenzo aveva anche slides con Clint Eastwood, che racchiude un messaggio non esplicito: la fiducia intrinseca che chi inserisce un embed dimostra di avere nei confronti della sorgente dello stream (sia esso di dati, video o altro).

Ernesto Belisario (abstract) ha portato esempi di pratiche di Open Data e paradossi con le leggi che dovrebbero governare il libero accesso alle informazioni, citando il garante della privacy che in alcuni casi stabilisce anche di quali informazione non si può aver bisogno. Ernesto ha parlato delle differenze tra sistemi giuridici USA e italiano, e in un punto la legge italiana sembra surralmente pretendere di valutare gli interessi dei cittadini perchè si possano chidere informazioni di dominio pubblico. Ernesto ha anche segnalato iniziative come accessibile.gov.it, normattiva.it, opendatacommons e una serie di mashup che mi hanno ricordato chatroulettemap. Tra le frasi di Ernesto che ho apprezzato maggiormente c’è “non sono a favore della proliferazione delle licenze, perchè diventano un elemento discontinuo” (dove “discontinuo” ha un’accezione negativa)

Rita Bernardini (abstract) ha riportato l’attenzione su un caso di OpenData specifico della politica ed è intervenuta citando il caso dei soli 9 deputati su 630 che hanno dato il consenso alla dichiarazione patrimoniale.

Flavia Marzano (abstract) poneva l’attenzione sui casi in cui Open viene equiparato a Virtuoso, interessante soprattutto nell’ottica del dare l’esempio, citata anche da Aline.

Stefano Laguardia (abstract) ha fatto un elenco interessante di fattori che accomunano Open Data e Open Source, citando i 10 principi dell’open source, le 4 libertà di Stallman, gli 11 principi di openknowledge. Ha citato Obama come il primo politico a parlare di trasparenza, ricordiamo però anche Gorbachev.

Matteo Brunati (abstract) sembra vedere gli OpenData come un processo abilitante necessario per l’evoluzione della rete stessa, cita infatti il 5 star deployment scheme di Tim Berners Lee e parla di Linked Open Data e dei 3 oggetti tecnici obbligatori per favorire Open Data (qui una sua presentazione di Ottobre).

Paolo Di Pietro (abstract) ha parlato di OGETF e della necessità di linguaggio comune e condiviso per la definizione di cosa siano le strutture stesse portatrici di dati (cit.”io voglio che non siano solo condivisi i dati, voglio che siano condivise le etichette“). Da quello che ho capito del suo discorso ci sono problemi anche tra le stesse amministrazioni pubbliche che temono che i dati rilasciati vengano “mal interpretati” (concetto ricorrente tra l’altro durante la conferenza). Esistono comunque casi di successo, ad esempio i bike sharing in cui i comuni sono virtualmente esposti al rischio che le biciclette vengano rubate in massa per essere rivendute fuori dal comune di appartenenza. Con l’informatica invece siamo costantemente messi a confronto dei nostri limiti nazionali prima, coi limiti della monetizzazione e del mercato poi. Paolo cerca comunque persone che sappiano aiutare nella cognitivizzazione di entità e oggetti per poi creare una standardizzazione dei sensi usati nella divulgazione dei dati.

Emanuele Frontoni (abstract) ha fatto esempi concreti di utilizzo di basi di dati già disponibili (ws.tecut2.it) e cercava nuove idee da implementare.

Christian Morbidoni (abstract) ha parlato di Faceted Browsing cioè navigare con vari punti di vista disponibili per la riorganizzazione visuale dei dati da osservare, e soprattutto ha fatto notare che tramite i microformati e RDFa anche i motori di ricerca capiscono i dati, e di conseguenza li faranno capire anche ai loro utenti. Ascoltare Christian mi ha fatto venire in mente che lo stato dell’arte dell’Open Data per la mia esperienza è stato il servizio utenti dell’amministrazione londinese, che ha risposto ad una mia domanda inviandomi i dati richiesti, via mail (procedimento rocambolesco rispetto alle possibilità di architetture xml, ma funzionale perchè interpretato direttamente da staff umano).

Un grande ringraziamento va a Marco e Egidio che sono stati ottimi moderatori, molto discreti ed equilibrati e ovviamente grazie ad informaetica.

Chissà quand’è che il W3c scriverà anche di microformati

simone
appassionato di seo, linked open data e ambiente

3 Comments

  1. Beh, ottimo post, hai riportato una serie di interventi che sicuramente meritavano di essere seguiti dal vivo.
    E la tua cronaca è come al solito molto affascinante.

    Sull’OpenData: sicuramente dovremo iniziare a porci qualche problema anche nell’ottica dell’html 5, dove sembra che le sintassi per la catalogazione e la gerarchizzazione dei vari contenuti sarà particolarmente ‘attenta’ alle esigenze di ‘condivisione larga’ che giustamente il web del futuro dovrà sostenere.

    Ma tra le tante cose che hai citato voglio consigliare a tutti la visita al sito http://www.openpolis.it/

    Non so chi ci sta lavorando e in quale prospettiva, ma devo dire che quando mi ci sono imbattuto, un mesetto fa, mi ha lasciato veramente di sasso.

    Non sembrava nemmeno un sito italiano… veramente una BELLA IDEA.

    🙂

  2. ciao Fabio, al convegno per presentare OpenPolis era presente Guglielmo Celata, la sua squadra credo sia tutta italiana 🙂

Comments are closed.