Tra intelligenza emotiva e grandi moli di dati (e niente ricerca sociale per ora)

Nonostante il titolo completamente “off news” la novità di oggi è che Daniel Russel (uno degli scienziati che a Google studiano il modo in cui noi poveri umani cerchiamo) ci introduce la nuova funzionalità di Google per scremare la pagina dei risultati (SERP) sulla base della complessità del linguaggio utilizzato, che con l’aggiunta di un po’ di neolingua e “messa nei panni altrui” han deciso di chiamare “reading level”.

Dopo l’annuncio di dicembre sulla possibilità di capire il “sentiment” Google ci fa intravedere la punta dell’iceberg delle possibilità attuali offerte dalla comprensione “per le macchine” che la semantica applicata alla statistica offrono. E pensare che devo ancora trovare uno strumento per guardare e capire le moli di dati imposte dagli studi sulle code lunghe di parole chiave in ingresso su siti internet commerciali (e-commerce)… gli strumenti di Google continuano a farmi gola lasciandomi insoddisfatto (per chi si è perso gli ultimi 6 mesi di questo blog: mi piacerebbe vedere API per esportare i loro dati e i loro punti di vista secondo le filosofie linked open data). Ah! Se solo avessi la lucidità per studiarmi il blog di Avinash!

Anche se per ora il calcolo proposto nella catalogazione dei livelli di difficoltà sembra ricordare da vicino il semplice conteggio del numero di parole “tecniche” e relative somme delle presenze di parole “poco comuni”, le domande mi partono a raffica. Quand’è che il Google ci insegnerà a capire quanta intelligenza è stata messa in un testo? E quanta emotività? Per ora sembra ci si debba limitare a supporre, e come sappiamo tutti, non si può.

E dove stanno gli open data oggi?

E quando li vedremo tra i risultati delle ricerche? Si questo paragrafo sugli open data non centrava molto col resto del post.

I motori di ricerca sociali

che le menzioni pubbliche di Facebook facessero parte dei segnali di Google lo sappiamo da almeno 3 mesi, che la ricerca sociale sia una realtà lo sappiamo da almeno 3 anni, eppure Arrington s’inventa palle sui pericoli in agguato.

Ricerca su facebook e Twitter

Ci voleva una terza parte per fare un motore di ricerca per i post su facebook? a quanto pare si!

  • Social Searching permette (da loggati) di cercare tra i messaggi propri e degli amici.

w3c parla di standard per il web sociale (e microformats quando?)

search preview

Quanti anni ci sono voluti per vedere la ricetta del pane alla banana tra i microformati consigliati dalle linee guida del Sig. Google? Qualcuno…

Non leggere questo articolo perchè anche stavolta non c’è niente di nuovo nè di realmente sociale (almeno dopo che ho avuto più dubbi che voglia di  leggere cosa diceva la gente sul Google SideWiki) segnalo comunque una mossa pubblica interessante del W3c che prova a dare un corpo ad una proposta di standardizzazione del mondo social.

Oggi non ho voglia di mettere grafici con linee che salgono o scendono per dirti che su Google i siti con accanto l’immaginina son più cliccati di quelli senza immaginina (riassunto per gli annoiati: + click = + CTR = migliori posizionamenti = + soldi per chi ricava da pubblicazioni online).

La cose interessanti della pubblicazione, se come probabile non avrai voglia di leggerla tutta:

  • il problema dei profili “distribuiti”: cioè come evitare che la gente si faccia una propria opinione con la scusa di aggregare informazioni che loro potrebbero ritenere interessanti (suggerimento: non potete supporre).
  • utenti che non entrano nelle scatole: qualche anno fa quando mi chiedevano nelle pagine d’iscrizione ai social networks “descriviti brevemente” io scrivevo solo “non so stare nelle scatole strette” (Adam invece scrive “bigger than a breadbox”). Se hai una base di dati, e la devi compilare la mente logica ti dice che prima di tutti devi dare un nome ad ogni spazio presente nel database. Se devi etichettare il contenuto di un cassetto, entri automaticamente in uno dei problemi a cui un SEO deve rispondere quotidianamente cioè:
    • ogni persona ha una propria lingua
    • ogni persona ha un proprio vocabolario
    • ogni persona ha un proprio significante per un significato comune
    • il tempo di capire queste cose solo pochi cel’hanno, e il senso per cui le si apprendono non è chiaro quasi a nessuno (quasi perchè c’è sempre qualcuno che poi alla fine ci fa soldi)
  • applicazione degli standard: mi ricordo tanto quando il mio maestro di chitarra s’incazzava perchè arrivavo a lezione senza prima aver studiato quello che mi aveva detto la volta precedente. mi diceva “ma se non studi e non fai pratica, cosa ci torni a fare qui da me che devo ripeterti le stesse cose?”. aveva ragione. In realtà gli standard li devono applicare le macchine (e chi programma i loro software) non certo chi le macchine le guida. I SEO invece devono starci attenti lo stesso.
  • opengraph farà cose spettacolari. In attesa che le faccia, tanto vale ascoltare un po’ di musica.
  • il protocollo salmone. Idem come sopra, vedremo cose miracolose, nel frattempo tanto vale rendersi conto che i salmoni non geneticamente modificati per sopravvivere all’inquinamento schiatteranno tutti.
  • il resto parla di come altri faranno soldi coi vostri dati sparpagliati nel web di chi ha saputo usare la semantica e la figosità nelle dosi giuste. Figosità di cui si parla giustamente anche nel film di facebook e nella intro di Kung-Fu Panda.
  • non si parla di Open Data, e neanche di Linked Open Data (a parte in un paragrafo che linka Smob, datato 2005)

Che il motore di ricerca debba diventare una porticina “obiettiva” su un mondo sociale pare essere una direzione ormai inarrestabile di un treno da cui mi vien presto voglia di scendere. Chiamare quello che stiamo creando “rete sociale” è come chiamare un inceneritore “termo-valorizzatore”.

Se fossi il capo del w3c (che non ha capi) le uniche cose che mi piacerebbe vedere standardizzate sono:

Meanwhile, in Emilia Romagna

Nel frattempo mia nonna sente una canzoncina di una nota band casinista di brooklin e la canticchia come se niente fosse, mentre mi passa accanto.

Sorgenti per questo articolo