Google ci vorrebbe tutti leader del nostro settore, ognuno bello, speciale ed originale… per avere l’imbarazzo della scelta. Mettere sotto processo chi scrive contenuti toglie l’attenzione da chi li mette in ordine di visibilità.

E se i contenuti contassero poco, sulla bilancia dell’algoritmo della visibilità?
E se il motore di ricerca non avesse idea di come distinguere tra un buon contenuto ed un contenuto il cui stile è buono?

il genere letterario dei furbetti

Senza sapere come, ho iniziato a scrivere come il lettore potrebbe cercare: dopo anni scrivendo a me stesso, avevo smesso per auto-sfinimento. Deluso dal silenzio che accompagnava le mie prime pubblicazioni. Nel 2006 ho incontrato Raffaele, che mi ha chiesto di fare 2 cose:

  1. studiare SEO
  2. studiare le persone che hanno bisogno dei nostri prodotti

Il punto di vista del pubblico dei motori di ricerca, è ristretto alla loro capacità immaginativa (puoi cercare solo ciò che puoi immaginare). Il nostro pubblico ha il paradosso della libreria invisibile, dove ciò che esiste è solo:

  • ciò che si trova
  • ciò che viene “sponsorizzato”

il problema della biblioteca invisibile

sacha sosno

Quando vuoi imparare qualcosa, cosa fai? O paghi l’esperto di turno o cerchi su internet, e:

  • cerchi su google (che essedo gratis può permettersi di sbagliare)
  • chiedi su facebook (un equivalente strano del “chiedere all’esperto”, con la differenza che dipende dalla qualità del network sociale a cui regaliamo il nostro tempo)
  • chiedi sui siti “verticali” (es. siti di Q&A, siti di annunci, forum, blog)

“Imparare” è una parola contenitore, ha più definizioni. Cumula in sè tanti significati, tanti usi, tante interpretazioni. L’istinto ci guida nell’utilizzare il “senso” della parola imparare più utile nel contesto in considerazione. Lo stesso istinto ti fa capire cosa significa “imparare”, tuttavia se vi chiedessi di dare la vostra definizione del termine, sarebbero tutte diverse l’una dall’altra (se volete fare un esperimento mandatemi una mail, o scrivere un commento con la vostra definizione).

Comunque, divagazioni a parte, diciamo che vuoi imparare questo qualcosa, e… Ti affacci sull’immensa mole di informazioni pubblicate: cosa troverai? Il brano piu completo? no. La migliore guida su ciò che vuoi imparare? forse no.

Ciò che invece leggerai è il brano col titolo più accattivante. Inoltre, dopo che hai trovato un contenuto “degno” di essere letto, il vero problema nel trovare informazioni adeguate sta sul tuo secondo click, quello di approfondimento e che dovrebbe aiutarti ad accedere all’informazione che ti manca.

siti come negozi e negozi come labirinti

Vi sarà capitato di non trovare qualcosa all’Ikea, e di uscire avendo comprato un oggetto inutile. In un certo senso, Ikea vi ha insegnato come si sta al mondo, mercificando i vostri desideri e soprattutto dando una forma ai vostri pensieri.

labirinto ikea

Il visitatore del sito internet quando arriva passando dal motore di ricerca si trova “catapultato” in un punto del nostro “negozio” e da lì, senza spiegazioni, deve trovare la sua strada d’uscita, possibilmente trovando qualcosa di valore prima di deprimersi, se ci sono vetrine e mappe per orientarsi, meglio, se non ci sono amen.

Ps: qui c’è lo studio completo sulle dinamiche di una visita in un grande negozio fisico.

Durante la sua visita, l’obiettivo del visitatore si è intersecato con gli obiettivi di chi scrive il sito?

Link di approfondimento

Leggendo un autorevole articolo su internet vorremmo fare 2 cose:

  • trovare subito ciò che ci serve
  • smettere di leggere il prima possibile

Ciò è possibile solo conoscendo in anticipo le “primitive” necessarie alla comprensione del brano, anche detti “concetti archetipici”. E’ difficile capire le intenzioni degli utenti, anche per Google: ha però un forte alleato dalla sua parte, i grandi numeri.

Secondo me il primo SEO della storia moderna è stato Dale Carnegie, col suo immenso “Come trattare gli altri e farseli amici” ha dato il via ad un nuovo genere letterario: scrivere per essere trovati.

Scrivere risolvendo una necessità dell’utente, oltre che utile ai motori di ricerca, è utile anche se si vuole ottenere traffico dai motori di ricerca. Su internet sono tempi duri per scrivere con una motivazione diversa dalla vendita. Martino potrebbe obiettare che al mondo ci sono cose impossibili da comunicare con l’alfabeto dell’economia, tutte queste cose sono diligentemente archiviate nella biblioteca invisibile.

Regole, punteggi e penalità

Le regole di Google sono mutevoli e spesso misteriose. I punteggi che ci assegna sono pubblici ma mutevoli, le penalità che da ai siti sono private, ma fanno scalpore.

Non potendo prevedere i cambi di questa cortina fumogena quando perdi di vista il tuo obiettivo, probabilmente il bersaglio sei tu. Google ti abbassa la posizione, perché conviene far salire altri siti al tuo posto.

Professionisti in “furbizia”?

Ogni tanto, ancora oggi, qualcuno scherzando mi chiama “il mago di google”, un po’ prendendomi in giro ed un po’ perché in fondo, nonostante il nostro lavoro abbia cambiato molti cappelli quell’alone di mistero che richiede di stemprare il discorso aggiungendo una battuta, ancora è rimasto. La realtà però è una sola:

Google prende tutti a pesci in faccia

La vera domanda facendo SEO è: come prendere pesci in faccia, con stile? I clienti si aspettano da noi che teniamo duro. Cadiamo e ci rialziamo e facciamo tutte quelle cose che ci rendono uomini degni di questo nome, eppure… prima o poi saremo dietro ad altri, inseguendo.

Per quanto tempo si possono prendere pesci in faccia da Google prima che il cliente cambi SEO? Questo ovviamente dipende dalla grandezza dei pesci, dalla forza con cui vengono tirati e dalla fiducia che viene riposta in noi. Un esempio pratico: prima di tornare a galla dopo una penalità possono servire anche mesi… questo tempo ci verrà pagato dal cliente? Avendo una penalità da qualche parte il sito sta perdendo ricavi…

pesce in faccia

Fiducia, pesci in faccia ed autostima sono 3 facce della stessa medaglia

A volte è importante cambiare strategia, altre volte dobbiamo studiare i competitor. Impariamo qualcosa da quei pochi segnali che abbiamo a disposizione, cerchiamo di replicare quelli migliori. A volte ci fermiamo a riflettere, ed in quel momento arriva un nuovo pesce in faccia. Quindi perché ci siamo fermati?

Cosa aspettavamo durante i rari momenti di silenzio, l’illuminazione forse, eppure sono arrivati solo loro, altri pesci.

tropppo pesce

In poco tempo la mole di pesce diventa troppa per una sola persona. Entrano in campo amici, gruppi d’aiuto, conoscenti, i corsi… forse anche gli psicologi e tutto questo è inutile senza che sia prima abilitato dalla fiducia, cioè reso credibile. Non importa guardare sullo schermo le righe di Analytics che si alzano o si abbassano, è importante sapere se chi ci parla ci racconta qualcosa di vero, qualcosa che è successo e del quale è stata capìta la causa, o almeno, la causa più probabile.

Il problema con le probabilità è che sono molto potenti all’interno delle teorie quantistiche, che hanno una capacità previsionale altissima. Il problema con le teorie quantistiche è che ad una prima lettura sembrano sempre una supercazzola.

La guida interiore del SEO

Dopo decine di guide seo, di lezioni, di domande tipo “cos’è sto seo?” e “ma quindi tu inganni google?” e persino 9 anni passati a fare praticamente solo ottimizzazione… è arrivata l’ora di svelarne l’ultimo trucco.

Non si tratta della combinazione semantica più alla moda, non è un link dalla home di google.com, non riguarda la ricerca degli intenti del navigatore, né riguarda la frequenza di rimbalzo, la notorietà del brand, non cambierebbe nulla pur avendo CTR 100% in SERP e soprattutto almeno questa volta, è alla portata di tutti.

Non lo insegnano all’Università (anche se ai corsi che terrò proverò a parlarne) e tutti i migliori SEO ne sono al corrente da sempre. Non servono particolari tools o strumenti seo, è una cosa che si fa anche senza esperienza, anche senza ottimizzare nulla.

fish seller

Trovare il generatore

In pochi sanno di avere un generatore d’emergenza. Al contrario di come sembrerebbe dal nome, non genera un’emergenza, bensì fa fronte ad una carenza d’energia: tipica situazione che si verifica in un momento grigio della vita, quando l’energia è già stata spesa in qualcosa che… ieri sembrava importante.

I momenti grigi arrivano anche quando si fallisce su più fronti contemporaneamente, ed il nostro buonsenso ci chiede di rivalutare il modo in cui troviamo soluzioni e risolviamo problemi.

rebus

In questi momenti prendiamo pesci in faccia come se piovesse pesce senza sosta (la famosa pioggia d’orata). Quando siamo sepolti vivi dal pesce, ci sono 2 cose da fare:

  1. mangiare sushi
  2. vendere sushi

cioé possiamo trarre profitto da ciò che ci è capitato casualmente, oppure possiamo cercare di farlo capitare ad altri, facendoci pagare.

E quando il pesce finisce? (cosa che tra l’altro sta succedendo in tutti gli oceani ed i mari a causa dell’inquinamento e della pesca intensiva ed a strascico).

Quando il pesce finisce bisogna mangiare i frutti di quello che abbiamo seminato l’anno scorso. E se l’anno scorso avete seminato male sarà difficile raccogliere qualcosa. E ora tenetevi forte perché se con la metafora del pesce e col link al Guardian avete iniziato a non capirci più nulla, col prossimo capitolo andremo oltre, servirà spegnere il giudizio.

e accendere il generatore d’emergenza

Ora ipotizziamo che sia il 31 dicembre. Avete trascorso un anno pèssimo, rincorrendo i vostri fantasmi, in compagnia di soli vizi e vanità. Vi sentite vuoti, e avreste voglia di farvi una solenne promessa per l’anno nuovo: mai più questo vizio, mai più questi indugi. Festeggiate gioiosamente la vostra promessa.

Diciamo che il vostro 31 dicembre è finito, e ora è arrivato il 1° gennaio. Che si fa? Da dove si riparte? Pulendo i resti della festa di ieri sera, o tornando a letto rimandando le promesse al 2 gennaio?

Pulire gli avanzi delle feste, specie quando sembrano feste altrui, è una di quelle sensazioni che rendono quasi impossbile accendere l’interruttore del nostro generatore d’emergenza. Nemmeno lo troviamo! È nascosto da tonnellate di spazzatura caotica, mettiamo in ordine un angolo di casa e ci sembra tutto come prima, è così tanto il caos rimasto. Pensare un metodo per ritrovare il filo dell’ordine sembra una follia. Questo perché la festa, per essere tale, deve dimenticare le regole dell’ordine, deve rompere ogni regola, deve farci bere fino a passare il limite e mangiare fino a quando il senso di sazietà è dimenticato ed il corpo ingurgita per pura gola, ed il limite della stanchezza è sostituito dalla presenza di adrenalina.

Mettere a posto un sito che tenta di vendere un prodotto mediocre usando html sporco, profilo di link inconsistente, contenuti minimi, struttura caotica… è proprio come mettere a posto casa dopo la festa, il giorno dopo.

Quella stessa adrenalina che ci fa vivere con intensità fino alle 3 del mattino, il giorno dopo sembra il cratere scavato da un asteroide.

  1. C’è chi per superare gli ostacoli del giorno delle promesse si riempie di altre promesse, fino a quando un giorno normale diventa così carico di aspettative da diventrare un giorno incredibile, a sua volta pieno di adrenalina.
  2. C’è chi acquisisce un metodo per “mettere poco in disordine” durante le feste, e chi addirittura evita le feste avendo paura di dover mettere a posto.
  3. C’è chi cambia casa piuttosto che rimettere in ordine.
  4. C’è chi non tocca nulla e si abitua a vivere nei resti della festa di ieri, che è diventata quella dell’altro ieri.
  5. C’è chi si fa pulire la casa da altri, e chi ha la donna delle pulizie.
  6. C’è chi scrive un libro sulle tecniche per mettere ordine in casa senza toccare mai scopa, spugna o paletta.
  7. C’è chi la sera prima ha meticolosamente etichettato ogni oggetto di casa con le coordinate per rimetterle nel posto giusto nel minor tempo possibile.
  8. C’è chi si sveglia con un pesce nel letto.
  9. C’è chi comincia bene ma quando viene disturbato perde il “filo”.
  10. C’è chi non va a letto fino a quando non ha messo a posto tutto, non ce la fa, crolla sul divano e si sveglia a mezzogiorno del 2 gennaio con mezza casa pulita e mezza sporca.
  11. C’è chi rimanda l’inizio delle pulizie aspettando “l’umore giusto”.
  12. C’è chi non si fa aiutare da nessuno e considera il fatto di mettere a posto come una punizione divina.

Igiene mentale, metodo, ordine: tutto si trasforma in una sequenza di azioni riassumibile in un’immagine:

want-vs-ent

E se tutto fosse una metafora del lavoro, di certo non ci si “sveglia” senza prima aver trovato la propria “zona“. Quel luogo mitologico dove le cose si compiono e la mente ha il suo spazio per respirare (se ne parla anche in questo bel documentario).

e dove sta la “zona” nel SEO? Se c’è una materia caotica e misteriosa è proprio la SEO.

La macchina che impara… a predire il futuro

Nel 2009 gli zii di Google cercavano di insegnare al loro robottino un metodo intelligente, autonomo e scalabile di imparare. La grandezza del web sarebbe diventata un’importante risorsa, appena colmate le differenze semantiche presenti tra le varie lingue (e soprattutto il fatto di dare valore alla scarsità di link tra contenuti di diversa lingua). Risolti statisticamente i problemi di comunicazione tra razze, costruito l’acquario di test e registrato un brevetto sull’applicazione di modelli quantistici previsionali su cosa si parlerà nella prossima discussione (e molto altro che ignoro)… sembra ci resti solo da aspettare qualche anno, e poi finalmente avremo la risposta finale. La cosa interessante del futuro è che diventa facile da prevedere se riguarda le necessità degli esseri umani: sono le stesse da quando abbiamo iniziato a definirci uomini. Le necessità umane applicate ai singoli “settori” di interesse umano, quelle possono essere una sfida risolvibile con adeguati livelli di complessità analizzabili.

in conclusione: da spazzatura a risorsa

Il processo mentale che serve per accettare il pesce in faccia quotidiano e farlo diventare un pesce commestibile o tutto sommato vendibile è simile al processo della trasformazione dei rifiuti in risorse: tutti ne parlano, pochi lo sanno fare. Questo perché spesso la trasformazione richiede il coinvolgimento di settori adiacenti, nei quali si ha poca/nulla influenza.

L’ordine è un processo dinamico. Le persone ordinate sono costantemente in fase di “riordino”, e tipicamente non si sentono particolarmente ordinate, anche se dall’esterno lo sono, eccome. Mettere le mani sul sito di una persona ordinata è 100 volte più facile, sia per gli ottimizzatori che per i motori di ricerca.

E non preoccuparti: ogni 3 pesci in faccia, almeno UNO è commestibile.

in natura gli animali mangiano quando trovano cibo, il senso di sazietà, il senso di fame e gli stimoli fanno parte dell’istinto e funzionano. Dice Bøckman che non esistono animali selvatici con problemi di obesità. In compenso, esistono molti animali domestici con problemi di obesità. Questo perchè nel modo di vivere dell’uomo ultimamente c’è una certa tendenza all’ignorare gli stimoli naturali dando ascolto a stimoli commerciali indotti dal mercato e dallo stile di vita moderno.

Eugenio mi diceva di aver paura ad usare le soft skill in comunicazione tra colleghi perchè teme di essere ipocrita. Soft Skill (cioè le doti comunicative) si imparano col tempo e con l’esperienza. Le Hard Skill (conoscenze tecniche e pratiche) si imparano più velocemente, ma l’evoluzione della tecnologia rende presto obsoleto il nostro apprendimento. Col risultato che anche nel SEO serve imparare molto altro rispetto ad H1, link e intento dell’utente.

questo è un grafico di quello che si aspettano gli addetti HR quando assumono figure junior e figure senior.

hard-skill-soft-skill

quest’altro è quello che succede in realtà.

percezione-softskill

Cioè una Soft Skill applicata male (magari da un junior) lo fa apparire agli occhi dei colleghi falso ed egoista, la stessa soft skill usata con maestria da un senior lo fa apparire altruista e magari anche un buon capo. Il manager è falso ma ottiene successi ed il junior è sincero ma viene allontanato dai colleghi? Rispondiamo a questa domanda facendo un passo indietro.

vecchia-pubblicita-buitoniA tavola con la bimba (Camilla ha 2 anni e mezzo ora che scrivo) è stato ed è essenziale avere alcune regole. Non si mangia fuori pasto, a tavola si mangia tutti assieme, tutti si mangia quello che c’è sul tavolo e non si chiedono extra dal frigo. Siccome tutti rispettiamo queste semplici regole, la bimba è cresciuta in un contesto in cui il vizio, il capriccio o i piagnistei a tavola non esistevano. Grazie all’autosvezzamento ha avuto da subito la possibilità di scegliere cosa mangiare e soprattutto, di non dimenticare gli stimoli della fame e del gusto. In compenso, in questo periodo guardando la pubblicità in TV, a volte mi chiede “papà voglio mangiare prosciutto” anche se siamo fuori pasto, e fuori contesto rispetto alle nostre regole. E’ in questo momento che credo sia importante tenere duro, e dare uno standard comportamentale. Poi quando sarà grande potrà decidere se fare eccezioni o se prendersi vizi. in questo momento però credo abbia bisogno di una guida.

nei rapporti tra le persone è così. ci sono standard comportamentali, della gentilezza, del buon senso, del rispetto altrui ecc… che fanno sì che chiedendo un piacere ad un collega amico si ottengano spesso lavori migliori rispetto a quelli che ha un capo iroso che comanda senza rispettare la dignità altrui. Chiedere con gentilezza ed usare gli aggettivi adeguati nel lavoro coi colleghi non è ipocrisia, ma è comunque manipolazione di quella nostra parte istintiva che quando vede un lavoro di merda vorrebbe poter dire “questo lavoro fa cagare!“. Invece bisogna girarci attorno, far valere vari punti di vista, chiedere per piacere, insomma, quello che alle risorse umane riassumono con “soft skills”, tutto questo e molto altro evitando di rompere il delicato equilibrio dei rapporti interpersonali, governati dall’autostima e dall’autorevolezza (oltre che dalle figure di merda).

Tornando alla metafora del cibo (sopra potete vedere una vecchia pubblicità che ho trovato ad una mostra sulla vecchia pubblicità, che faceva leva sul misterioso Acido Glutamico, potente attivatore dell’intelligenza) Acido Glutammico sì, ma con moderazione? Uccido il mio istinto e divento obeso? Soft Skills si, ma con moderazione? Il problema è che le soft skill comprendono appunto anche la moderazione stessa e la comprensione del contesto nel quale si comunica. In alcuni casi un messaggio diretto può arrivare a segno, altre volte lo stesso messaggio diretto può causarci ostacoli a non finire, tutto dipende da “come la prendono i colleghi” e cioè da come la diciamo, e da quali aggettivi usiamo per definire i problemi.

Capire dove arrivi l’istinto e dove arrivi la voglia di successo di un individuo è un’impresa ostica. Mentre nella fame l’istinto è abbastanza facile da ascoltare, nei rapporti interpersonali la coscienza viene annebbiata dalla voglia di prevalere, e a volte scambiamo per sincerità una semplice arroganza.

Sempre ieri, e sempre Eugenio, mi ha chiesto “come fai ad essere sempre così positivo?“. La mia risposta istintiva è stata “non sono positivo, anzi…” però l’ho solo pensato, non l’ho detto. Ho invece detto “gioco molto ai videogiochi“, ho quindi accettato il complimento ed ho dato qualcosa su cui riflettere (nella fattispecie questo fantastico editoriale di Stefano Silvestri) perché alla fine, accettare il ruolo che gli altri ci danno fa parte del gioco. Crearci il nostro ruolo su misura invece, sarebbe un bel progetto per questo 2015, che ne dite?

Anche se questa parola “master” non mi piace perché sembra sempre ci siano chissà quali magie da insegnare e poi alla fine è sempre sinonimo di “corso molto costoso”, mi hanno chiamato per qualche docenza e così ho accettato cercando di portare il meglio che posso.

Università Cattolica Milano – IdeaProgramme

logo-unicatt-accenture
Da aprile 2015 tengo la classe SEO al Master “IDEA” Innovation Digital Technology Entrepreneurship and Advanced Internationalization tenuto dall’Università Cattolica del Sacro Cuore di Milano in collaborazione con Accenture (di seguito le slide della lezione introduttiva)

Read more »

Sto ancora sperando che la semantica possa diventare quel “segnale forte” col quale Google potrebbe finalmente togliere peso ai link. Immaginavo un motore di ricerca intelligente e difficile da ingannare. Poi è arrivato Google+, e mi è venuto qualche sospetto che i tempi si sarebbero allungati (perchè concentrarsi sul social network se fosse stata sufficiente la semantica?).

Poi l’anno scorso mi sono accorto che se scrivo una pagina web che risolve un problema ad una persona, pensando principalmente al “significato” del problema da risolvere, ecco che google mi manda traffico anche su tanti vari “significanti” (cioè le parole chiave) anche se queste non sono sinonimi grammaticalmente compatibili. Esempio: sulla pagina della stitichezza, mi aspettavo di trovare in ingresso anche ricerche legate a “stipsi” e “costipazione” eppure sono arrivate anche varie ricerche tipo “non riesco ad andare in bagno da 5 giorni”. Che Google abbia capito che quelle persone sono stitiche? Che Google sia finalmente diventato intelligente?

Queste e molte altre domande sono sfociate in una miriade di test ed esperimenti (molti anche fatti dalla community dei seo italiani). Dopo tanti anni ad aspettare l’emancipazione del motore di ricerca dai link, sarà la volta buona? (Matt Cutts dice che in teoria si, ma in pratica ci terremo il mercato dei link per tanti altri anni).

Siccome da solo non ho trovato risposte, e siccome tra qualche giorno dovrò tenere un corso ai giornalisti del Sole, ho pensato di chiedere ad uno dei massimi esperti italiani di semantica applicata:

varoneAmici del blog e dei prossimi master dove avrò la fortuna di parlare, date il benvenuto a Marco Varone, fondatore e CTO di Expert System (qui il suo fantastico blog).

Colgo l’occasione e ringrazio anche pubblicamente Marco per la sua infinita gentilezza e disponibilità nel rilasciare questa intervista. L’ho trascritta come meglio potevo dato che non sono riuscito a registrare, tutti gli errori di battitura sono miei.

Marco, è possibile far capire ad una macchina le differenze tra significato e significante? (linguistica)

– realisticamente no, secondo me la singularity non esisterà mai. Ciò che è possibile fare invece è ottenere una capacità simile, su casi specifici, simulando la mente umana, usando algoritmi dotati di sufficiente contesto e che risolvono solo una piccola parte del problema alla volta. La reale comprensione di significato è un problema non computabile, ma alcuni sotto problemi si. Ad esempio Worlphram Alpha, si appoggia su un RDF condiviso e riesce a rispondere ad alcune domande per le quali ha sufficiente contesto e conoscenza.

come quando provo a chiedergli “quanti anni aveva Leonardo quando è morto?“, lui “capisce” che mi sto riferendo a Leonardo Da Vinci e mi da l’esatta età?

– Si.

quanto c’entra la lingua parlata con la semantica?

– fino a 7-8 anni fa la lingua parlata era irrilevante nelle tecnologie semantiche perchè tutto ciò che era analizzabile era testo scritto fin dall’inizio con l’intento di dire qualcosa per iscritto.

poi i sistemi di riconoscimento vocale hanno iniziato a funzionare bene e quando una persona parla non pensa come quando scrive (è piu naturale e meno lineare).

è nata la comunicazione sociale (blog, social network) che sono diventati volumi di informazioni enormi. buona parte di questi contenuti hanno una struttura sintattica, espressioni, significati, ecc. simili a quelli della lingua parlata. Per comprenderli è necessario rendere più robusta e più intelligente qualsiasi tecnologia semantica. (non si è mai scritto così tanto come adesso).
è una sfida per la semantica perchè io vado ad esprimere una parte del contenuto del discorso con elementi paralinguistici (es. il significato della faccina emoticon nel discorso).

Capire una nuova forma di espressione come l’ibrido che troviamo sui social network richiede cambiamenti alle logiche o è “sufficiente” arricchire il database?

– purtroppo richiede anche nuove logiche oltre a più conoscenza

quindi vi costa di piu?

– certo, abbiamo bisogno di rendere il sistema più flessibile, questo però aumenta il rumore. occorre andare a modificare gli algortimi di analisi, provando ad aumentare la flesssiblità minimizzando la perdita.

quando devi capire un contesto specifico usi tutta la “macchina” o usi solo logiche specifiche?

– entrambi- quando capiamo che si tratta di un certo tipo di linguaggio usiamo solo algoritmi personalizzati. se ad esempio analizzi twitter, sai già che le logiche sono quelle.

quanto si puà fare tramite algoritmi e quanto “allenando” algoritmi (es. agenti)?

– è indispensabile fare “allenamento” perchè la comunicazione si evolve, quindi è fondamentale poter far analizzare grosse moli di testo al sistema, e questo ci aiuta a mettere a punto le logiche migliori. Senza un intervento di validazione di questa conoscenza o di questi elementi rilevanti rischi di avere molto rumore. se stai lavorando su un contesto specifico te la puoi cavare facendo un allenamento automatico. ma se non lavori su un costesto specifico e metti a punto una tecnologia che possa essere usata in orizzontale, allora l’allenamento aiuta ma deve essere mediato da una validazione umana

come fai a distinguere il rumore da ciò che invece aiuta un lettore a capire il significato del contenuto in esame?

– la maggior parte del contenuto testuale viene usato dal sistema per riconoscere i significati. la logica dell’analisi semantica riguarda le espressioni che ci sono in un testo. es. la parola bagno può essere un locale, può essere un’azione, quindi quando trovo quella parola devo capire il significato all’interno del contesto. Analizzo una serie di fattori, co-occorrenze e segnali che identificano l’argomento di cui si sta parlando. es. se parlo anche di sabbia, sdraio, ombrelloni ecc. posso capire che ti riferivi a quel tipo di bagno che si fa al mare… oppure che ti riferivi ad uno stabilimento balneare. Sono tutte hint che fanno capire al sistema il contesto. quasi tutte le informazioni che ci sono in un testo aiutano il sistema a scoprire i significati, sono pochi gli elementi da scartare. quando ci sono parole ambigue che non ti aiutano a capire il contesto, le scartiamo (es. “acqua” vale in quasi tutti i contesti). il sistema le scarta in automatico. Se ti chiami Giovanni Bagno, capiamo che invece sei una persona.
ciò che è piu forte all’interno delle varie ipotesi viene preso come più probabile. Se io ho un elemento X che canta, so che non può essere una pianta (questo è un dato logico). in altri casi quando si parla di parole tutte appartenenti ad uno stesso contesto posso usare la valenza statistica.

un sistema semantico può usare ontologie dinamiche?

– può avere senso. fino ad un certo punto è possibile usare elementi noti usati in modo ignoto (il sistema ipotizza un significato che non conosce, in quel caso può imparare). Il sistema però deve avere un numero sufficiente di occorrenze per poter imparare (cioè grandi volumi). tipicamente i nuovi significati sono poco probabili, ma possibili.

Google tiene molto “aperto il rubinetto”, pur non avendo una vera e propria tecnologia semantica. Google deve essere sempre sull’attualità. hanno bisogno di freschezza nei dati esposti, mentre noi teniamo stretto il rubinetto “dell’apprendimento”, loro lo tengono molto aperto. se ci sono conoscenze o relazioni che sembrano significative, non aspettano molto per renderle integrate nel sistema, quindi a volte è facilmente ingannabile. è il rovescio della medaglia. è molto difficile usare il giusto compromesso, noi abbiamo scelto da sempre di essere più conservatori e lasciamo che il sistema apprenda solo in presenza di segnali forti e di durata nel tempo. D’altra parte loro vendono pubblicità, noi software. L’approccio per chiedersi quanto al sistema è consentito di apprendere è importante, loro possono usare subito qualcosa appena imparato. Google ha il vantaggio di essere una cosa gratis, quindi anche se sbaglia un utente ripete la ricerca. noi invece siamo a pagamento quindi i nostri utenti hanno meno tolleranza sugli errori.
tutte le volte che clicchi il quarto risultato piuttosto che il primo dai un grande vantaggio competitivo a Google. Nonostante questo hanno molte tecniche per individuare potenziali trucchi e abusi da parte di chi ha capito come funziona parte del loro sistema.

il vostro sistema è quindi piu ingenuo di quello di google?

– non direi ingenuo, semplicemente solitamente il nostro sistema è utilizzato in contesti in cui non c’è nessuno da ingannare perciò non è necessario implementare logiche di riconoscimento di imbrogli o trucchi

e nel caso in cui l’autore di un brano sia il primo a non voler rendere evidente lo scopo o il significato del suo scritto?

– allora ne capiremo poco e non saremo in grado di individuare i concetti o gli elementi rilevanti e i corrispondenti significati

c’è un modo di scrivere che risulta più facile da capire per una macchina che cerchi di estrarne i “topic” o il suo RDF?

– assolutamente si. tu puoi scrivere gli stessi contenuti in modo facilmente comprensibile per una macchina, o in modo estremamente difficile. esempio: costruire un testo composto da frasi brevi con poche subordinate è una grande semplificazione, perchè quando comincio ad avere più subordinate ho una parte del testo che dipende da quello che è stato scritto prima. Se utilizzi parole rare il sistema funziona molto meglio, se invece di macchina scrivo automobile, quest’ultima è meno comune ed il sistema è in grado di capire meglio. Scrivendo troppo per le macchine comunque ottieni un testo piatto e di solito meno interessante per gli esseri umani. Sei meglio per le macchine o più faticoso per le persone. Devi sceglire qual’è il tuo obiettivo.

in che modo si riesce a capire l’autorevolezza di un Resource Definition Framework?

– non è possibile individuare la maggiore solidità o rilevanza di una fonte rispetto ad un’altra in nessun modo automatico. Quello che puoi fare è confrontare N fonti e vedere quella più vicina al “consenso”. questa però è un’approssimazione. molte informazioni tra freebase e wikipedia sono identiche perchè freebase le ha prese da wikipedia, però hanno poi livelli di aggiornamento diversi. Entrambe sono fonti gestite con un processo strutturato, freebase è di Google quindi forse è piu affidabile. il problema è che è molto difficile usare contenuti simili e confrontabili. la cosa diventa colossalmente complessa. generalmente i repository di conoscenza non sono tantissimi quindi viene fatta una valutazione iniziale e poi viene tenuta buona. quindi se battezzi freebase come fonte di qualità, non cambierà nei prossimi anni. è un insieme di analisi umane. superate certe soglie difficilmente si scende. google lo può fare pechè ha il controllo di una serie di flussi e di passaggi di conoscenza che noi non abbiamo. noi da fuori non sappiamo quante volte gli utenti consultano freebase o wikipedia. spiegavo ad alcuni ragazzi che Google è un’azienda che ha come primo obiettivo quello di fare soldi e nel fare questo fornisce servizi apparentemente gratis, però è un’azienda. ma non è la verità, non è il tutto, non è obiettivo, non è indipendente. ma per chi è abituato da quando aveva 15 anni a usare Google e a trovarsi il primo risultato come quello giusto, per loro è difficile capirlo. è incredibile come la gente si fidi di Google (e non solo di Google purtroppo…)

possono esserci diversi livelli dei significati, anche legati alla struttura stessa dell’html ad esempio?

– si, il fatto di usare il grassetto ha diversi significati, magari lo usi in senso figurato o altro.

come fai a dosare?

– abbiamo approssimazioni imparate nel corso degli anni. ci sono una serie di meta logiche che abbiamo imparato negli anni e sono cose che raramente cambiamo.

come definiresti l’utilizzo della semantica tra documenti collegati tra loro (es. via link ipertestuale)

– la presenza di un link nella parte semantica non è rilevante perchè la correlazione e il rapporto di vicinanza tra due documenti sono basati sui concetti piuttosto che sulle relazioni dirette. Puoi linkare due documenti non correlati e viceversa. La vicinanza semantica tra due documenti può essere diversissima, quindi la semantica tende ad ignorare gli aspetti legati ai link. la semantica lavora sul contenuto.

è possibile usare la tecnologia semantica con un layer adatto a qualsiasi lingua?

– si, è quella parte che si stacca dal lessico e riguarda la rappresentazione del mondo. in qualunque lingua del mondo esiste almeno una parola per definire un tavolo. il concetto di tavolo in alcune culture è minimale e ridotto (magari dove non si usa). C’è una parte di semantica che è indipendente dalla lingua però deve esistere anche una parte dipendente dalla lingua. C’è chi ipotizza che pensiero stesso sia linguistico e chi dice che non dipende dalla lingua. puoi cercare di fare più lavoro possibile in modo indipendnete dalla lingua, con meta rappresentazioni.

che ruolo potrebbe avere la compilazione di documenti nei formati di linked open data rispetto all’applicazione di software semantici?

– Potrebbe sicuramente aiutare il sistema a capire meglio il contenuto e a ridurre l’ambiguità

se una macchina riesce a “capire” il corretto significato, a che punto siamo con una “scrittura” creativa di nuovi contenuti da parte di una macchina?

– Molto indietro: ci sono ottimi programmi che scrivono testi fattuali con qualche spunto apparentemente creativo (ad esempio, cronache sportive di eventi minorei partendo dal risultato e da qualche altro dato oggettivo) ma oltre questo non c’è nulla di veramente rilevante (e non credo ci sarà per molti anni ancora).