GOOGLE CLOUD VISION: GUARDA IL MONDO CON GLI OCCHI DI GOOGLE

Un piccolo robot, fatto con poco più di due ruote e quattro cavi, si sposta su un tavolo. Passa davanti alle persone sedute intorno, si ferma di fronte a una persona sorridente e dice con la sua voce metallica: “Sembri contento: raccontami perché sei contento!”. Se invece la persona è imbronciata, domanda: “Sembri triste: cosa ti succede?”.

EMPATHYBOT: IL ROBOT CHE INTERPRETA LE TUE EMOZIONI

Come può un aggeggio così rudimentale riconoscere un’emozione umana? Dove nasconde i potenti processori e le enormi basi di dati necessari per realizzare questo compito?

Potenza dal cloud

In realtà, questa enorme potenza di calcolo non è nella macchinetta. Si trova nel cloud di Google, l’insieme di computer remoti che l’impresa mette a disposizione di utenti e sviluppatori.

Il robot empatico utilizza la potenza del cloud per riconoscere le espressioni facciali. Questo è possibile grazie a una delle più innovative applicazioni del gigante tecnologico di Mountain View: Google Cloud Vision.

Questo prodotto permette a programmatori e hacker di sfruttare per i loro progetti la potenza degli algoritmi di Google Images. Le capacità dell’occhio di Google sono infinite: da indovinare la razza di un cane a contare quante persone compaiono in una foto di classe; da distinguere una zucca da un pallone ad azzeccare dove si trova il lago immortalato in una vecchia foto.

Immagini in movimento

Google Cloud Vision ha solo un anno di vita, però il 9 marzo Google ha già presentato un suo ulteriore sviluppo: Google Cloud Video Intelligence. Il sistema applica alcune delle funzioni di Vision alle immagini in movimento. In questo modo, cresce enormemente le possibilità di fare ricerche di contenuti audiovisuali.

Non è un caso che una delle prime imprese interessate a Google Cloud Vision sia stata AeroSense. Questa compagnia di droni registra migliaia di immagini in ogni singolo volo. Ripassarle a occhio per identificare gli oggetti fotografati è proibitivo. È in situazioni come questa che può essere indispensabile la vista automatizzata di Google.

Algoritmi che apprendono dai dati

Il segreto di Google Cloud Vision sta negli algoritmi di “machine learning” che hanno fatto la fortuna del motore di ricerca. Google usa l’enorme quantità di dati che ha a sua disposizione per addestrare i suoi algoritmi.

Quando cerchiamo la parola “cane”, Google Images restituisce milioni di immagini di cani. Questo non accade perché l’algoritmo conosca l’idea platonica di cane, bensì perché ha imparato a riconoscere questo animale a forza di comparare enormi quantità di immagini.

La compagnia ha messo a disposizione degli utenti un simulatore, che permette di esplorare la sua galassia di immagini e capire il funzionamento di Google Cloud Vision. L’impresa di Mountain View non è l’unica che è salita su questo treno. Amazon, per esempio, ha lanciato un prodotto che compete per lo stesso mercato: Amazon Rekognition.

Testo ed immagini

Le applicazioni della visione computerizzata possono essere davvero sorprendenti. Nel seguente video, un robot realizzato con Rasperry Pi utilizza Google Cloud Vision per classificare i dolcetti di Halloween come buoni o meno buoni. Il software è capace di riconoscere la marca delle merendine grazie al suo algoritmo di estrazione di testo dalle immagini.

ROBOT CLASSIFICATORE DI DOLCETTI

Google Cloud Vision può interpretare le immagini in molti modi diversi:

Per hacker e ricercatori

Google Cloud Vision apre delle possibilità di hacking soprendenti. Per esempio, si può combinare con Google Translate per imparare come si dice bicchiere in cinese, semplicemente inquadrando un bicchiere con il cellulare.

IL NOME DELLE COSE

Se invece il software si combina con la collaborazione di vari esperti di moda, si può ottenere un sistema che classifica automaticamente a che tribù urbana appartiene un passante dall’aspetto eccentrico.

IDENTIFICAZIONE DELLO STILE

Disney ha usato il programma in una app di realtà aumentata che fa apparire il drago del suo ultimo film sul divano di casa. Il ricercatore Kalev Leetaru, invece, lo ha usato per analizzare le situazioni più ricorrenti in decine di spot elettorali o i luoghi più fotografati dalla stampa internazionale.

Forse la prossima applicazione la farai tu, perché l’occhio di Google promette di cambiare anche la tua maniera di vedere il mondo.

License: Creative Commons Attribution No Derivatives 4.0

Potrebbe interessarti anche...

L’inaspettata storia del guerrilla marketing L’inaspettata storia del guerrilla marketing
Il vero costo del Comic Sans e altre peculiarità di stampa Il vero costo del Comic Sans e altre peculiarità di stampa
L’arte controversa di dare colore al passato L’arte controversa di dare colore al passato
Sentire la tipografia Sentire la tipografia
Venetian Floors Venetian Floors
Barcelona Floors Barcelona Floors
Come la stampa conquistò l’arcobaleno Come la stampa conquistò l’arcobaleno
T'insegno Milano T'insegno Milano
London Floors London Floors
T'insegno Parigi T'insegno Parigi
T'insegno Lisbona T'insegno Lisbona
Berlin Lines Berlin Lines
Mood Palette Mood Palette