Anonim

Cosa sono le API di riconoscimento delle immagini e cosa possono fare per te? Questo articolo chiarirà cos'è il riconoscimento delle immagini, cosa fa un'API e come può aiutare te o la tua azienda a ottenere di più da Internet. Il riconoscimento delle immagini ha un enorme potenziale per le aziende e per i singoli utenti di Internet non vedenti.

Che cos'è un'API per il riconoscimento delle immagini?

Il riconoscimento delle immagini è il punto in cui un software rileva le caratteristiche di un'immagine e la classifica accuratamente. Ad esempio, se carichi un'immagine di una Ferrari 458 su un'API di riconoscimento delle immagini, dovrebbe riconoscere che è un'auto e che è (o dovrebbe essere) rossa. A seconda dell'API, potrebbe essere possibile un'ulteriore classificazione a seconda del tipo di immagine che si sta utilizzando.

Questo può sembrare davvero semplice - gli umani possono guardare un'immagine e dirti di cosa si tratta senza provare, il più delle volte - ma questo è stato un problema difficile insegnare ai computer a risolvere. Un sacco di lavoro è stato fatto per capire come un computer può capire che aspetto hanno le cose, e abbiamo fatto passi da gigante, dalla capacità di fare ricerche inverse di immagini alla famosa rete Deep Dream di Google.

Un'API è un'interfaccia del programma applicativo. È essenzialmente un intermediario tra le routine del programma che dice a un elemento come lavorare con un altro o fornisce gli strumenti di cui hanno bisogno per eseguire una funzione. Esistono dozzine di tipi di API che possono raggiungere tutti i tipi di obiettivi, utilizzando una gamma di linguaggi di programmazione. In questo contesto, un'API di riconoscimento delle immagini è lo strumento che è possibile utilizzare per accedere al potere di deep learning di alcuni sistemi commerciali di riconoscimento delle immagini.

È necessaria molta potenza di elaborazione per eseguire il riconoscimento delle immagini. Sono necessarie masse di dati e il potere di interpretarle tutte. La maggior parte degli utenti semplicemente non ha le enormi risorse per costruire la propria macchina di apprendimento profondo. I grandi nomi come l'API Vision di Google, l'API Face di Microsoft, ImageNet e altri hanno tali macchine e consentono l'accesso ad esse tramite API, gratuitamente o a pagamento. Ciò consente alle aziende di tutte le dimensioni di accedere a questo potere e di conseguenza agli utenti di ottenere nuove esperienze.

In che modo il riconoscimento delle immagini cambierà la nostra esperienza su Internet?

Diversi utenti di Internet avranno diversi vantaggi dal riconoscimento delle immagini. Diamo un'occhiata a un ipotetico proprietario di un sito Web e a un ipotetico utente per vedere come entrambe le parti possono trarne vantaggio.

I vantaggi commerciali del riconoscimento delle immagini

Ad esempio, supponiamo che tu gestisca un portale di auto-vendita simile a Etsy o un sito di incontri. Vuoi gestire la qualità e l'idoneità di tutte le immagini caricate dagli utenti. Vuoi bloccare tutte le immagini per adulti o inadatte e ordinarle nelle categorie appropriate, ma non puoi assolutamente fare tutto a mano.

Inserisci l'API di riconoscimento delle immagini. È possibile utilizzare l'API, insieme a una macchina di riconoscimento delle immagini adatta, per scansionare ogni singola immagine e definirla in base a criteri impostati. Quindi potresti scansionare la libreria di immagini alla ricerca di immagini indecenti ed eliminarle. Puoi scansionare le immagini e ordinare quelle che contengono cibo nella categoria "cibo" e maglieria nella categoria "lana". Una volta detto all'API cosa fare, il processo è automatizzato.

Ci sono anche opportunità qui per la realtà aumentata e immagini e video interattivi. È possibile utilizzare il riconoscimento delle immagini per fare in modo che un programma riconosca gli oggetti nel mondo reale. Ad esempio, potresti scattare una foto di un paio di scarpe da ginnastica che qualcuno indossa per strada. Se il programma riconosce le scarpe da ginnastica, l'immagine potrebbe essere aumentata con un link per acquistarle da soli. Questo avvantaggia il business (offre un'immediata opportunità di vendita) e avvantaggia l'utente (ottengono ciò che vogliono in questo momento).

L'utente beneficia del riconoscimento delle immagini

L'esempio di sneaker sopra è solo un modo ovvio in cui gli utenti possono beneficiare del riconoscimento delle immagini. La realtà aumentata ci consente di accedere istantaneamente a recensioni, informazioni sui prezzi e molti dati semplicemente scattando una foto di un prodotto. Ciò offre agli utenti enormi quantità di dati per aiutarli a prendere una decisione di acquisto.

Mark Zuckerberg ha riassunto un vantaggio spesso trascurato del riconoscimento delle immagini nel suo discorso sull'intelligenza artificiale all'inizio di quest'anno. Ha immaginato un'API di riconoscimento delle immagini che ha lavorato con persone non vedenti o ipovedenti in grado di "leggere" un'immagine e descriverne ciò che vede ad alta voce. Ciò potrebbe avere enormi ripercussioni per gli utenti di Internet con difficoltà o, con una realtà aumentata, nel mondo reale qualche tempo dopo.

Anche il riconoscimento delle immagini ha un ruolo nella sicurezza del veicolo. Le nuove tecnologie di frenata autonoma e di prevenzione delle collisioni introdotte funzionano in modo simile alle API di cui abbiamo parlato. Scansionano e valutano le immagini più volte al secondo per proteggere te e la tua auto mentre sei in viaggio. Questa tecnologia che racconta anche alle auto autonome ciò che li circonda.

Le API di riconoscimento delle immagini non rivoluzioneranno da sole la nostra esperienza su Internet. Lavorano insieme alla tecnologia esistente per aggiungere uno strato di interazione e immersione al mondo che vediamo. Mentre gli esempi di questo articolo sono limitati, esiste un enorme potenziale per i giochi, i film, l'industria automobilistica, la vendita al dettaglio, l'intrattenimento e qualsiasi settore abilitato alla tecnologia. Questo è solo l'inizio di ciò che i sistemi intelligenti possono raggiungere!

Cosa sono le API di riconoscimento delle immagini e cosa possono fare per te?