Benvenuti nel mondo della visione artificiale

In questi giorni sembra che la visione artificiale stia spuntando ovunque, ma che cos'è?

La fotocamera è un computer

La visione artificiale è un sistema che utilizza una fotocamera accoppiata a un computer e un software di interpretazione delle immagini per creare dati. I dati vengono a loro volta elaborati e utilizzati per decidere un'azione. In sostanza, una macchina è programmata per cercare una cosa specifica e quindi eseguire un'azione quando vede ciò che sta cercando.

Ad esempio, una macchina fotografica può essere installata sulla linea di confezionamento di una fabbrica per cercare difetti nella confezione. Quando vede un difetto in un oggetto, la macchina può rifiutarlo. Tutto questo può accadere molto più rapidamente che se un umano facesse la stessa cosa.

La definizione di visione artificiale può anche includere tutti i tipi di macchine esistenti per creare immagini da interpretare, motivo per cui svolgono ruoli in produzione, sicurezza, sorveglianza e altro. Le macchine con telecamere vengono utilizzate in un'ampia varietà di attività, come ad esempio il tè celeste usando telecamere per eseguire ispezioni di imballaggio sulla linea di trasporto o Tesla usando la tecnologia per far sì che le loro auto leggano i segni di limite di velocità e adeguino la loro velocità di conseguenza. Un altro ottimo esempio di visione artificiale è nel settore della sicurezza: quando controlli la dogana all'aeroporto, una telecamera scatta la foto e utilizza il riconoscimento facciale per cercare persone che sono state segnalate.

La visione artificiale e il riconoscimento dei pattern potenziano lo scambio linguistico on-the-fly di Google Translate.

La visione artificiale è qui per rimanere. Man mano che le telecamere e la tecnologia diventano meno costose, saranno integrate in più posti e svolgeranno più compiti in un modo più rapido e affidabile di un umano. Come fotografi, avremo più accesso alla tecnologia per aiutarci a fare il nostro lavoro. La tecnologia ci salverà dal compiere i compiti più noiosi associati al nostro lavoro e ci aiuterà a elaborare e catalogare grandi quantità di informazioni.

I meccanismi della visione artificiale

La visione artificiale utilizza la luce visibile e una fotocamera per scattare una foto. I pixel in quella foto vengono quindi elaborati dal software che cerca aree di contrasto o pixel di valori specificati. Alcuni esempi di parametri che il software cerca sono:

  • Rilevamento dei bordi: trova i bordi degli oggetti
  • Confronto colori: ricerca il colore all'interno di un intervallo RGB specificato
  • Conteggio dei pixel: conta il numero di pixel chiari o scuri
  • Riconoscimento di pattern: pixel in una disposizione specifica
  • Misurazione della profondità: utilizzo delle immagini per modellare lo spazio tridimensionale

Ci sono molti più parametri che gli algoritmi possono cercare in un mare di pixel. Il processo esatto dipende dall'applicazione. In effetti, lo sviluppo del software è spesso sviluppato in tandem con il ruolo che svolgerà.

Machine Vision at Work

Il campo della visione artificiale abbonda di intriganti ed entusiasmanti esempi di applicazioni sia attuali che appena all'orizzonte. Un ottimo esempio è una fotocamera che può fornire a una persona con disabilità visiva informazioni su un oggetto, sulla costruzione o su tutto ciò che si trova di fronte a loro. Puoi già utilizzare la fotocamera di uno smartphone per riconoscere un dipinto in un museo e dirgli il nome del pittore. Puoi anche usare il tuo smartphone per tradurre testi stranieri su un cartello.

App Google Traduttore che utilizza l'OCR per tradurre il testo.

Altri esempi includono:

Riconoscimento facciale

  • Sblocca i tuoi dispositivi e computer
  • Sorveglianza
  • Tagging delle immagini in Adobe Photoshop Lightroom

Riconoscimento ottico dei caratteri

  • Lettura del numero di serie
  • Lettori di targhe
  • Progetto Gutenberg (digitalizzazione del libro)
  • Automobili che leggono i segni di limite di velocità

Ispezionando su una linea di produzione

  • L'imballaggio può essere ispezionato per la corretta tenuta
  • Le parti possono essere ispezionate per i difetti
  • Misurazione dei livelli di liquidi in una linea di imbottigliamento o misurazione delle dimensioni dei pezzi
  • Contando per assicurarti che una scatola di 24 abbia l'importo corretto

agricoltura

  • Manutenzione delle colture e irrigazione
  • Raccolta
  • Controllo qualità post-raccolta

Scienza

  • Analisi cellulare
  • Mappatura e analisi GIS
  • Modellistica meteorologica

Cosa significa la visione artificiale per i fotografi?

Ormai potresti essere preoccupato che le macchine con telecamere ti sostituiranno. Ti assicuro che il tuo lavoro è probabilmente sicuro per il prossimo futuro. I fotografi umani scattare foto per gli esseri umani per interpretare, condividere e divertirsi. Le macchine non sono ancora in grado di comprendere tutte le sfumature che possono essere lette in una fotografia, per cui rimarranno per un po 'bloccati nel mondo industriale.

D'altra parte, ci sono alcuni sviluppi preoccupanti sul campo se sei un ritoccatore o un editore professionista. L'intelligenza artificiale di Google può ora combinare e ritoccare automaticamente le immagini in modi preoccupanti e creare e modificare storie. Forse ora sembra una trovata, ma così è stata la fotografia stessa nei suoi primi giorni.

Tuttavia, mettendo da parte la nostra ansia esistenziale per un secondo, ci sono molti modi in cui puoi usare la visione artificiale a tuo vantaggio come fotografo.  

Un modo promettente per utilizzare la tecnologia di visione artificiale è l'auto-tagging, in cui il software tenta di guardare il contenuto di un'immagine e di elencare le cose che sono presenti. Ad esempio, se si dispone di analizzare una foto di fragole, il software potrebbe restituire i tag: bacche, frutta, fragole, freschi. Questo processo automatizzato promette di eliminare molte ore di codifica manuale delle immagini con parole chiave. Il sito di condivisione di foto Flickr, ad esempio, tag automaticamente per te al momento del caricamento.

Un'altra tecnologia di visione artificiale disponibile per i fotografi in questo momento è il riconoscimento facciale come parte di Lightroom 6, Apple Photos e Picasa. Il riconoscimento facciale valuta le tue foto e cerca volti. Quindi raggruppa insieme facce simili che il programma pensa appartengano alla stessa persona. Devi ancora entrare e mettere un nome sul viso e risolvere le false corrispondenze, ma questa tecnologia può aiutarti a trovare e tenere traccia di tutte le immagini che hai scattato per i clienti.

Utilizzo del riconoscimento facciale in Adobe Lightroom per taggare le persone.

Forse il tuo prossimo incarico fotografico potrebbe comportare la creazione di immagini che saranno sottoposte a una qualche forma di macchinari per raccogliere dati. In questo caso, dovrai sapere che cosa sta cercando quel sistema per aiutare il processo. Ad esempio, se il software sta cercando modifiche in contrasto, vorresti sapere come regolare la tua illuminazione per rivelare meglio il contrasto.

The Takeaway on Machine Vision

La visione artificiale è un settore promettente di tecnologia che può essere molto utile in molti settori e ruoli, anche per i fotografi. Anche se non vi è il pericolo imminente di essere rimpiazzati da una macchina con una fotocamera, c'è l'opportunità di usare la nuova tecnologia per migliorare il flusso di lavoro. La rivoluzione digitale ha portato a una proliferazione di macchine fotografiche e immagini, forse più immagini di quante ne possiamo ricavare senza usare una sorta di visione artificiale per aiutarci a interpretare.