Per comprendere meglio il significato ma soprattutto la complessità della visione artificiale, riteniamo opportuno fare un passo indietro e analizzare quelle che possono essere definite a tutti gli effetti le teorie della visione. Infatti, ciò che ha portato nel corso dei secoli allo sviluppo degli odierni sistemi di visione, ha radici storiche profonde che meritano di essere analizzate per avere un quadro complessivo della materia.
L'occhio e di conseguenza la visione sono stati oggetto di interpretazioni molto contrastanti fin dall'antichità e nel corso della storia.
Platone, che era un convinto assertore di una "azione attiva dell'occhio", scrisse che la luce emanava dall'occhio stesso, individuando e avvolgendo gli oggetti con i suoi raggi. Teofrasto, che era stato un discepolo di Aristotele, era della stessa opinione e scrisse che l'occhio aveva "il fuoco dentro", allontanandosi dalle idee del suo maestro, che invece pensava fosse l'occhio a ricevere i raggi.
La teoria emissionista
Intorno al 300 aC, Euclide scrisse "Optica", che riportava i risultati dei suoi studi sulle proprietà della luce. Egli ipotizzò che essa viaggiasse in linea retta, descrisse le leggi della riflessione, le studiò matematicamente e sostenne che i raggi visivi sono emessi dall’occhio per catturare gli oggetti che si stanno osservando.
Tolomeo e Galeno approfondirono la rifrazione della luce e anch'essi sostennero la teoria emissionista secondo cui gli oggetti sono visti dai raggi di luce che fuoriescono dagli occhi. La grande autorità medica di Galeno ha consentito alla sua teoria di esercitare una notevole influenza in Europa per gran parte dei successivi mille anni. I sostenitori della teoria emissionista portavano due prove a sostegno della loro convinzione:
- L'abitudine di salutare dei soldati greci, che mettevano le mani davanti ai loro occhi, derivava dal bisogno di proteggersi dalla potente luce emanata dagli occhi dei loro comandanti;
- La luce degli occhi di alcuni animali, come i gatti, che permette loro di vedere nell'oscurità.
L'occhio è stato un argomento di particolare interesse anche per la medicina e la filosofia islamica medievale, che furono ovviamente influenzate dai trattati scritti da Galeno. Fra il nono e il quattordicesimo secolo apparvero numerosi trattati specialistici sull'oftalmologia e importanti studiosi, come Al-Kindi e Hunain Ibn Ishaq, favorirono la teoria dell'estromissione della vista.
Entrambi gli studiosi iniziarono però a prestare particolare attenzione all'anatomia dell'occhio e ad approfondire il ruolo di parti importanti come la retina e la lente cristallina.
Critiche alla teoria emissionista
Avicenna, un famoso filosofo e scienziato persiano, offrì una critica sistematica alla teoria galenica sull'occhio e pur mantenendo fede ai risultati degli studi anatomici di Galeno sui nervi cavi e le lenti cristalline, ad un certo punto iniziò ad esprimere alcune perplessità sulla teoria emissionista, avvicinandosi gradualmente al concetto dell'intromissione della luce negli occhi.
All'inizio del X secolo, il grande clinico di Baghdad, Al-Razi (Rhazes), notò la contrazione e la dilatazione della pupilla, un secolo dopo, Al-Haythan (Alhazen) annotò nel suo "Book of Optics" che l'occhio era ferito da una forte luce ed entrambi gli studiosi cominciarono a pensare che era la luce a colpire l'occhio e non viceversa. La letteratura islamica fu tradotta dall'arabo in latino nel periodo tra l'undicesimo e il tredicesimo secolo, di conseguenza i medici europei medievali ebbero molto su cui discutere e approfondire.
Gli anatomisti del Rinascimento studiarono molto l'anatomia dell'occhio e Leonardo da Vinci, per esempio, trasformò sostanzialmente la sua teoria della visione, avendo sostenuto prima la teoria emissionista ma avvicinandosi poi alla teoria intromissionista.
La teoria intromissionista
La teoria dell'intromissione fu proposta già da Democrito, vissuto in Grecia a cavallo tra il IV ed il III secolo aC, poi da Lucrezio (I sec. aC), per essere infine concretizzata dallo studioso arabo Alhazen, vissuto attorno all'anno mille. La teoria intromissionista suggerisce che la visione è il risultato di vari tipi di sostanze che viaggiano negli occhi, senza che nulla ne esca. Nel Rinascimento i progressi tecnologici apportarono importanti nuovi contributi che permisero il progressivo affermarsi della teoria intromissionista.
Ad esempio ebbero un ruolo importante lo sviluppo della prospettiva lineare nella pittura, la migliore comprensione dell'anatomia dell'occhio, il riconoscimento della forma reale della lente, lo studio e la realizzazione della camera oscura ed infine lo studio delle lenti per occhiali. Tutti questi progressi fornirono gli ingredienti essenziali per la teoria delle immagini retiniche di Keplero, pubblicata nel 1604.
È a questo punto che i sostenitori della teoria emissionista pongono il problema di come mai non vediamo tutto invertito e capovolto se l'occhio si comporta come una camera oscura e questa incapacità di spiegare la percezione da allora ha perseguitato la scienza. I sostenitori della teoria dell'intromissione cominciarono a sostenere che tutte le immagini, reali e virtuali, finiscono in qualche modo per realizzarsi all'interno del cervello.
Combinazione della teoria emissionista e intromissionista
Nel suo studio sullo sviluppo intellettuale dei bambini, Piaget (1896-1980), ha scoperto che la maggioranza dei bambini di età fra 10 e 11 anni, pensano che la vista coinvolge un'influenza che si sposta dagli occhi verso l'esterno. L'ottanta per cento dei bambini di età fra 8 e 9 anni, concorda che la visione comporta il movimento, sia verso l'interno che verso l'esterno, di raggi, energia o qualcos'altro di indefinibile.
Nella stessa fascia d'età, il 75% ha affermato di poter percepire gli sguardi degli altri e il 38% ha dichiarato di poter percepire lo sguardo degli animali. Tutto ciò comporta una correlazione significativa tra la credenza delle persone adulte nella capacità di sentire gli sguardi e la loro convinzione che qualcosa vada fuori dagli occhi quando le persone guardano.
La credenza nella capacità di percepire lo sguardo degli altri aumenta con l'età, con il 92% dei bambini più grandi e degli adulti che sono convinti di sentirsi osservati, anche se non vedono la persona che li sta guardando. La credenza nella capacità di sentire gli sguardi, che si verifica ad un livello elevato tra i bambini e gli adulti, sembra aumentare con l'età.
L'approccio computazionale
La visione ha sconcertato scienziati e filosofi per secoli e continua a farlo. Secondo gli studiosi della teoria computazionale, l'uomo deve considerarsi un elaboratore di informazioni, per cui la conoscenza e la comprensione, intese in senso lato, sono una serie complessa di processi che portano alla costruzione delle varie rappresentazioni della realtà. Anche i processi visivi che portano alla realizzazione completa della visione sono complicatissimi.
David Marr, uno psicologo inglese, individua, per la realizzazione totale del processo visivo, il completamento da parte dell'uomo di processi basati in successione su tre livelli, denominati computazionale, algoritmico e implementativo. Ha dimostrato inoltre che anche un processo computazionale di basso livello, come la percezione visiva, sia in realtà assai complesso.
La visione è quindi un sistema cognitivo, organizzato in sottosistemi, definita come una scatola nera che riceve in ingresso (input), una coppia di immagini retiniche e produce in uscita (output), una descrizione degli oggetti contenuti in tale immagine e i sottosistemi in questo caso potrebbero essere la percezione del colore, il rilevamento delle dimensioni, il riconoscimento del tipo di superficie e così via.
Teorie della visione: conclusioni
Alla luce dei risultati delle più recenti ricerche, il processo legato alla visione risulterebbe quindi alquanto complesso. Se si accetta la tesi legata all'approccio computazionale, per risolvere completamente il processo legato alla visione occorre accettare anche l'approccio algoritmico e quello implementativo.
La comprensione della teoria a livello algoritmico è compito proprio dello psicologo, mentre a livello implementativo si tratta di correlare le descrizioni e le rappresentazioni risultate dai livelli precedenti con i dati disponibili sulla biologia del cervello e sul funzionamento dei meccanismi neurofisiologici.
Per la comprensione completa del processo visivo sarebbe necessario quindi l'intervento coordinato e collaborativo della filosofia, della psicologia, dell'informatica e delle neuroscienze.