Entrer au cœur de la machine et comprendre son raisonnement, ce qu’elle analyse et ce qu’elle voit ? Cet objectif surprenant (et un peu terrifiant) est le pari de deux étudiants de l’Université de New York. Ils ont injecté une intelligence artificielle au sein d’une caméra de vidéosurveillance, lui ont donné la parole et ont écouté ce qu’elle avait à nous raconter sur ses captures d’images.
L’intelligence artificielle appliquée à la vidéosurveillance est un marché en développement. Plusieurs entreprises explorent les possibilités de l’IA et du Big Data pour améliorer les services de police et de surveillance de la population. Dans ce contexte, deux étudiants en Master de l’Université de New York, Ross Goodwin et Gene Han, ont décidé de concevoir une caméra de vidéosurveillance intelligente et… Dotée de la parole ! Ces recherches visent à mieux comprendre ce que l’intelligence artificielle « voit » et dans quelle optique les services de police pourront exploiter ses « observations ».
Dans une interview donnée au magazine Motherboard, Ross Goodwin a précisé vouloir augmenter « l’omniprésence des équipements de surveillance » et leur efficacité grâce aux progrès de l’intelligence artificielle.
Une caméra qui réfléchit et qui parle
« Nous voulons créer une entité avec sa propre intelligence sociale, ses propres yeux, une capacité à communiquer avec les hommes, malgré la présence persistante de quelques dysfonctionnements du fait des limitations des technologies actuelles. », précisait Ross Goodwin lors de son interview.
La caméra a donc été reliée à la fonction Text-to-Speech, outil de synthèse vocale développée par Apple. Elle s’est munie d’une intelligence artificielle en deep learning, adaptée à la détection des visages et des objets (technique du Haar Cascade de détection faciale). Avec le deep learning, les algorithmes de l’IA sont structurés en différentes couches, chacune disposant de milliers d’unités capables de réaliser de petits calculs servant d’entrée pour la couche de calculs suivants. Cette méthode permet à l’IA d’approfondir son raisonnement et de se perfectionner au fur et à mesure de ses observations.
Un test en temps réel à Brooklyn
La caméra a alors été installée à Brooklyn (New York) et plusieurs participants ont été réquisitionnés pour se promener devant elle. L’expérience a commencé de but en blanc, la caméra a capturé des images et s’est exprimée à l’oral, en temps réel.
Concrètement, la caméra de surveillance zoome sur un visage puis envoie l’image, et du visage et de son environnement, au serveur central. La méthode du deep learning et la technique de reconnaissance faciale permettent alors d’identifier la personne et éventuellement de déduire les raisons de sa présence et/ou de son comportement dans son environnement (qui est-elle, que fait-elle).
Durant le test, la caméra s’est donc mise en action et s’est exprimée à l’aide de la fonction Text-to-Speech d’Apple, mais ses paroles débitées en discontinu étaient plutôt confuses et difficilement exploitables. Néanmoins, quelques informations pour le moins surprenantes sont ressorties de ce charabia irréel. La caméra a ainsi reconnu une femme comme une voyageuse (elle venait effectivement de Londres) et une autre comme ayant un lien avec l’enseignement supérieur (elle venait d’être titulaire d’un diplôme universitaire).
L’intelligence artificielle en état de surveillance permanent
Ross Goodwin a précisé que la caméra de surveillance, rotative et panoramique, est en état de surveillance permanent, à l’affut de visages à scanner.
Apparemment, lors du test, certaines personnes se sont vues agréablement surprises des informations que la caméra intelligente était capable de connaître à leur propos alors que d’autres participants ont été horrifiés de ses facultés.
Même si le test n’est pas concluant aujourd’hui, les recherches en la matière avancent à grands pas. Demain, ce sera une machine qui nous scrutera, nous connaîtra et analysera le moindre de nos faits et gestes. Big Brother arrive !
Commentaires récents