Vision par ordinateur et Intelligence Artificielle (IA)

Bien que le processus d'apprentissage de «voir» comme un humain soit compliqué, il permet finalement aux ordinateurs d'analyser des milliers d'objets différents par minute, à une vitesse bien plus rapide que tout humain ne pourrait atteindre.

Jul 3, 2023

6 min de lecture

La vision par ordinateur est une sous-discipline de l'intelligence artificielle (IA) qui consiste à capturer et traiter des informations à partir d'images et de vidéos. Un autre composant clé de la vision par ordinateur est qu'elle permet aux systèmes informatiques et à l'IA de prendre des mesures en fonction des informations recueillies. Comme l'IA de manière plus générale, la vision par ordinateur vise à donner aux ordinateurs une capacité semblable à celle des humains : dans ce cas, la capacité de voir et de traiter des images de toutes sortes.

Principes de la vision par ordinateur

Les êtres humains ne se rendent peut-être pas compte du nombre de processus différents nécessaires pour traiter les informations visuelles par le sens de la vue. La vue humaine peut rapidement déterminer où commence un objet et où se termine un autre, si les objets sont en mouvement, comment distinguer différents objets, et bien plus encore.

Les ordinateurs peuvent être formés à faire la même chose en utilisant des caméras, des algorithmes et de vastes ensembles de données. La vision par ordinateur repose généralement sur des processus d'IA de réseaux neuronaux ou d'apprentissage automatique, dans lesquels un système d'IA évalue une quantité massive de données pour «apprendre» à les interpréter et à effectuer diverses tâches. Heureusement pour la vision par ordinateur, bien que le processus d'apprentissage de «voir» comme un humain soit compliqué, il permet finalement aux ordinateurs d'analyser des milliers d'objets différents par minute, à une vitesse bien plus rapide que tout humain ne pourrait le faire.

Comment fonctionne la vision par ordinateur

Comme d'autres processus d'apprentissage automatique, les systèmes de vision par ordinateur s'entraînent en analysant de vastes ensembles de données jusqu'à ce qu'ils apprennent à identifier et à reconnaître des images. Une partie importante du processus d'apprentissage automatique utilisé pour identifier ces informations et apprendre des données est que les algorithmes guident l'ordinateur : il n'est pas nécessaire qu'un programmeur l'aide à reconnaître une image, au-delà de la définition des paramètres initiaux.

Un type spécial de système d'IA appelé réseau neuronal convolutif (CNN) peut également être utilisé en vision par ordinateur. Les CNN aident les programmes d'IA dans le processus d'apprentissage en étiquetant les pixels individuels dans les images, ce qui aide les programmes à prédire plus précisément ce que représente l'image complète. C'est un processus d'essais et d'erreurs qui se répète encore et encore jusqu'à ce que le système commence à affiner sa capacité à faire des prédictions.

Applications de la vision par ordinateur

La technologie moderne offre de nombreuses façons un laboratoire idéal pour les programmes de vision par ordinateur. Les smartphones, les caméras de circulation, les systèmes de sécurité et de nombreux autres dispositifs technologiques courants génèrent d'énormes quantités de données visuelles. Le traitement de ces données prendrait beaucoup plus de temps et d'efforts que toute équipe humaine ne pourrait jamais consacrer à la tâche. C'est l'une des façons dont la vision par ordinateur pourrait être appliquée.

Pour l'instant, les applications de vision par ordinateur se retrouvent dans de nombreux produits, fonctionnalités et services. Le service de traduction de Google permet par exemple de pointer la caméra d'un smartphone sur des mots imprimés dans une langue et de créer presque instantanément une traduction en temps réel du texte dans une autre langue. Les véhicules autonomes utilisent des systèmes de vision par ordinateur pour traiter les données générées par les caméras et les capteurs des voitures. Les smartphones peuvent reconnaître votre visage pour vous permettre de déverrouiller automatiquement votre téléphone, et les filtres peuvent instantanément améliorer les images et les vidéos en ajoutant des couches ou des effets visuels. Dans les domaines médical et manufacturier, la vision par ordinateur peut aider à identifier les symptômes de maladies ou les produits défectueux en traitant des images. Amazon utilise la vision par ordinateur dans ses magasins Go Grocery sans caissiers. Et la vision par ordinateur peut permettre aux algorithmes de repérer et de supprimer du contenu inapproprié sur les médias sociaux et d'autres sites générés par les utilisateurs.

L'avenir de la vision par ordinateur

Certaines des applications répertoriées ci-dessus offrent une commodité ou ajoutent même un peu de plaisir à un appareil préexistant. Mais certains experts estiment que les applications pratiques et transformationnelles de la vision par ordinateur ne font que commencer à être découvertes. Un rapport de Shutterstock, par exemple, estime que le marché de la vision par ordinateur a augmenté de près de 8 fois entre 2015 et 2022, pour atteindre 48,6 milliards de dollars. Les analystes de McKinsey estiment que les programmes de parole, d'écriture ou de vision par ordinateur basés sur l'IA augmenteront plus de la moitié de toutes les interactions utilisateur d'ici 2024.

Avec une prolifération considérable des systèmes de vision par ordinateur susceptible de se poursuivre, un aspect crucial de l'IA deviendra probablement de plus en plus important : les responsabilités éthiques de ces systèmes et de leurs créateurs. Les systèmes de vision par ordinateur sont déjà largement utilisés dans divers outils de reconnaissance faciale, par exemple. Certains de ces outils pourraient être utilisés à des fins de surveillance, constituant une atteinte à la vie privée et pourraient éventuellement être utilisés pour contrôler le comportement humain. Il s'agit là d'une préoccupation parmi de nombreuses autres que soulève une technologie puissante comme la vision par ordinateur.

Fiche de triche

La vision par ordinateur est une sous-discipline de l'intelligence artificielle (IA) qui forme les ordinateurs à analyser et interpréter les données visuelles de manière similaire aux êtres humains.
Les systèmes de vision par ordinateur utilisent des réseaux neuronaux et des processus d'apprentissage automatique pour évaluer de vastes ensembles de données et apprendre à reconnaître des objets, à détecter les mouvements d'objets, et plus encore.
Certaines des applications de la vision par ordinateur comprennent les fonctionnalités de sécurité des smartphones, les services de traduction, les outils de reconnaissance faciale, les diagnostics médicaux, le contrôle qualité dans la fabrication, et bien plus encore.
Le marché de la vision par ordinateur est estimé avoir augmenté d'environ 8 fois entre 2015 et 2022, pour atteindre environ 48,6 milliards de dollars.
Les problèmes de confidentialité, d'éthique et de responsabilité continuent d'impact le secteur de la vision par ordinateur.

Stay on top of crypto news, get daily updates in your inbox.

🎉 Congratulations!

This article is part of the Commencer avec l'IA Course.
Start the course to track your progress and earn your on-chain certificate!

Start Course

Coin Prices