Le numéro de juillet 2021 de Journal IEEE/CAA d’Automatica Sinica présente six articles qui présentent le potentiel de l’apprentissage automatique sous ses diverses formes. Les applications décrites dans les études vont des systèmes avancés d’aide à la conduite et de la vision par ordinateur au traitement d’images et à la robotique collaborative.
Crédit d’image : IEEE/CAA Journal of Automatica Sinica
L’automatisation de la technologie a remodelé à la fois notre façon de travailler et notre façon d’aborder les problèmes. Grâce aux progrès de la robotique et de l’intelligence artificielle (IA) ces dernières années, il est désormais possible de laisser plusieurs tâches entre les mains des machines et des algorithmes.
Pour souligner ces avancées, l’IEEE et la Chinese Association of Automation (CAA) ont décidé d’unir leurs forces, dans le premier numéro de Journal IEEE/CAA d’Automatica Sinica. Cette revue fait partie des 7 % des meilleures en intelligence artificielle, ingénierie de contrôle/systèmes et systèmes d’information (classée par CiteScore), avec des articles de haute qualité sur tous les domaines de la science et de l’ingénierie de l’automatisation. Dans le numéro de juillet 2021, la revue présente six articles couvrant des applications innovantes de l’IA qui peuvent nous faciliter la vie.
Le premier article, rédigé par des chercheurs du Virginia Tech Mechanical Engineering Department ASIM Lab, États-Unis, explore un mélange intéressant de sujets : voitures intelligentes, apprentissage automatique et électroencéphalographie (EEG). Les voitures autonomes sont à l’honneur depuis un certain temps. Alors, comment l’EEG s’intègre-t-il dans cette image ?
Parfois, les conducteurs sont distraits ou fatigués sans s’en rendre compte, ce qui augmente le risque d’accident de la route. Heureusement, les voitures peuvent désormais être équipées de systèmes d’IA qui détectent et analysent les signaux EEG du conducteur pour surveiller en permanence leur état et émettre des avertissements lorsque cela est jugé nécessaire. Cet article passe en revue les dernières techniques d’estimation de l’état du conducteur basées sur l’EEG. Ils fournissent également des didacticiels détaillés sur les méthodes de décodage EEG et les modèles de réseaux neuronaux les plus populaires, aidant les chercheurs à se familiariser avec le domaine. Les auteurs expliquent : «En mettant en œuvre ces méthodes basées sur l’EEG, l’état des conducteurs peut être estimé plus précisément, améliorant ainsi la sécurité routière. «
Ensuite, une équipe de recherche de l’Université du Sichuan, en Chine, propose une nouvelle approche pour le sous-titrage des images, une tâche difficile pour les ordinateurs. Le problème est que même si les ordinateurs peuvent désormais reconnaître correctement les objets dans une image donnée, il est difficile de décrire la scène uniquement sur la base de ces objets. Pour y remédier, les chercheurs ont développé un réseau mondial basé sur l’attention pour estimer avec précision les probabilités d’une région donnée dans l’image d’être mentionnée dans la légende. Ceci a été réalisé en analysant les similitudes entre les caractéristiques visuelles locales et les caractéristiques de légende globale. À l’aide d’un module d’attention, le modèle peut s’occuper plus précisément des régions les plus importantes de l’image pour produire une bonne légende. Le sous-titrage automatique des images est un excellent outil pour indexer de grands ensembles de données d’images et aider les malvoyants.
Dans le troisième article, des scientifiques de l’Université Xidian, en Chine, tentent d’introduire la robotique collaborative dans le domaine de la surveillance à vue de dessus. Plus précisément, ils proposent un cadre détaillé dans lequel l’apprentissage profond est utilisé dans la vision par ordinateur en vue de dessus, contrairement à la plupart des études qui se concentrent sur les images en vue frontale. Ce cadre utilise une caméra robotique intelligente avec une unité de traitement visuel intégrée avec des algorithmes d’apprentissage en profondeur pour la détection et le suivi de plusieurs objets (tâches essentielles dans diverses applications, y compris la prévention du crime et l’analyse des foules et du comportement).
Dans le quatrième article, des chercheurs de l’Université de Guiling, en Chine, proposent une nouvelle approche pour produire des images en super-résolution basées sur des caractéristiques qu’un réseau de neurones peut extraire et utiliser. Leur méthode, appelée réseau résiduel multi-échelle pondéré, peut tirer parti des caractéristiques d’image globales et locales à différentes échelles pour reconstruire des images de haute qualité avec des performances de pointe. Les auteurs disent : «Les dispositifs d’imagerie actuels ne peuvent certainement pas fournir suffisamment de ressources informatiques, et nous avons donc conçu une architecture rapide et légère pour atténuer ce problème. «
Le cinquième article rédigé par des chercheurs de l’Université de Nouvelle-Galles du Sud, en Australie, couvre le sujet complexe de la transparence et de la confiance dans l’équipe homme-essaim. Selon les auteurs, l’explicabilité, l’interprétabilité et la prévisibilité sont des concepts distincts mais chevauchants de l’intelligence artificielle qui sont subordonnés à transparence. En puisant dans la littérature, ils ont proposé une architecture pour assurer une collaboration fiable entre les humains et les essaims de machines, dépassant le paradigme habituel maître-esclave. Les chercheurs concluent : «Les équipes d’essaims humains auront besoin de niveaux accrus de transparence avant de pouvoir commencer à tirer parti de l’opportunité que présentent ces systèmes. «
Ensuite, des scientifiques de l’Université des sciences et technologies électroniques de Chine présentent une autre utilisation des réseaux de neurones profonds dans le domaine de la vision par ordinateur, plus précisément dans la détection d’anomalies vidéo. Les modèles existants pour détecter automatiquement les anomalies dans les séquences vidéo tentent de prédire ou de reconstruire une image en fonction de l’entrée précédente et, en calculant l’erreur de reconstruction, déterminent si quelque chose semble déplacé. Le problème avec cette approche est que les images anormales sont parfois bien reconstruites, ce qui conduit à des faux négatifs. Les scientifiques se sont attaqués à ce problème en développant un réseau cognitif à mémoire augmentée qui imite la façon dont les humains se souviennent des échantillons normaux et utilise à la fois l’erreur de reconstruction et les scores de nouveauté calculés pour détecter les anomalies dans les vidéos. Avec des performances de pointe vérifiées, le réseau peut être facilement appliqué à des tâches de surveillance, telles que la surveillance des accidents et de la sécurité publique.
Nous sommes tous très susceptibles de voir bientôt l’intelligence artificielle devenir essentielle dans de nombreuses applications réelles. Alors, assurez-vous de suivre le rythme en consultant le numéro de juillet 2021 de Journal IEEE/CAA d’Automatica Sinica!