Le circuit d’IA le plus paresseux s’approche du volume

MONDE EMBARQUÉ Vous n’avez pas à répéter le même calcul si les données d’entrée sont les mêmes que la dernière fois. Grâce à cette idée simple, un circuit de réseau de neurones du français GML permet d’économiser de l’énergie dans la surveillance par caméra.

Il est théoriquement évident qu’il est possible d’économiser des ressources en ne répétant pas le même calcul. En pratique, cependant, il arrive souvent que la vérification de l’égalité des valeurs prenne à peu près autant de temps que le calcul – et encore moins le même !

Mais disons qu’il s’agit d’une caméra vidéo fixe filmant une ferme vide la nuit. Avec la détection d’objets IA, les calculs sont étendus. A travers un réseau de coefficients, une avalanche de calculs se produit.

Par conséquent, les circuits du réseau neuronal de GML n’effectuent des calculs que sur les pixels qui ont changé.

La surveillance par caméra – où rien ne se passe dans le cadre – est un exemple clair de là où la stratégie peut porter ses fruits. Mais selon GML, le circuit devrait également être utilisé pour des flux vidéo plus dynamiques, par exemple pour transformer un drone en robot de suivi de cible.

Le circuit a reçu un prix dans la catégorie Embedded Vision lors du Embedded World 2022.

GML (Laboratoires de matière grise) est une entreprise française issue de l’Université de la Sorbonne en France en 2016. Le fondateur n’est plus employé mais est consulté en cas de besoin.

Il existe un type de capteur qui est tout aussi paresseux que ce circuit d’IA, à savoir les caméras événementielles. Un tel registre ne fait que mettre à jour les pixels. Fait intéressant, la direction de GML comprend deux personnes du fabricant suisse de caméras événementielles Prophesee. Peut-être est-il possible de combiner la Lazy Camera avec le Lazy Neural Network ?

Les systèmes nerveux biologiques sont uniquement destinés à réagir aux changements, de sorte que les circuits d’IA et la caméra d’événement sont appelés « neuromorphes ».

Le premier prototype de la puce de GML a été fabriqué en 2020. Au printemps dernier, la première version en volume, Grai VIP, a été annoncée. Il mesure 8×8 mm et est fabriqué en 12 nm.

La reconnaissance d’image étant l’application principale, la puce a été équipée de pas moins de deux interfaces caméra Mipi.

L’architecture extrait le gain de temps sous la forme d’une latence réduite. GML invoque ses propres tests pour aider. Une mesure sur la puce prototype Grai-One aurait dû réduire les délais de fonctionnement du réseau neuronal de Pilotnet de 40 à 2 millisecondes.

Avec la nouvelle puce Grai VPI, une inférence dans le réseau Resnet 50 doit être réalisée en quelques millisecondes.

Une faible latence donne un temps de réponse rapide, ce qui peut faire toute la différence pour faire fonctionner un robot.

Des circuits d’IA plus puissants pourraient être en mesure de fournir la même latence, mais l’alimentation électrique limite plutôt la taille à laquelle vous pouvez construire un drone volant rapidement, par exemple.

Le concept a des conséquences sur l’architecture. Il doit y avoir une mémoire locale sur la puce pour mémoriser le tableau précédent de pixels d’entrée.

De plus, GML a appris au fil du temps que les calculs doivent être effectués en nombres à virgule flottante 16 bits afin de pouvoir reconnaître les changements dans les données d’entrée.

L’inconvénient est que le 16 bits augmente les besoins en mémoire et en calcul, tandis que les circuits concurrents à faible consommation utilisent souvent des entiers de huit bits dans leurs réseaux.

Mais il y a aussi des avantages. La formation réseau a lieu en 32 bits, et s’il est nécessaire de réduire la précision par la suite pour économiser des ressources, il est plus difficile et prend plus de temps de développement de passer à la version 8 bits. Il ne s’agit pas seulement de rayer des nombres de valeurs, il s’agit de vérifier que le réseau dépouillé est raisonnablement égal au réseau formé.

Avec 16 bits, il devient également plus facile de faire d’autres optimisations, telles que B. compresser le réseau – couper les branches qui ne font pas de différence et réduire la précision localement dans le réseau formé – jusqu’à quatre bits.

La compression peut réduire 90 % du réseau. GML prétend avoir des applications où les 16 bits pointus se révèlent être la clé pour obtenir des performances en temps réel.

Sur les 50 employés, une vingtaine sont des développeurs de logiciels en France et le même nombre sont des développeurs de matériel aux Pays-Bas. Certains de ces derniers viennent d’horizons Intel.

GML a reçu des investissements de 55 millions d’euros.






Après avoir rencontré GML à Embedded World en juin, GML a effectué des benchmarks.

L’exécution d’un réseau de neurones pour l’interprétation d’images dans des robots mobiles (MobileNet v1–SSD) à 30 images par seconde coûte 184 mW. Selon GML, c’est 20x plus efficace que dans un GPU, qui est la solution standard aujourd’hui en attendant plus de circuits personnalisés.

En août, Grai VIP a totalisé 1 million de dollars en précommandes pour la puce. Au moins deux constructeurs automobiles font partie de ceux qui évaluent la puce






La puce Grai VIP contient 144 cœurs dans un réseau, deux processeurs Cortex-M7 équipés de DSP et 36 Mo de mémoire contenant 48 millions de poids.

Un kit de développement avec un module caméra, une carte Smarc et une carte M.2 avec circuit VIP peut être commandé.

Les partenaires ADLink, Framos et ERM développent du matériel pour le circuit. Framos dispose d’une plateforme de vision par ordinateur à usage industriel autour de sa caméra de profondeur D435e. Adlink branche la carte M.2 sur sa carte Smarc I-Pi. Et ERM ajoute un bras robotique à un programme de formation.

Stéphanie Reyer

"Écrivain. Érudit total du café. Amoureux des voyages. Penseur. Troublemaker. Praticien du bacon hardcore."

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *