La start-up Kneron, spécialisée dans les puces d'IA, a annoncé aujourd'hui (26 novembre) sa nouvelle génération de puces d'IA, dont le modèle phare KL1140. Son fondateur et PDG, le Dr Jun-Cheng Liu, a dévoilé la feuille de route complète des produits de l'entreprise pour les trois prochaines années, signifiant ainsi que Kneron a officiellement finalisé son déploiement complet de puissance de calcul, du bas de gamme au haut de gamme, et a annoncé son évolution d'un simple fournisseur de puces à une entreprise d'infrastructure d'IA complète.
KL1140 : Le terminal exécute pleinement l’architecture Mamba, brisant ainsi les dépendances au cloud.
Le nouveau fleuron de la gamme, le KL1140, est présenté comme le premier appareil au monde capable d'exécuter intégralement l'architecture de réseau neuronal Mamba sur des terminaux.NoteL'architecture Mamba est une puce d'IA périphérique qui a récemment suscité un vif intérêt dans le domaine de l'IA et est considérée comme une étoile montante capable de rivaliser avec l'architecture Transformer.
Kneron souligne que le KL1140 offre une efficacité énergétique trois fois supérieure à celle des solutions cloud existantes, tout en réduisant les coûts d'un facteur dix. En connectant quatre KL1140 en parallèle, il est possible de prendre en charge le fonctionnement de grands modèles de langage (LLM) comportant jusqu'à 120 milliards de paramètres, tout en consommant seulement un tiers de l'énergie des GPU traditionnels. Ainsi, les grands modèles de langage n'auront plus besoin de recourir à des GPU cloud coûteux et à forte latence et pourront être pleinement intégrés aux terminaux intelligents.
Noter:L'architecture de réseau neuronal Mamba, proposée et développée par des chercheurs des universités Carnegie Mellon et Princeton, est une architecture d'apprentissage profond basée sur le modèle S4 (Structured State Space Sequence) pour les tâches de modélisation de séquences. Elle permet de pallier les limitations de l'architecture Transformer, actuellement utilisée pour la plupart des opérations d'IA, notamment pour le traitement des longues séquences. Elle peut gérer des données échantillonnées irrégulièrement et des contextes longs, tout en maintenant une efficacité de calcul optimale lors de l'entraînement et de l'inférence.
Plan directeur triennal dévoilé : couvrant la sécurité, la vision générale et l’IA générale
Lors de cette réunion, le Dr Liu Juncheng a également dévoilé pour la première fois le plan de Kneron en matière de puces pour les trois prochaines années, couvrant une gamme complète de produits allant du haut de gamme au bas de gamme :
• Sécurité basse consommation (KL640 / KL650) :Il est doté d'une fonction de fonctionnement permanent et cible les applications de vidéosurveillance et les scénarios de faible consommation d'énergie.
• Systèmes de vision polyvalents haute performance et économiques (KL540 / KL515) :Ciblage des périphériques courants tels que les caméras IP et les systèmes de vision industrielle.
• IA dédiée de nouvelle génération (KL840 / KL1150) :Conçu pour les appareils intelligents haut de gamme, l'automobile et les serveurs périphériques d'entreprise, il offre une puissance de calcul et une connectivité supérieures.
Le serveur périphérique KNEO 350 et la plateforme KNEO Pi ont été dévoilés.
Outre la puce elle-même, Kneron a également présenté son écosystème complet, comprenant le serveur d'IA de nouvelle génération KNEO 350 et la plateforme de développement KNEO Pi, qui compte 28 000 développeurs dans le monde entier.
Kneron souligne que les modèles de calcul d'IA actuels sont confrontés à des coûts élevés, une forte consommation d'énergie et des risques pour la confidentialité des données. Grâce au KL1140 et à sa nouvelle gamme de puces, Kneron entend promouvoir sa vision d'un avenir où les données sensibles résident à la périphérie du réseau, permettant ainsi à des applications telles que les robots de sécurité intelligents, les systèmes embarqués et les assistants IA privés d'entreprise de fonctionner en temps réel sans dépendre du cloud, garantissant ainsi la confidentialité des données sensibles.
Kneron a déjà noué des partenariats avec des entreprises internationales telles que Qualcomm, Hanwha, Toyota, Quanta et Sony, et a déployé ses solutions dans des projets d'IA souveraine dans les secteurs de la santé, de l'éducation et au sein d'agences gouvernementales.
