Entre les caméras qui ajustent l’approche avant de tirer, les participants qui réagissent même s’il n’y a pas de connexion et d’appels vidéo où le bruit de fond disparaît par la magie, l’intelligence artificielle dans les mobiles n’est plus quelque chose de l’avenir. C’est une réalité de plus en plus présente et une grande partie de cette fluidité provient de ce qui se passe dans la puce. C’est là que Arm joue un rôle cléet sa dernière avance technique a beaucoup à dire: SME2.
L’idée? Porter Des charges de travail plus complexes directement sur le CPU mobilesans dépendre du nuage ou compliquer la vie des développeurs. SME2, qui sont l’acronyme pour Extension de matrice évolutive 2C’est un Évolution de la norme antérieure (PME) dans l’architecture ARMV9. Il s’agit d’un ensemble d’instructions qui vous permet d’exécuter des tâches telles que la vision de l’ordinateur, le traitement du langage ou la génération de voix en temps réel, sans laisser les limites de puissance, de température ou de batterie d’un smartphone.
Plus rapide, sans modifications dans votre application
L’un des avantages les plus puissants de la PME2 est que les développeurs n’ont rien à faire pour en profiter. Littéralement. Ne réécrivez pas les modèles, ni optimisez le code, ni n’adaptez rien. C’est grâce à Kleidiai, la couche d’accélération du bras qui est intégrée aux principaux cadres IA Ils sont déjà utilisés aujourd’hui: XNNPACK de Google, Medioppe, ONNX Runtime, Mnn de Alibaba, Linet … La liste est longue.
Lorsque la SME2 est disponible sur l’appareil, Kleidiai est en charge de détourner automatiquement les opérations les plus lourdes à travers ces extensionssans que le développeur ait à bouger un doigt. Le meilleur: cette intégration ne sert pas seulement le présent, mais elle est également destinée à l’avenir. Comme ARM intègre des améliorations, Kleidiai s’appliquera automatiquement aux applications déjà bien intégrées.
Ce qui peut déjà être fait (et ce qui va arriver)
SME2 donne déjà des résultats. Dans les appareils iOS compatibles et sur Android qui incluront bientôt cette technologie, les avantages sont remarqués. Par exemple, le Gemma Modèle 3 Google, en cours d’exécution sur le matériel avec SME2, est en mesure de générer des réponses dans des chats jusqu’à six fois plus rapidement. 800 mots résumés de texte? Prêt en moins d’une seconde, sans quitter le mobile. Et ceci avec seulement un core CPU fonctionnant.
Grâce à ce saut, certains développeurs commencent déjà à déplacer certaines fonctions qui nécessitaient auparavant le nuage directement au téléphone. Cela signifie moins de latence, plus d’intimité et une expérience beaucoup plus fluide pour l’utilisateur. Autrement dit: L’IA cesse d’être un ajout au mobile pour faire partie du cœur du système.
Avec plus de neuf millions d’applications construites sur ARM et plus de 22 millions de développeurs travaillant sur cette architecture, Les possibilités de SME2 à grimper sont énormes. Et le message d’ARM aux développeurs est clair: si vous utilisez déjà des cadres Kleidiai, préparez-vous, car vous remarquerez l’amélioration sans déplacer un doigt.
La prochaine étape? Ces dispositifs matériels compatibles se multiplient et que les applications commencent à serrer cette puissance. La bonne chose est que, cette fois, l’optimisation est standard.