Actualité Alibaba lance une puce IA à haute performance spécialisée dans l’accélération des...

Pour approfondir le sujet

Pluribus, l’IA développée par l’Université Carnegie Mellon et Facebook devient la 1re à battre l’homme au Hold’em no-limit à six joueurs

Pluribus, un bot IA développé par des chercheurs de l'Université Carnegie Mellon et de Facebook, est parvenu à battre des joueurs professionnels de haut niveau...

Un modèle deep learning d’Alibaba fait ses preuves dans le Global Machine Understanding Test

Alibaba Group a annoncé ce jour que l'Alibaba DAMO Academy Language Technology Lab, avait obtenu un excellent résultat dans le test de compréhension en...

Atos et Google Cloud présentent leur laboratoire d’intelligence artificielle nord-américain

Atos et Google Cloud inaugurent aujourd’hui le laboratoire d’intelligence artificielle de Google Cloud au siège texan d’Atos. Ce nouveau centre de recherche s'inscrit dans...

Appel à projets synchronisé 2020 EURIPIDES²-PENTA sur l’intégration des systèmes intelligents

Le 5e appel à projets PENTA a été ouvert le 19 novembre dernier. PENTA et EURIPIDES² invitent les industriels à formuler des propositions dans...

Alibaba lance une puce IA à haute performance spécialisée dans l’accélération des tâches de machine learning

Dans le cadre de la conférence annuelle d’Alibaba Cloud Apsara Computing qui se tient actuellement à Hangzhou en Chine, Alibaba a annoncé le lancement d’une puce IA pour améliorer la puissance du Cloud Computing. Baptisée Hanguang 800, cette unité de traitement neuronal est destinée à améliorer les performances des solutions de recherche, de recommandation ainsi que les services à la clientèle pour le retail.

Alibaba Group vient de présenter sa première puce d’inférence IA développée par T-Head dans le cadre de l’initiative Alibaba DAMO Academy, qui porte les activités de développement technologique et de recherche scientifique du groupe. La puce d’inférence IA à haute performance, une NPU nommée Hanguang 800, spécialisée dans l’accélération des tâches de machine learning, a été annoncée lors de la conférence annuelle Apsara Computing d’Alibaba Cloud qui se tient du 25 au 27 septembre.

La Hanguang 800 est actuellement utilisée en interne pour les opérations commerciales d’Alibaba, notamment dans la recherche de produits et la traduction automatique pour ses sites e-commerce, les recommandations personnalisées, la publicité et les services clients intelligents. Ces domaines nécessitent une puissance de calcul considérable en matière d’intelligence artificielle afin d’optimiser l’expérience d’achat.

« Le lancement de Hanguang 800 est une étape importante dans notre quête de technologies de nouvelle génération. Elle améliore les capacités de calcul qui stimuleront nos activités actuelles et émergentes tout en augmentant l’efficacité énergétique », a déclaré Jeff Zhang, Directeur Technique du Groupe Alibaba et Président d’Alibaba Cloud Intelligence.

« Dans un avenir proche, nous prévoyons de donner à nos clients les moyens d’accéder à de l’informatique avancée, grâce à cette puce, à tout moment et en tout lieu, par l’intermédiaire de notre activité cloud. »

L’un des principaux objectifs d’Alibaba Cloud est d’offrir une infrastructure technologique de pointe qui profite aux entreprises de toutes tailles et bouche les lacunes existantes en matière d’accès à la technologie, pour finalement rendre le monde plus inclusif.

Portée par une architecture matérielle développée en interne, et des algorithmes hautement optimisés et adaptés à des applications métiers telles que le retail et la logistique, la puce Hanguang 800 a enregistré des performances remarquables dans les tests. La performance de calcul sur une seule puce a atteint 78 563 IPS au moment du pic, tandis que les scores des tests d’efficience Restnet-50 Inference étaient de 500 IPS/W. Les deux scores de performance sont largement supérieurs à la moyenne de l’industrie, mettant en lumière un équilibre remarquable entre des capacités de calcul élevées et une grande efficience.

Par exemple, environ un milliard d’images de produits sont téléchargées chaque jour sur Taobao, le site e-commerce d’Alibaba, pour les commerçants. Auparavant, il fallait une heure à la machine pour catégoriser un si grand volume d’images, puis adapter la recherche et les recommandations personnalisées pour des centaines de millions de consommateurs. Avec Hanguang 800, il ne faut plus que 5 minutes à la même machine pour accomplir la même tâche.

L’unité de recherche d’Alibaba, T-Head — dont le nom chinois est « Pintouge », qui signifie « Ratel » — se veut à la pointe de l’innovation en matière de puces pour le cloud computing et le edge computing. T-Head est également responsable de la mise en place d’un écosystème informatique de pointe inclusif en collaborant avec des partenaires mondiaux de l’industrie de la carte à puce.

Plus tôt cette année, T-Head avait lancé la XuanTie 910, un processeur IoT haute performance basé sur RISC-V, un jeu d’instructions open source (ISA). XuanTie 910 a été conçu pour servir les applications IoT à haut rendement qui nécessitent des capacités de calcul élevées, telles que l’intelligence artificielle, la mise en réseau, les passerelles, les automobiles autonomes et les serveurs embarqués. Les développeurs du monde entier ont pu accéder avec succès à certains codes des processeurs hautes performances et utiliser cette technologie pour développer des prototypes pour leurs propres puces.

 

Pour en savoir plus sur les différents types de puces, n’hésitez pas à retrouver l’article “L’avenir de l’intelligence artificielle passe par la lumière” que nous avons consacré à la technologie d’OPU de LightOn

Transcription : comment Bertin IT accompagne Crédit Agricole CIB pour renforcer la conformité de ses salles de marché

Des solutions de traitement automatique du langage sont actuellement utilisées dans de nombreux secteurs dont le trading. C'est notamment le cas de MediaSpeech® de...

Appel à contributions pour la CAID (Conference on Artificial Intelligence for Defense) qui se tiendra à Rennes

Dans le cadre de la cinquième European Cyber Week et de la 26e conférence C&ESAR, se tiendra la deuxième conférence CAID (Conference on Artificial...

Recherche médicale : Owkin clôture sa série A avec un total de 70 millions de dollars levés

La start-up Owkin a annoncé clôturer sa série A avec un total de 70 millions de dollars levés. Cette levée de fond se conclut...

Nouvelle-Aquitaine : SATT Aquitaine Science Transfert lance chrysa-link, son incubateur deep-tech

La SATT Aquitaine Science Transfert a officiellement lancé chrysa-link, son incubateur deep tech. En activité depuis l'an dernier, il est opéré par Bpifrance et...