Sommaire
La nouvelle génération de Intel Xeon avait déjà été annoncé il y a quelques mois dans le Innovation Intel et, ce jeudi (14), Pat Gelsinger, PDG de l'entreprise, a présenté plus de détails sur le tout nouveau processeur lors du L'IA partout, un événement axé sur l'IA et comment Intel entend accélérer l’arrivée de ce nouveau monde. Ô Intel Xeon de 5e génération promet des améliorations plus rapides de la mémoire et des performances en mettant l'accent sur le suivi du rythme d'évolution de l'intelligence artificielle, en préparant les centres de données à recevoir et à traiter une énorme quantité de données, ouvrant ainsi la voie à une nouvelle ère d'expansion mondiale dans laquelle la puissance de calcul est encore plus grande important pour un avenir meilleur pour tous.
Quelle est l’importance du Data Center pour l’IA ?

Avant de voir les nouveaux impacts que le Intel Xeon de 5e génération peut apporter à les centres de données, il est important de comprendre la pertinence de ces lieux pour conduire l'évolution continue de intelligence artificielle (IA). Ces complexes de serveurs, souvent répartis dans le monde entier, jouent un rôle essentiel dans le stockage, le traitement et la gestion des énormes volumes de données nécessaires à la formation et à l'amélioration des algorithmes d'IA.
L’importance des centres de données pour l’IA est vitale. Premièrement, ils fournissent l’infrastructure nécessaire pour héberger de grandes quantités de données, depuis les ensembles de formation jusqu’aux données en temps réel. La capacité de stockage et l’efficacité de la récupération des données sont des aspects cruciaux pour garantir que les modèles d’intelligence artificielle disposent d’un accès rapide et efficace aux informations nécessaires pour prendre des décisions précises.
De plus, les centres de données sont extrêmement importants pour la formation de modèles d’IA complexes. Les algorithmes modernes tels que les réseaux neuronaux profonds nécessitent d’énormes quantités de puissance de calcul pour régler et optimiser des millions, voire des milliards de paramètres. Les centres de données, souvent équipés d'unités de traitement graphique (GPU) performantes, permettent d'exécuter ces calculs intensifs en parallèle, accélérant considérablement le processus de formation.
Actuellement, l’utilisation la plus importante des centres de données dans le monde de l’IA est leur mise en œuvre via le cloud computing – ou cloud computing -, permettant de traiter ces données à des vitesses absurdes, sans que l'utilisateur ou l'entreprise ait besoin de disposer de son propre serveur de données. Nous verrons ci-dessous comment les entreprises aiment Google ont implémenté la nouvelle puce Intel pour améliorer vos services cloud.
En tant que fabricants de processeurs tels que Intel, développent et améliorent leurs architectures, l'efficacité et la puissance de traitement des puces augmentent. Cela permet non seulement une exécution plus rapide des tâches d’IA, mais permet également le développement de modèles plus sophistiqués et complexes. La capacité de traitement améliorée de Intel Xeon de 5e génération est fondamental pour faire face aux exigences informatiques croissantes de l’intelligence artificielle.
L'impact d'Intel Xeon de 5e génération

O Intel Xeon 5e génération représente une avancée significative en termes de performances et d'efficacité pour les centres de données, les cloud, les réseaux et les environnements de périphérie. Ce nouveau processeur offre un gain de performances moyen de 21 % tout en conservant la même puissance thermique, ce qui se traduit par une augmentation impressionnante de 36 % des performances par watt. Pour les clients suivant un cycle de mise à niveau typique de cinq ans et passant d'anciennes générations, la réduction potentielle du coût total de possession (TCO) atteint jusqu'à 77 %.
Conçus pour l'IA, les processeurs Intel Xeon de 5e génération offrent de meilleures performances aux clients déployant des capacités d'IA dans le cloud, le réseau ou les appareils de périphérie. Grâce à notre travail de longue date avec les clients, les partenaires et l'écosystème des développeurs, nous lançons le processeur Intel Xeon de 5e génération sur une base solide et éprouvée qui permettra une adoption et une évolution rapides avec un coût total de possession réduit.
Sandra Rivera, vice-présidente exécutive d'Intel et directrice générale du groupe Data Centers and AI
L'un des temps forts de Intel Xeon de 5e génération est son intégration unique de l’accélération de l’intelligence artificielle (IA) directement dans le processeur. Cela se traduit par une capacité d'inférence et de réglage jusqu'à 42 % supérieure sur des modèles comportant jusqu'à 20 milliards de paramètres. Également Xeon est le seul processeur doté d'un ensemble de résultats de performances cohérents et en constante amélioration analyse comparative formation et inférence MLPerf, garantissant la fiabilité et l'efficacité dans Machine Learning.
Accélérateurs d'IA intégrés Xeon, combiné à des logiciels optimisés et à des capacités de télémétrie avancées, facilite les déploiements gérables et efficaces de charges de travail exigeantes dans divers secteurs. Cela inclut les fournisseurs de services de communication, les réseaux de diffusion de contenu et les marchés verticaux tels que la vente au détail, les soins de santé et l'industrie manufacturière.
Lors du lancement, le IBM a souligné que les processeurs Intel Xeon de 5e génération ont obtenu des performances de requête jusqu'à 2,7 fois supérieures sur leur plate-forme watsonx.data, par rapport aux processeurs Xeon de la génération précédente. Ô Google Cloud, qui prévoit de mettre en œuvre le Xeon de 5ème génération l'année prochaine, a rapporté que le Palo Alto Networks a doublé les performances de ses modèles d'apprentissage profond pour la détection des menaces grâce à l'accélération intégrée Xeon de 4ème génération à travers le Google Cloud.
De plus, le studio de jeux Studios Gallium a tiré parti de la plateforme d’IA de l’entreprise numenta, qui utilise des processeurs Xeon, ce qui permet d'obtenir une performance d'inférence multipliée par 6,5 sur une instance cloud basée sur GPU, ce qui entraîne une réduction des coûts et de la latence dans votre jeu. proximité Basé sur l'IA.
Basé sur les générations précédentes, le nouveau processeur apporte des innovations significatives en termes de performances et d'efficacité. Ces processeurs ont la capacité de fonctionner avec jusqu'à 64 cœurs par CPU, ce qui représente presque le triple du cache maximum de dernier niveau par rapport à la génération précédente. De plus, ils offrent huit canaux de DDR5 par processeur, prenant en charge la DDR5 avec des taux de transfert allant jusqu'à 5.600 2.0 mégatransferts par seconde (MT/s), et étendent la bande passante entre les sockets avec Intel UPI 20, fournissant jusqu'à XNUMX gigatransfers par seconde (GT/s). ).

En plus de performances améliorées, les processeurs Intel Xeon de 5e génération sont reconnus comme les processeurs de centre de données les plus axés sur la durabilité jamais développés. Grâce aux accélérateurs intégrés qui contribuent à améliorer les performances par watt, l'efficacité énergétique et les économies peuvent être encore étendues en activant le mode d'alimentation optimisée dans le BIOS de la plate-forme, en particulier dans les charges de travail pouvant bénéficier de cette fonctionnalité.
En termes de sécurité, le Extensions de domaine de confiance Intel (Intel TDX) offrent un niveau de confidentialité plus élevé dans la machine virtuelle (VM), améliorant la confidentialité et offrant un meilleur contrôle sur les données. D'un autre côté, le Extensions Intel Software Guard (intel sgx) représentent la technologie leader en matière d'informatique confidentielle, étant la plus recherchée, la plus mise à jour et la plus complète disponible dans les centres de données du marché actuel.
Les processeurs Xeon de 5ème génération sont rétrocompatibles avec les broches de la génération précédente et avec les principaux fabricants d'équipement d'origine (OEM) tels que Cisco, Dell, HPE, IEIT Systems, Lenovo, Super Micro Computer, entre autres, prévoient de proposer une large gamme de processeurs pour les systèmes à un et deux sockets à partir du premier trimestre 2024. De plus, les principaux fournisseurs de services cloud (CSP) annonceront la disponibilité d'instances basées sur Intel Xeon de 5e génération tout au long de l'année.
Cette avancée dans la performance de Intel Xeon de 5e génération ouvre de nouvelles possibilités pour le traitement du langage naturel et les applications avancées d'IA, non seulement dans les centres de données et les cloud, mais également dans les applications réseau et en périphérie, favorisant l'innovation et l'efficacité dans de nombreux secteurs.
Plus de demande pour l'IA générative avec Intel Gaudi3

En plus des nouvelles puces, le Intel a également fourni plus de détails sur Intel Gaudi3, nouvelle version du processeur d'accélération IA de l'entreprise. L'entreprise prévoit de lancer les accélérateurs en 2024 et ce nouveau matériel sera construit sur l'architecture haute performance de gaudi2, promettant de fournir 4 fois plus de puissance de calcul (BF16), de doubler la bande passante du réseau pour une mise à l'échelle plus efficace et de 1,5 fois plus de mémoire HBM intégrée. Ces améliorations visent à répondre à la demande croissante de calcul haute performance et d'efficacité des LLM, sans compromettre les performances.
Pendant le L'IA partout, Gelsinger a présenté pour la première fois une plaquette accélératrice gaudi3 et a annoncé que le Intel connaît une expansion significative dans sa recherche et son développement du Gaudi grâce à des avantages de performance croissants et éprouvés, combinés à des prix très compétitifs. Compte tenu de la demande croissante de solutions d'IA générative, Intel prévoit de conquérir une part encore plus importante du marché des accélérateurs en 2024, grâce à sa suite d'accélérateurs d'IA, mise en évidence par Intel Gaudi3.
Regardez la vidéo sur la chaîne Showmetech :
source: Intel
Revu par Glaucon Vital le 14/12/23.
En savoir plus sur Showmetech
Inscrivez-vous pour recevoir nos dernières actualités par email.