Publié le 2024-05-08 14:35:00. Amazon Web Services (AWS) déploie une nouvelle génération d’instances de calcul haute performance, les G7e, équipées de cartes graphiques NVIDIA RTX PRO 6000 Blackwell Server Edition, dans sa région Asie-Pacifique (Tokyo). Ces instances promettent des gains significatifs en matière de performances pour les applications d’intelligence artificielle et de calcul intensif.
- Les instances G7e offrent jusqu’à 2,3 fois plus de performances d’inférence que la génération précédente (G6e).
- Elles sont conçues pour accélérer les modèles de langage étendus (LLM), l’IA agentique, l’IA générative multimodale et les simulations physiques.
- Les instances G7e sont disponibles à la demande, en instances Spot ou via des plans d’économies.
AWS renforce son offre de services de calcul avec le lancement des instances G7e, basées sur l’architecture NVIDIA Blackwell. Ces nouvelles instances sont particulièrement adaptées aux charges de travail exigeantes en matière de traitement graphique et d’intelligence artificielle, telles que le développement et le déploiement de modèles d’IA de pointe. Elles sont disponibles dès maintenant dans la région Asie-Pacifique (Tokyo), rejoignant ainsi les régions USA Ouest (Oregon), USA Est (Virginie du Nord, Ohio) où elles sont déjà proposées.
Les instances G7e intègrent jusqu’à huit GPU NVIDIA RTX PRO 6000 Blackwell Server Edition, chacune disposant de 96 Go de mémoire. Elles sont également équipées de processeurs Intel Xeon de 5e génération, offrant jusqu’à 192 processeurs virtuels (vCPU) et une bande passante réseau allant jusqu’à 1 600 Gbit/s. La technologie NVIDIA GPUDirect Peer to Peer (P2P) améliore les performances des applications multi-GPU, tandis que l’accès direct à la mémoire à distance (RDMA) NVIDIA GPUDirect avec EFA, disponible dans les UltraClusters EC2, réduit la latence pour les charges de travail distribuées.
Selon AWS, ces nouvelles instances sont particulièrement performantes pour les charges de travail de calcul spatial et celles nécessitant une combinaison de puissance de calcul graphique et d’IA. Les clients peuvent ainsi déployer plus efficacement des modèles de langage étendus (LLM), des modèles d’IA agentiques, des modèles d’IA génératifs multimodaux et des modèles d’IA physiques.
Pour démarrer avec les instances G7e sur Amazon EC2, les utilisateurs peuvent se rendre sur la Console de gestion AWS, utiliser l’ Interface de ligne de commande AWS (CLI) ou les kits SDK AWS. Des informations complémentaires sont disponibles sur la page dédiée aux Instances G7e.