Google a dévoilé Gemini 2.0, son dernier grand modèle de langage, accompagné d’une annonce marquante : l’arrivée de Trillium, un processeur spécialisé qui a permis d’entraîner cette nouvelle IA.
Ce Tensor Processing Unit (TPU), conçu pour fonctionner avec TensorFlow, est dédié à des tâches aussi bien d’entraînement que d’inférence, soit l’exécution des modèles pour répondre à des requêtes.
Trillium représente la sixième génération de TPU développée par Google, la première ayant vu le jour en 2015. Ce processeur innovant est intégré dans l’AI Hypercomputer de Google Cloud, un supercalculateur mêlant matériel optimisé, logiciels open source, frameworks d’apprentissage automatique avancés et modèles tarifaires adaptés.
Les performances de Trillium marquent un bond impressionnant : la vitesse d’entraînement est multipliée par quatre par rapport à la génération précédente, tandis que l’efficacité énergétique a progressé de 67 %, réduisant considérablement la consommation électrique. Chaque puce affiche une vitesse de pointe 4,7 fois supérieure à celle des précédents TPU. À cette échelle, ces avancées s’avèrent cruciales pour répondre à la demande croissante en calcul intensif dans le domaine de l’IA.
Google ne s’arrête pas là et équipe déjà son réseau Jupiter de 100 000 puces Trillium, offrant une bande passante de bissection de 13 pétaoctets par seconde. Bien que ce matériel soit accessible au grand public via la plateforme Google Cloud, il n’est pas disponible à la vente directe. Cependant, les améliorations apportées permettent une réduction des coûts d’utilisation : Trillium offre 2,5 fois plus de performance par dollar investi pour l’entraînement des modèles de langage, comparé à la précédente génération.
L’annonce de Trillium souligne une tendance majeure dans l’évolution de l’IA : les progrès ne dépendent pas seulement des modèles logiciels, mais aussi de l’innovation matérielle. Avec ce processeur de nouvelle génération, Google se positionne solidement face à ses concurrents, tels que Nvidia et ses GPU, Amazon Web Services avec Trainium, ou encore Maia de Microsoft Azure.