Google Cloud объявил о том, что Google Kubernetes Engine (GKE) теперь поддерживает до 65 000 узлов, что позволяет ему работать с массивными моделями ИИ с триллионами параметров. По мере развития генеративного ИИ потребность в огромных вычислительных мощностях для обучения этих моделей возрастает. GKE теперь предлагает масштабирование более чем в 10 раз больше, чем два других крупнейших поставщика общедоступных облачных сервисов, что позволяет клиентам сократить время обучения моделей или масштабировать модели до нескольких триллионов параметров. Это расширение также позволяет запускать пять заданий в одном кластере, каждое из которых соответствует масштабу предыдущего мирового рекорда Google Cloud для самой большой обучающей задачи для LLM. Такие клиенты, как Anthropic, компания, занимающаяся безопасностью и исследованиями ИИ, приветствовали эти разработки. С технической точки зрения, GKE переходит с распределенного хранилища ключей и значений etcd с открытым исходным кодом на новое, более надежное хранилище ключей и значений на основе Spanner, распределенной базы данных Google. Это изменение обеспечит новые уровни надежности для пользователей GKE, улучшая задержку операций кластера. Кроме того, благодаря капитальному ремонту инфраструктуры GKE, управляющей плоскостью управления Kubernetes, GKE теперь масштабируется значительно быстрее. Google Cloud также сохраняет свою приверженность открытому исходному коду, гарантируя, что все необходимые оптимизации и улучшения для такого масштаба являются частью основного Kubernetes с открытым исходным кодом.