Microsoft объявила о значительных обновлениях службы Azure OpenAI, призванных помочь своим более чем 60 000 клиентов более эффективно и экономично управлять развертываниями ИИ. Внедрение самостоятельного выделения ресурсов направлено на то, чтобы сделать процессы квотирования и развертывания более гибкими, ускорить вывод продуктов на рынок и повысить их экономичность.

Одним из ключевых обновлений является введение почасовой оплаты за выделенные единицы пропускной способности (PTU), что позволяет пользователям создавать развертывания на срок от одного часа по фиксированной ставке 2 доллара США за единицу в час. Это идеально подходит для тестовых сценариев или переходных периодов без каких-либо долгосрочных обязательств.

Кроме того, Microsoft теперь предлагает ежемесячные и ежегодные резервирования Azure для выделенных развертываний, что обеспечивает значительную экономию средств для производственных сред с постоянными объемами запросов. Клиенты могут сэкономить до 82% или 85% соответственно по сравнению с почасовыми тарифами.

Истории успеха клиентов, такие как Visier Solutions, подчеркивают ощутимые преимущества этих обновлений, включая сокращение времени отклика, повышение стабильности и снижение задержек.

Упрощая процессы развертывания и управления затратами, Microsoft стремится предоставить большему числу клиентов возможность использовать возможности службы Azure OpenAI для создания собственных приложений генеративного ИИ.