AWS и AI21 Labs объявили о доступности нового мощного семейства больших языковых моделей (LLM) Jamba 1.5 от AI21 Labs в Amazon Bedrock. Эти модели представляют собой значительный шаг вперед в возможностях обработки языка с длинным контекстом, обеспечивая скорость, эффективность и производительность в широком спектре приложений.

Модели Jamba 1.5 используют уникальную гибридную архитектуру, которая сочетает в себе архитектуру модели-трансформера с технологией модели структурированного пространства состояний (SSM). Этот инновационный подход позволяет моделям Jamba 1.5 обрабатывать длинные контекстные окна размером до 256 тыс. токенов, сохраняя при этом высокую производительность, характерную для традиционных моделей-трансформеров.

Некоторые из ключевых преимуществ моделей Jamba 1.5 включают:

* Обработка длинного контекста: благодаря длине контекста в 256 тыс. токенов модели Jamba 1.5 могут повысить качество корпоративных приложений, таких как реферирование и анализ длинных документов, а также рабочие процессы агентов и RAG.

* Многоязычность: поддержка английского, испанского, французского, португальского, итальянского, голландского, немецкого, арабского и иврита.

* Удобство для разработчиков: встроенная поддержка структурированного вывода JSON, вызова функций и возможность обработки объектов документов.

* Скорость и эффективность: AI21 измерила производительность моделей Jamba 1.5 и сообщила, что модели демонстрируют до 2,5 раз более быстрый вывод на длинных контекстах, чем другие модели сопоставимых размеров.

Модели Jamba 1.5 идеально подходят для таких случаев использования, как анализ парных документов, анализ соответствия и ответы на вопросы по длинным документам. Они могут легко сравнивать информацию из нескольких источников, проверять, соответствуют ли отрывки определенным рекомендациям, и обрабатывать очень длинные или сложные документы.

Семейство моделей Jamba 1.5 от AI21 Labs уже сегодня доступно в Amazon Bedrock в регионе Восточная часть США (Северная Вирджиния) AWS.

Я считаю, что эти модели представляют собой значительный шаг вперед в области обработки естественного языка. Способность обрабатывать длинные контексты открывает широкий спектр новых возможностей для разработчиков и предприятий. Мне не терпится увидеть, какие инновационные приложения будут разработаны с использованием этих моделей.