Amazon объявила о всеобщей доступности Amazon SageMaker Lakehouse, функции, которая объединяет данные из озер данных Amazon Simple Storage Service (Amazon S3) и хранилищ данных Amazon Redshift, помогая создавать мощные аналитические приложения и приложения искусственного интеллекта и машинного обучения (ИИ/МО) на основе одной копии данных. SageMaker Lakehouse является частью следующего поколения Amazon SageMaker, унифицированной платформы для данных, аналитики и ИИ, которая объединяет широко используемые возможности AWS по машинному обучению и аналитике и обеспечивает интегрированный интерфейс для аналитики и ИИ.

Клиенты хотят делать больше с данными. Чтобы ускорить свой аналитический путь, они выбирают подходящие хранилища и базы данных для хранения своих данных. Данные распределены по озерам данных, хранилищам данных и различным приложениям, создавая информационные силосы, которые затрудняют доступ и использование. Эта фрагментация приводит к дублированию копий данных и сложным конвейерам данных, что, в свою очередь, увеличивает затраты организации. Кроме того, клиенты вынуждены использовать определенные механизмы и инструменты запросов, поскольку способ и место хранения данных ограничивают их возможности. Это ограничение мешает им работать с данными так, как они хотели бы. Наконец, непоследовательный доступ к данным затрудняет для клиентов принятие обоснованных бизнес-решений.

SageMaker Lakehouse решает эти проблемы, помогая объединить данные из озер данных Amazon S3 и хранилищ данных Amazon Redshift. Он предлагает гибкость доступа к данным и выполнения запросов на месте с помощью всех механизмов и инструментов, совместимых с Apache Iceberg. С помощью SageMaker Lakehouse вы можете централизованно определять детализированные разрешения и применять их к нескольким службам AWS, упрощая совместное использование данных и совместную работу. Перенести данные в SageMaker Lakehouse легко. В дополнение к бесшовному доступу к данным из существующих озер данных и хранилищ данных, вы можете использовать zero-ETL из операционных баз данных, таких как Amazon Aurora, Amazon RDS для MySQL, Amazon DynamoDB, а также из приложений, таких как Salesforce и SAP. SageMaker Lakehouse вписывается в ваши существующие среды.

Меня особенно впечатлила интеграция SageMaker Lakehouse с другими сервисами AWS. Эта интеграция значительно упрощает управление данными и аналитику, делая их намного проще и эффективнее. Я считаю, что этот сервис будет чрезвычайно ценным для компаний, стремящихся улучшить свои аналитические возможности и возможности ИИ.