Прошло почти десять лет с тех пор, как Amazon Web Services (AWS), подразделение облачных вычислений Amazon, анонсировало SageMaker, свою платформу для создания, обучения и развертывания моделей искусственного интеллекта. Если в предыдущие годы AWS сосредоточивалась на значительном расширении возможностей SageMaker, то в этом году целью стала оптимизация.
На конференции re:Invent 2024 компания AWS представила SageMaker Unified Studio — единое место для поиска и работы с данными со всей организации. SageMaker Unified Studio объединяет инструменты других сервисов AWS, включая существующую SageMaker Studio, чтобы помочь клиентам обнаруживать, готовить и обрабатывать данные для построения моделей.
«Мы наблюдаем конвергенцию аналитики и искусственного интеллекта, когда клиенты используют данные все более взаимосвязанными способами», — заявил в своем заявлении Свами Сивасубраманиан, вице-президент по данным и искусственному интеллекту в AWS. «Следующее поколение SageMaker объединяет возможности, позволяющие предоставить клиентам все необходимые инструменты для обработки данных, разработки и обучения моделей машинного обучения, а также генеративного искусственного интеллекта непосредственно в SageMaker».
Используя SageMaker Unified Studio, клиенты могут публиковать и делиться данными, моделями, приложениями и другими артефактами с членами своей команды или более широкой организацией. Сервис предоставляет средства контроля безопасности данных и настраиваемые разрешения, а также интеграцию с платформой разработки моделей AWS Bedrock.
Искусственный интеллект встроен в SageMaker Unified Studio, а точнее, в Q Developer, чат-бот Amazon для кодирования. В SageMaker Unified Studio Q Developer может отвечать на такие вопросы, как «Какие данные мне следует использовать, чтобы получить лучшее представление о продажах продукта?» или «Создать SQL для расчета общего дохода по категориям продуктов».
В блоге AWS объясняется: «Q Developer (может) поддерживать такие задачи разработки, как обнаружение данных, кодирование, генерация SQL и интеграция данных» в SageMaker Unified Studio.
Помимо SageMaker Unified Studio, AWS выпустила два небольших дополнения к семейству продуктов SageMaker: SageMaker Catalog и SageMaker Lakehouse.
Каталог SageMaker позволяет администраторам определять и реализовывать политики доступа для приложений, моделей, инструментов и данных искусственного интеллекта в SageMaker, используя единую модель разрешений с детальным контролем. Между тем, SageMaker Lakehouse обеспечивает подключение SageMaker и других инструментов к данным, хранящимся в озерах данных, хранилищах данных и корпоративных приложениях AWS.
AWS заявляет, что SageMaker Lakehouse работает с любыми инструментами, совместимыми со стандартами Apache Iceberg — Apache Iceberg — это формат с открытым исходным кодом для больших аналитических таблиц. При желании администраторы могут применять элементы управления доступом к данным во всех инструментах аналитики и искусственного интеллекта, с которыми работает SageMaker Lakehouse.
В рамках схожей разработки SageMaker теперь должен лучше работать с приложениями «программное обеспечение как услуга» благодаря новым интеграциям. Клиенты SageMaker могут получать доступ к данным из таких приложений, как Zendesk и SAP, без необходимости предварительного извлечения, преобразования и загрузки этих данных.
«Клиенты могут иметь данные, распределенные по нескольким озерам данных, а также по хранилищу данных, и им будет полезен простой способ унификации всех этих данных», — пишет AWS. «Теперь клиенты могут использовать предпочитаемые ими инструменты аналитики и машинного обучения для своих данных, независимо от того, как и где они физически хранятся, для поддержки сценариев использования, включая аналитику SQL, специальные запросы, обработку данных, машинное обучение и генеративный искусственный интеллект. »