Han pasado casi diez años desde que Amazon Web Services (AWS), la división de computación en la nube de Amazon, presentó SageMaker, su plataforma para crear, entrenar y desplegar modelos de inteligencia artificial. En los años anteriores, AWS se centró en ampliar significativamente las capacidades de SageMaker, pero este año el objetivo fue simplificar su uso.
Durante la conferencia re:Invent 2024, AWS presentó SageMaker Unified Studio, un espacio único para encontrar y trabajar con datos de toda la organización. SageMaker Unified Studio integra herramientas de otros servicios de AWS, incluido el ya existente SageMaker Studio, para ayudar a los clientes a descubrir, preparar y procesar datos para construir modelos.
Swami Sivasubramanian, vicepresidente de datos e IA en AWS, comentó: “Estamos viendo una convergencia de análisis e inteligencia artificial, con clientes que utilizan datos de maneras cada vez más interconectadas. La próxima generación de SageMaker reúne capacidades para proporcionar a los clientes todas las herramientas necesarias para el procesamiento de datos, desarrollo y entrenamiento de modelos de aprendizaje automático, así como inteligencia artificial generativa, directamente dentro de SageMaker”.
Con SageMaker Unified Studio, los clientes pueden publicar y compartir datos, modelos, aplicaciones y otros elementos con miembros de su equipo o de la organización. El servicio incluye controles de seguridad de datos y permisos ajustables, así como integraciones con la plataforma de desarrollo de modelos Bedrock de AWS. La inteligencia artificial está integrada en SageMaker Unified Studio, específicamente a través de Q Developer, el chatbot de programación de Amazon. En SageMaker Unified Studio, Q Developer puede responder preguntas como “¿Qué datos debo usar para tener una mejor idea de las ventas de productos?” o “Genera SQL para calcular los ingresos totales por categoría de producto”. AWS explicó en una publicación de blog que “Q Developer puede apoyar tareas de desarrollo como descubrimiento de datos, codificación, generación de SQL e integración de datos” en SageMaker Unified Studio.
Además de SageMaker Unified Studio, AWS lanzó dos nuevas adiciones a su familia de productos SageMaker: SageMaker Catalog y SageMaker Lakehouse. SageMaker Catalog permite a los administradores definir e implementar políticas de acceso para aplicaciones de IA, modelos, herramientas y datos en SageMaker utilizando un modelo de permisos único con controles detallados. Por otro lado, SageMaker Lakehouse proporciona conexiones desde SageMaker y otras herramientas a datos almacenados en lagos de datos de AWS, almacenes de datos y aplicaciones empresariales. AWS afirma que SageMaker Lakehouse es compatible con cualquier herramienta que cumpla con los estándares de Apache Iceberg, que es el formato de código abierto para grandes tablas analíticas. Los administradores pueden aplicar controles de acceso a todos los datos en las herramientas de análisis e IA que toque SageMaker Lakehouse, si así lo desean.
En un desarrollo relacionado, SageMaker ahora debería funcionar mejor con aplicaciones de software como servicio, gracias a nuevas integraciones. Los clientes de SageMaker pueden acceder a datos de aplicaciones como Zendesk y SAP sin necesidad de extraer, transformar y cargar esos datos primero. AWS escribió: “Los clientes pueden tener datos distribuidos en múltiples lagos de datos, así como en un almacén de datos, y se beneficiarían de una forma sencilla de unificar todos estos datos. Ahora, los clientes pueden utilizar sus herramientas de análisis y aprendizaje automático preferidas en sus datos, sin importar cómo y dónde estén físicamente almacenados, para apoyar casos de uso que incluyen análisis SQL, consultas ad-hoc, ciencia de datos, aprendizaje automático e inteligencia artificial generativa”.