Stability AI ha presentado Stable Audio 2.5, su nuevo modelo de generación de sonido impulsado por inteligencia artificial, diseñado para llevar la creación musical a un nivel profesional de velocidad, control y calidad. Esta versión supone un salto tecnológico frente a sus predecesores, convirtiéndose en la primera herramienta enfocada directamente en producción de audio a escala empresarial.
El gran avance de Stable Audio 2.5 está en su capacidad para generar pistas de hasta tres minutos en menos de dos segundos utilizando una GPU Nvidia H100. Esto es posible gracias al método de post-entrenamiento Adversarial Relativistic-Contrastive (ARC), que optimiza la generación para ofrecer resultados más rápidos y con mayor fidelidad musical. Además, el sistema logra reducir los pasos computacionales necesarios, pasando de 50 a solo 8, lo que mejora la eficiencia y la calidad de cada composición.
Pero la velocidad no es el único atractivo. La IA es capaz de crear piezas musicales con estructura definida, incluyendo introducción, desarrollo y cierre, respondiendo de forma precisa a instrucciones tanto técnicas como emocionales. Por ejemplo, un usuario puede describir una pista como “uplifting con sintetizadores envolventes” y el modelo entregará una producción acorde al pedido. Este nivel de control creativo está pensado para músicos, productores y marcas que buscan resultados inmediatos sin sacrificar calidad.
Otra novedad destacada es la introducción de la función audio inpainting, que permite cargar un fragmento de sonido y expandirlo desde un punto específico, generando nuevas secciones que mantienen la coherencia con el material original. Esto abre un abanico de posibilidades en la edición y postproducción musical, ofreciendo herramientas nunca antes vistas en el sector.
Stability AI ha puesto especial énfasis en el cumplimiento de derechos de autor, entrenando el modelo con un dataset completamente licenciado, lo que garantiza que el contenido generado sea considerado comercialmente seguro. Este aspecto resulta clave en un contexto donde el debate sobre el uso justo y la autoría en música creada por IA sigue en plena efervescencia.
Para potenciar la llegada de la herramienta al mundo corporativo, la compañía anunció una alianza con Amp, agencia de branding sonoro perteneciente al grupo WPP. Gracias a esta colaboración, Stable Audio 2.5 estará disponible en la plataforma WPP Open, lo que facilitará a las grandes marcas la integración de sonido generado por IA en campañas globales.
El modelo ya puede utilizarse en StableAudio.com, a través de la API oficial de Stability AI y en plataformas asociadas como fal, Replicate y ComfyUI. Asimismo, la empresa ofrece opciones de implementación on-premises bajo licencia empresarial para compañías que necesiten total control sobre sus entornos de producción.
Con esta apuesta, Stability AI no solo busca consolidarse como líder en generación de imágenes y modelos multimodales, sino también como un actor central en el futuro de la producción musical asistida por IA. La velocidad, la precisión en la composición y la seguridad legal que ofrece Stable Audio 2.5 marcan un antes y un después en la industria del audio digital, reduciendo procesos que antes podían tardar semanas a cuestión de segundos.