Hay varias herramientas de inteligencia artificial para convertir texto a video y, si bien la tecnología es realmente impresionante, siempre hay algo en el resultado final que parece extraño. Pasó un tiempo hasta que se detectó el problema, pero al final todo se redujo a una sola cosa: el efecto del valle inquietante.
Si bien puedes usar algunas herramientas impulsadas por IA para crear efectos visuales en tus proyectos de video, no se recomienda usar IA por sí sola para crear secuencias de video porque se ve demasiado extraño.
El mayor problema con las herramientas de texto a video con IA
La generación de vídeo con IA ha avanzado mucho en un corto período de tiempo gracias a los avances en Deep Learning. En 2023, cuando la generación de videos con inteligencia artificial explote, es posible que recuerdes este clip de Will Smith comiendo espaguetis que se volvió viral. Si bien este tipo de tecnología fue innovadora en su momento, no se puede negar lo poco natural e incómoda que parecía.
En 2024, estas herramientas de modelado de video con IA están mejorando, creando imágenes más fluidas y movimientos más realistas. Mira la diferencia entre los videos creados con Runway Gen-2 en 2023 y los videos que OpenAI lanzó en 2024 para mostrar Sora AI. Sora aún no está disponible para uso público, pero la calidad parece prometedora:
Aunque han mejorado, los resultados aún no son concluyentes. En primer lugar, Sora aún no está disponible para su uso, por lo que todavía estamos atrapados con generadores menos sofisticados que pueden producir resultados espeluznantes como el video de espaguetis de Will Smith.
Simplemente mira el video creado con PixVerse usando el mensaje "Una persona camina por un parque en un día soleado, sonriendo y saludando a la cámara. Los pájaros vuelan sobre sus cabezas y los árboles se mecen suavemente con la brisa" . (Traducción aproximada: "Una persona camina por un parque en un día soleado, sonriendo y saludando a la cámara. Los pájaros vuelan sobre sus cabezas y los árboles se mecen suavemente con el viento").
Los primeros dos segundos se ven bien, ¡hasta que los dedos, el cabello y la cara de la persona comienzan a desaparecer en el aire! Aunque aparecen herramientas más avanzadas como Sora que nos ofrecen vídeos más precisos y bellos, todavía hay algo inquietante en las personas y los paisajes generados por IA.
Si bien los modelos más antiguos a menudo producían videos que mostraban claramente la IA, como imágenes estilo plastilina, las mejoras de las herramientas más nuevas parecen casi demasiado perfectas.
Antinatural, incómodo y sin vida. Éste es exactamente el efecto del valle inquietante: parecido al humano, pero no del todo.
No importa lo buenas que sean estas herramientas, el efecto del valle inquietante siempre existe. A menos que busques un estilo abstracto y surrealista que solo se ve en sueños, no deberías confiar en las herramientas de texto a video de IA para ninguno de tus proyectos de video.