Clicky

Qué es Sora de OpenAI

generador de vídeos Sora de OpenAI

Todo lo que sabemos hasta ahora de esta increíble herramienta de vídeo con IA

Una vez más, OpenAI ha irrumpido en Internet con un anuncio trascendental de IA: un generador de vídeo de IA llamado Sora que puede crear vídeos inquietantemente realistas. Algunos de los ejemplos publicados ya son difíciles de distinguir de las imágenes reales de las cámaras.

Sora es un modelo de difusión con arquitectura transformadora, lo que significa que su red neuronal funciona de manera similar a ChatGPT. OpenAI ha guardado silencio sobre su fecha de lanzamiento oficial, pero dice que quiere mostrar a la gente lo que hay "en el horizonte" para la inteligencia artificial.

Aquí encontrarás todo lo que sabemos sobre Sora hasta ahora y por qué el lanzamiento del generador de vídeo al público en general podría tardar todavía algún tiempo.

¿Qué es Sora?

Sora es un modelo de IA de texto a vídeo desarrollado por los creadores de ChatGPT, OpenAI. "Texto a video" significa que Sora toma indicaciones de texto y las convierte en videoclips cortos. El lote publicado por OpenAI esta semana es realmente impresionante. Echa un vistazo a este vídeo de un pulpo completamente generado por IA:

"Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del tema y el fondo", explica OpenAI en una publicación de blog publicada esta semana, dentro de la cual se publicaron más videos. "El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico".

¿Quién puede acceder a Sora ahora?

Actualmente, Sora está siendo puesto a prueba por investigadores de seguridad que son responsables de garantizar que sea seguro antes de su lanzamiento al público y de evaluar los "riesgos críticos".

Sin embargo, OpenAI dice que un pequeño grupo de artistas visuales, cineastas y diseñadores también han tenido acceso a Sora. No se nombra a ningún artista o diseñador que esté participando en el ensayo.

Algunas cuentas informadas en el foro OpenAI parecen indicar que en algún momento se implementará una lista de espera, que será la primera oportunidad de tenerlo en tus manos.

Desafortunadamente, no hay indicación de cuándo podremos registrarnos para usar Sora.

¿Cuándo estará Sora disponible para el público?

Lamentablemente, actualmente no hay una fecha de lanzamiento para Sora. Todo el contenido que se ha vuelto viral en Internet durante las últimas 24 horas proviene de la publicación del blog de anuncio publicada por OpenAI.

Curiosamente, no parece que OpenAI haya dado siquiera una vaga indicación de cuándo podría estar disponible de forma generalizada; ni siquiera ha habido una indicación de que se lanzará este año.

Esto es bastante inusual para un anuncio tan grande y podría sugerir que falta mucho para su lanzamiento público, pero, de nuevo, OpenAI admite que está compartiendo su investigación temprano. Con la velocidad a la que se ha movido la industria de la inteligencia artificial en los últimos dos años, la verdadera fecha de lanzamiento es una incógnita.

¿Cuál es el problema con Sora?

Como decimos, OpenAI aún no está preparado para lanzar Sora al público, insatisfecho de que la tecnología de generación de vídeo no haya sido suficientemente probada en seguridad. Esto es bueno, considerando la infinidad de cuestiones éticas relacionadas con la creación de vídeos tan realistas, sin mencionar durante un año con tantas elecciones.

"Tomaremos varias medidas de seguridad importantes antes de que Sora esté disponible en los productos de OpenAI". "Estamos trabajando con los miembros del equipo rojo  -  expertos en dominios en áreas como desinformación, contenido de odio y prejuicios - quienes probarán el modelo de manera adversa", agregó.

OpenAI también dice que está trabajando en un clasificador de detección de video de IA que puede identificar si Sora ha producido un vídeo o no.

Este parece un paso similar al que se dio después del lanzamiento de ChatGPT, tras lo cual la empresa de inteligencia artificial lanzó un clasificador de texto. Sin embargo, más tarde fue cerrado debido a su falta de fiabilidad. Cuando lo probamos para ver si podía descubrir plagio de ChatGPT, ni siquiera pudo detectar contenido generado por sí mismo.

¿Cómo funciona Sora?

"Sora es un modelo de difusión que genera un vídeo comenzando con uno que parece ruido estático y lo transforma gradualmente eliminando el ruido en muchos pasos", dijo OpenAI esta semana.

La tecnología funciona de manera similar a la familia de modelos de lenguaje GPT que impulsan el chatbot de la empresa, ChatGPT. Todos utilizan una arquitectura de "transformador", un tipo de red neuronal que toma entradas y las "transforma" en salidas. También han incorporado elementos de DALL-E 3, como el sistema de recaptación.

OpenAI ha alimentado vídeos e imágenes de Sora como unidades de datos (o “parches”). "Al unificar la forma en que representamos los datos", dice OpenAI, "podemos entrenar transformadores de difusión en una gama más amplia de datos visuales de lo que era posible antes, abarcando diferentes duraciones, resoluciones y relaciones de aspecto".

Jesus_Caceres