El mes pasado, OpenAI lanzó una importante actualización de la función de generación de imágenes de ChatGPT, impulsada por un nuevo modelo. Esta actualización ha tomado al mundo por sorpresa con más de 130 millones de usuarios y ha creado más de 700 millones de imágenes en solo una semana desde su lanzamiento.
Hoy, OpenAI pone oficialmente este modelo mejorado de generación de imágenes a disposición de los desarrolladores a través de la API gpt-image-1. La nueva API permite que las aplicaciones y los servicios integren la creación de imágenes de alta calidad, compatibilidad con una variedad de estilos visuales, edición precisa de imágenes, amplio conocimiento del mundo y representación de texto nítida.
gpt-image-1 ahora está disponible en la API de imágenes y pronto habrá planes para admitir la API de respuestas.
Funciones de control flexibles:
- Moderación : los desarrolladores pueden ajustar la sensibilidad de la moderación a través del parámetro de moderación. De forma predeterminada se aplica el filtro estándar, pero se puede seleccionar el modo bajo para reducir la restricción.
- Personalizar la salida : controlar la calidad de la imagen, la cantidad de imágenes generadas, el fondo transparente/opaco y el formato de salida (JPEG, PNG, WebP).
Esta es una suscripción paga, y el costo se basa en tokens con hitos específicos como los siguientes:
- Entrada de texto : 5 USD/1 millón de tokens.
- Entrada de imagen : 10 USD/1 millón de tokens.
- Salida de imagen : 40 USD/1 millón de tokens.
Ejemplo del mundo real: cada foto cuadrada de calidad baja, media y alta cuesta aproximadamente $0,02, $0,04 y $0,19, respectivamente.
Los desarrolladores pueden probar este modelo en OpenAI Playground. Muchas empresas como Adobe, Airtable, Figma, Gamma, HeyGen, Wix, Photoroom, Canva, GoDaddy, HubSpot, Instacart, Invideo y OpusClip han integrado la API de generación de fotografías de OpenAI en sus productos y han recibido comentarios positivos de la comunidad de usuarios.