Home
» Wiki
»
¿Por qué la IA no puede escribir texto en las imágenes?
¿Por qué la IA no puede escribir texto en las imágenes?
Si ha utilizado herramientas de IA generativa para crear imágenes, es posible que haya encontrado problemas al escribir texto en las imágenes. Saber por qué sucede esto ayudará a evitar este problema, así como a encontrar formas de solucionarlo.
¿Por qué la IA no puede escribir texto en imágenes?
La razón principal por la que la IA no puede escribir texto se debe a los datos de entrada pasados. Si bien la IA es bastante buena para generar imágenes en general, algunos aspectos como el texto no se han utilizado al mismo nivel para entrenar modelos de lenguaje grandes (LLM) . Por lo tanto, la IA no es muy hábil en la generación de texto en imágenes.
Aunque son bastante avanzadas, las herramientas de IA todavía se encuentran técnicamente en sus primeras etapas. Además, algunas herramientas de IA se están quedando sin datos de entrenamiento. Todavía existe la posibilidad de que las herramientas generadoras puedan generar mejor texto, pero por ahora, tendrás que probar una alternativa.
¿Existe una alternativa al texto ilegible en las imágenes de IA?
Si bien generar texto en imágenes de IA es bastante difícil, no es imposible. Aquí están los métodos más efectivos en este momento...
1. Dale a la herramienta indicaciones más específicas
Cuando las personas comienzan a utilizar IA, sus habilidades para escribir indicaciones suelen ser deficientes. El mayor error es dar instrucciones vagas como “crea una imagen de una escena callejera”.
No es de extrañar que obtengas resultados deficientes. La mejor forma de utilizar la IA generativa es pensar en su mensaje como si fuera un resumen creativo. Cuanto más específico, mejor. A continuación se muestra un ejemplo de mensaje:
Crea una imagen del exterior de un café italiano. Quiero que tenga la inscripción "Café" como letrero y que sea en un día soleado.
Traducción aproximada : Crear una imagen exterior de un café italiano. Quiero que la imagen tenga las palabras "Café" en el cartel y en un día soleado.
Como puedes ver en la imagen a continuación, ChatGPT funcionó bastante bien. Esto no sucedería si simplemente dijeras "Crea una imagen exterior de un café italiano".
Imagen de una cafetería creada en DALL-E
En mi experiencia personal, las imágenes simples parecen ser más efectivas. Por ejemplo, la imagen de arriba tiene menos elementos que la imagen probada a continuación, lo que significa que la IA tiene menos que intentar y aprender.
Una escena callejera ajustada en la aplicación DALL-E 3
2. Utiliza variaciones de la palabra "Texto"
Cambiar un poco el idioma en el mensaje puede hacer una gran diferencia. Después de probar el término "texto" unas cuantas veces, comenzarás a sentir que estás dando vueltas en círculo, así que prueba con diferentes sinónimos.
Por ejemplo, en lugar de "texto", podrías intentar:
Título
Alfabeto
Palabra escrita
Símbolo
Si ninguna de estas funciona, siga probando alternativas. Lo que funciona y lo que no funciona puede variar dependiendo de lo que estés intentando crear. Por ejemplo, probablemente no usarías "símbolo" si estuvieras intentando diseñar una tarjeta de cumpleaños. En este caso, la clave está en experimentar con distintas ideas de IA, y distintas herramientas pueden funcionar de distintas maneras.
3. Agregue texto usando las herramientas de reemplazo
No deberías agregar texto a través de las herramientas de reemplazo si se supone que las palabras son parte de la imagen, pero es una buena idea si estás intentando crear más gráficos. Funcionará si desea diseñar una tarjeta, un gráfico, una portada de libro o algo similar.
Si va a hacer esto, asegúrese de que haya suficiente espacio en la imagen. Puedes utilizar cualquier herramienta que quieras para agregar texto a tu imagen. Se recomiendan Canva o Adobe Photoshop Express, pero otras aplicaciones que te permiten agregar texto a las imágenes en tu teléfono inteligente también funcionarán con el contenido que crees usando IA.
También debes asegurarte de que el texto coincida con la imagen generada por IA. Utilice fuentes que coincidan con el estado de ánimo que intenta transmitir y reformule las cosas como considere necesario.
4. Mantenga el texto breve
La generación de texto de imágenes con IA a menudo falla porque intenta agregar demasiado texto. Honestamente, esto sucede cada vez que intentas crear algo con más de 10 caracteres. De manera similar a la recomendación de mantener las imágenes simples, debes hacer todo lo posible para mantener tu texto breve.
Para probar esto, el autor probó con otro mensaje:
Genere una imagen de un banco con el texto "banco" en el exterior. Quiero que esté en un área del centro de la ciudad y que tenga una estructura moderna, como las que se verían en una ciudad de Estados Unidos.
Traducción aproximada : Hacer una imagen de un banco con la palabra "banco" en el exterior. Quería que estuviera en el centro y que tuviera una estructura moderna, como la que se ve en una ciudad estadounidense.
Como puede ver a continuación, el motor de inteligencia artificial hizo un buen trabajo al escuchar al usuario. Sin embargo, hay algunos errores en una parte de la imagen. Entonces, dígale a la IA que solo desea una o dos señales para limitar la posibilidad de que esto suceda. Estos problemas también parecen ocurrir cuando el texto es más pequeño, así que tenlo en cuenta.
Imagen de edificio moderno creada en DALL-E
5. Utilice herramientas para corregir errores de texto
De manera similar a cómo puedes eliminar defectos en las fotos tomadas con tu cámara, puedes intentar usar una herramienta que ayude a corregir errores de texto en las fotos. Hay muchas aplicaciones que corrigen errores en las fotos generadas por IA, como Storia Lab.
Error de la herramienta Textify de Storia Lab AI
Al utilizar estas herramientas, normalmente puede seleccionar texto y cambiar el contenido según corresponda. Algunas aplicaciones son gratuitas, pero en otros casos necesitarás una suscripción paga. Si creas muchas imágenes con IA, puedes comprar un plan mensual o anual para acceder a ellas cuando las necesites.
6. Utilice herramientas de IA para generar texto preciso
Es posible que haya oído hablar de Midjourney , DALL-E, Firefly y generadores de imágenes de IA similares. ¿Pero sabías que existen generadores de arte de IA específicos que generan texto preciso en imágenes?
Dado que una de las características especiales de Ideogram es la creación de texto legible, definitivamente puedes probar esta aplicación para algunas de tus creaciones. Ideogram tiene una función Magic Prompt que amplía su función original, lo que significa que puede obtener resultados aún más precisos. Además del plan gratuito, los planes de suscripción paga comienzan en $8 al mes.
Si bien la IA tiene sus deficiencias a la hora de crear imágenes con texto legible, encontrarás algunas alternativas si estás dispuesto a pensar de manera innovadora. A veces, la mejor opción es proporcionar a su herramienta instrucciones detalladas que sean menos largas y difíciles de procesar. Es posible que también desees solucionar problemas en tus imágenes con otro software o utilizar herramientas diseñadas específicamente para crear texto preciso.