Cómo hacer una imagen a partir de una descripción
La forma más rápida de entender la generación de imágenes es hacer tu primera imagen ahora mismo y solo después entender cómo funciona. Eso haremos: al final de este capítulo tendrás una imagen terminada y una idea de qué hacer después.
En un minuto: tu primer resultado
Cualquier red neuronal "artista" funciona igual: escribes lo que quieres ver — ella dibuja. Se le llama de varias formas: "dibujo a partir de texto", text-to-image, generación a partir de una descripción. La esencia es la misma.
Pruébalo aquí mismo. No lo compliques — para empezar basta una frase, por ejemplo "una cafetería acogedora en una tarde lluviosa, luz cálida, acuarela".

Fíjate en lo que pasó. No elegiste pinceles, no buscaste referencias, no abriste Photoshop. Describiste — y lo obtuviste. Todo el oficio a partir de aquí se reduce a describir con más precisión.
De qué se compone una buena descripción
Los principiantes escriben "una chica guapa" y se molestan de que el resultado sea distinto cada vez. Los usuarios con experiencia describen una imagen como si se la dictaran a alguien que no te ve y no adivina. Conviene tener en mente cuatro capas:
- Sujeto — qué o quién está en la imagen. "Un gato naranja".
- Acción y entorno — qué pasa y dónde. "…sentado en el alféizar, una ciudad nocturna fuera".
- Estilo — fotografía, acuarela, render 3D, anime, óleo. "…al estilo de un fotograma de película".
- Detalles del encuadre — luz, ángulo, ánimo, colores. "…luz cálida y suave, vista lateral, acogedor".
Júntalas y en lugar de una lotería obtienes un resultado controlable. El siguiente capítulo, "Cómo escribir prompts", está dedicado por completo a esto; por ahora basta con captar el principio: cuanto más concreta la entrada, más predecible la salida.
El texto no es la única entrada
"Hacer una imagen" no siempre significa "desde cero". A menudo ya tienes una imagen y necesitas cambiarla — eso también es generación, solo que el punto de partida no es solo el texto:
- A partir de una foto — sube tu foto y pide cambiar el estilo, el fondo o la ropa.
- A partir de un boceto — dibuja un esquema a mano alzada, la red lo convierte en una ilustración limpia.
- Por partes — selecciona un trozo de una imagen terminada y vuelve a dibujar solo eso (cambiar el cielo, eliminar un objeto sobrante, cambiar una cara).
Si tu tarea está más cerca de editar una foto terminada que de dibujar desde cero, ve a la sección sobre trabajar con fotos. Si lo que quieres es crear — seguimos.
Por qué a dos personas les sale distinto
Una misma descripción en el mismo servicio casi nunca da una imagen idéntica — y no es un fallo. Por dentro hay un elemento de aleatoriedad (se llama seed), y además influye el modelo elegido: uno tira al fotorrealismo, otro al dibujo. Por eso conviene tratar el primer resultado como un borrador: generas varias variantes, eliges la más cercana, afinas la descripción, repites. Dos o tres iteraciones y la imagen "madura".
Checklist: “9 errores de principiante que hacen que la imagen salga mal”
Qué quitar de un prompt, qué palabras rompen el resultado y por qué “4k, ultra detailed” perjudica más a menudo de lo que ayuda.
Входит в подписку
Qué sigue
Hiciste tu primera imagen y viste que la calidad del resultado es la calidad de la descripción. El siguiente paso lógico es aprender a describir como un profesional: qué palabras funcionan, cómo marcar el estilo y la luz, cómo arreglar los artefactos típicos.
Puedes repetir todos los ejemplos en el chat de Twelver: la generación está integrada en la conversación — escribes como un mensaje normal, la imagen llega en la respuesta. Algunas generaciones son gratis tras registrarte.
Pruébalo tú mismo
Todo lo de esta guía funciona en Twelver
Un chat para texto, imágenes, vídeo, música y voz — sin servicios ni suscripciones aparte.
Abrir el chat de Twelver