IAs especializadas

Sitio: Plataforma de aprendizaje KZgunea
Curso: Inteligencia artificial, ChatGPT y sus alternativas
Libro: IAs especializadas
Imprimido por: Invitado
Día: martes, 22 de octubre de 2024, 17:50

1. Introducción

En el tema anterior hemos aprendido que las IAs pueden generar una amplia variedad de cosas, aparte de texto.

¿Qué se genera actualmente con las IAs?

  • Imágenes: Las IAs se pueden utilizar para generar imágenes realistas, a partir de descripciones de texto o de datos de imágenes existentes. Esta tecnología se utiliza en aplicaciones como la creación de contenido de entretenimiento, la creación de prototipos de productos y la investigación científica.
  • Sonidos: Las IAs se pueden utilizar para generar sonidos, a partir de descripciones de texto o de datos de sonido existentes. Esta tecnología se utiliza en aplicaciones como la creación de música, la creación de efectos de sonido y la investigación científica.
  • Código: Las IAs se pueden utilizar para generar código, a partir de descripciones de texto o de datos de código existentes. Esta tecnología se utiliza en aplicaciones como la automatización de tareas, el desarrollo de software y la investigación científica.
  • Diseños: Las IAs se pueden utilizar para generar diseños, a partir de descripciones de texto o de datos de diseños existentes. Esta tecnología se utiliza en aplicaciones como el diseño de productos, el diseño de interiores y la investigación científica.
  • Planos: Las IAs se pueden utilizar para generar planos, a partir de descripciones de texto o de datos de planos existentes. Esta tecnología se utiliza en aplicaciones como la construcción, la ingeniería y la investigación científica.

2. Imágenes

La IA está siendo usada cada vez más para crear imágenes; esta tecnología puede utilizarse para generar imágenes realistas a partir de descripciones de texto o de datos de imágenes existentes. 

Podemos distinguir dos principales tipos de IA que se utilizan para crear imágenes: 

  • IA de generación de imágenes a partir de texto: Este tipo de IA utiliza descripciones de texto para generar imágenes. Por ejemplo, se puede utilizar para generar imágenes de personas, lugares o cosas que no existen en la realidad. 
  • IA de transformación de imágenes: Este tipo de IA utiliza imágenes existentes para generar imágenes nuevas. Por ejemplo, se puede utilizar para convertir una imagen en blanco y negro, en una imagen en color, o para cambiar el estilo de una imagen.

Creación de imágenes a partir de texto 


Para crear imágenes a partir de texto, se utiliza un modelo de IA entrenado en un conjunto de datos de imágenes y texto. El modelo aprende a asociar las palabras con las características visuales de las imágenes. Para generar una imagen a partir de texto, se proporciona al modelo una descripción de la imagen que se desea crear. El modelo utiliza la descripción para generar una imagen que coincida con la descripción. 

Creación de imágenes a partir de imágenes

Para crear imágenes a partir de imágenes, se utiliza un modelo de IA entrenado en un conjunto de datos de imágenes. El modelo aprende a identificar las características visuales de las imágenes. Para generar una imagen a partir de otra imagen, se proporciona al modelo la imagen que se desea utilizar como base. El modelo utiliza la imagen base para generar una imagen nueva que tenga las mismas características visuales.

Existen muchas herramientas disponibles para crear imágenes con IA. Algunas de las herramientas más populares incluyen:

  • DALL-E 2: Esta herramienta de OpenAI puede generar imágenes realistas a partir de descripciones de texto.
  • VQGAN+CLIP: Esta herramienta de OpenAI puede generar imágenes a partir de imágenes existentes. 
  • Imagen2Image: Esta herramienta de Google AI puede convertir imágenes de un estilo a otro.
  • Bing generador de imágenes (basado en DALL-E).

Como generar una imagen:



Para este ejemplo usaremos el generador de imágenes de Microsoft Bing (basado en DALL-E) y, como hemos hecho anteriormente:

  • Nos dirigimos a la página oficial de creación de imágenes.
  • Nos registramos en la página. (con este registro podremos usar todas las herramientas de IA disponibles en Microsoft, recordemos que podemos usar también nuestra cuenta de Google para el registro y no tener que crear una cuenta para cada lugar).
  • Una vez hecho el registro, nos identificamos para poder empezar a usar la herramienta.
Problemas legales.

  • Derechos de autor: Las imágenes generadas por IA pueden estar sujetas a derechos de autor, incluso si no se basan en imágenes existentes. Esto significa que el creador de la imagen puede tener derecho a reclamar la propiedad de la imagen y a recibir una compensación por su uso.
  • Uso fraudulento: Las imágenes generadas por IA pueden utilizarse para cometer fraude, por ejemplo, para crear documentos falsos o para falsificar imágenes de personas. Esto puede tener consecuencias legales graves para los autores de las imágenes. 
  • Uso ilegal: Las imágenes generadas por IA pueden utilizarse para difundir contenido ilegal, por ejemplo, imágenes de violencia o pornografía. Esto puede violar las leyes de muchos países.

Problemas éticos.

  • Respeto a la privacidad: Las imágenes generadas por IA pueden utilizarse para crear imágenes de personas que existen. Estas imágenes pueden utilizarse para dañar la reputación de las personas o para difundir información falsa sobre ellas.
  • Discriminación: Las imágenes generadas por IA pueden reflejar los sesgos de los datos en los que se han entrenado. Esto puede dar lugar a la creación de imágenes que sean discriminatorias u ofensivas.
  • Manipulación de la opinión: Las imágenes generadas por IA pueden utilizarse para manipular la opinión pública. Por ejemplo, pueden utilizarse para crear imágenes que apoyen una determinada causa o para difundir información falsa sobre un evento.

Como nuestra intención es aprender a manejarnos en el mundo de las IAs, vamos a ver un ejemplo muy sencillo que será crear un plato con unos cuantos ingredientes:

  Por ejemplo, veamos que sucedería creado estas dos imágenes:

  • Mensaje A: "Pescador"
  • Mensaje B: "Una foto en primer plano de un pescador con un traje hecho de goma de color amarillo, con el mar de fondo, sosteniendo una caña de pescar, lleva un gorro de lana, que el dibujo sea realista y tirando a oscuro".



Fácil y sorprendente, ¿verdad?



3. Sonido e IAs de voz

Las IAs de voz son una forma de inteligencia artificial que pueden generar voces humanas a partir de texto. Actualmente, se utiliza en una gran cantidad de aplicaciones, que incluyen:

  • Texto a voz: Esta es la aplicación más común de la IA de voz. Se utiliza para convertir texto en voz humana, lo que puede ser útil para personas con discapacidades visuales o auditivas, o para crear contenido de audio como pódcast o audiolibros.
  • Asistentes virtuales: Los asistentes virtuales, como Siri, Alexa y Google Assistant, utilizan la IA de voz para interactuar con los usuarios. Pueden responder a preguntas, realizar tareas y proporcionar información.
  • Juegos: La IA de voz se utiliza en los juegos para crear personajes con voz realista. También se puede utilizar para proporcionar comentarios o instrucciones al jugador.
  • Entretenimiento: La IA de voz se utiliza para crear contenido de entretenimiento, como pódcast, audiolibros y música. También se puede utilizar para crear efectos de sonido y voces para películas y televisión.
  • Voz a Voz: Traducción simultanea al instante usando IA.

Veamos un ejemplo:

  • Nos dirigimos a la página elevenlabs.io.
  • La página está en inglés, pero podemos generar voces en prácticamente cualquier idioma.
  • Podemos usar la página sin registro, pero recomendamos registrarse si vamos a usarla de manera continua.
  • Copiamos y pegamos las primeras líneas de este tema para poder escuchar un ejemplo.
  • Pulsamos sobre el botón play.



Veámoslo en un ejemplo:

4. IAs de vídeo

Las IAs de vídeo son un tipo de inteligencia artificial que puede generar vídeos a partir de texto, imágenes o vídeos existentes. Se utilizan en una variedad de aplicaciones, que incluyen:

  • Creación de contenido de vídeo: Las IAs de vídeo se pueden utilizar para crear vídeos de forma rápida y sencilla, sin necesidad de experiencia en edición de vídeo. Pueden utilizarse para crear vídeos educativos, informativos, de entretenimiento o de cualquier otro tipo.
  • Análisis de vídeo: Las IAs de vídeo se pueden utilizar para analizar vídeos para detectar objetos, personas o actividades específicas. Esto puede utilizarse para una variedad de propósitos, como la seguridad, el marketing o la investigación científica.
  • Traducción de vídeo: Las IAs de vídeo se pueden utilizar para traducir vídeos de un idioma a otro. Esto puede ser útil para personas que no hablan el idioma original del vídeo.

Veamos un par de ejemplos de como crear distintos vídeos con AI:

  • Nos dirigimos a Flexclip.
  • Pulsamos sobre crear vídeo.
  • No es obligatorio registrarse actualmente, pero sí recomendable si queremos usar la plataforma de manera habitual.
  • Para nuestro ejemplo, seleccionamos texto a vídeo IA.
  • Escribimos un pequeño texto descriptivo (en nuestro caso un par de líneas sobre un pájaro).
  • Pulsamos sobre el botón "generar".
  • Dependiendo de lo exacta de la descripción, generará una serie de vídeos relacionados con esa descripción.


Si estamos interesados en esta materia podemos acceder a la página de Vidnoz AI.
  • Nos registramos en la página.
  • Desde el menú de "herramientas de IA gratis", seleccionamos "face swap".
  • Dentro de la sección tendremos la opción de cambiar caras en una foto o en un vídeo.
  • Para ver el funcionamiento de estas herramientas podemos pulsar en los vídeos/imágenes de ejemplo.

Interfaz Vidnoz

5. Recopilatorio de IAs

Antes de ponernos a practicar con IAs, vamos a ver un recopilatorio de aquellas más usadas actualmente junto con las que hemos visto en estas lecciones.

Recopilatorio de inteligencias artificiales
Categoría Nombre Enlace
Texto ChatGPT Pincha aquí
Texto Bard AI Pincha aquí
Vídeo e imagen FlexClip Pincha aquí
Video e imagen VidNoz Pincha aquí
Imagen Runwayml Pincha aquí
Imagen Craiyon (*) Pincha aquí
Texto (solo resúmenes) ChatPDF (*) Pincha aquí
Imagen myheritage Pincha aquí
Texto (solo fórmulas hojas de datos) Sheetplus Pincha aquí
Texto Jenni (*) Pincha aquí
Música Loudly Pincha aquí

(*) En inglés, aunque podemos usar las descripciones/instrucciones en castellano.