Google detalla nueva IA de generación de imágenes de vanguardia

Google detalla nueva IA de generación de imágenes de vanguardia

Google LLC hoy detallado Imagen, un sistema de inteligencia synthetic que puede generar automáticamente imágenes a partir de indicaciones de texto proporcionadas por un usuario.

En los últimos años, los investigadores han desarrollado múltiples redes neuronales capaces de generar imágenes automáticamente. Una de las entradas más sofisticadas en l. a. categoría es un sistema de IA llamado DALL-E 2 eso fue detallado por OpenAI LLC a principios de este año. Según Google, su sistema Imagen recientemente anunciado puede superar a DALL-E 2, así como a otros modelos de IA en l. a. categoría.

Imagen incluye dos redes neuronales separadas. El primero toma como entrada un fragmento de texto que describe qué imagen se debe dibujar. Los angeles pink neuronal convierte esta descripción en una forma que puede ser entendida por l. a. segunda pink neuronal de Imagen, que se encarga de dibujar l. a. imagen.

Para construir Imagen, Google se basó en una serie de avances clave en l. a. investigación de IA que se realizaron durante l. a. última década.

Los angeles primera pink neuronal en Imagen, que es responsable de traducir una descripción de texto a una forma que el sistema pueda entender, es l. a. llamada modelo de transformador. Los modelos de transformadores son un tipo de algoritmo de procesamiento de lenguaje herbal que fue inventado por Google en 2017. Pueden comprender el significado del texto con mayor precisión que los algoritmos anteriores.

Un modelo de Transformer se basa en el contexto para comprender el significado de las palabras en una oración. Analiza el texto que rodea una palabra, determina qué partes específicas del texto influyen más en el significado de l. a. palabra y las utiliza para tomar una decisión. El nuevo sistema Imagen de Google utiliza un modelo de Transformador para convertir l. a. descripción de una imagen proporcionada por un usuario en una representación matemática incrustada de datos que las redes neuronales pueden comprender.

Una vez que l. a. descripción de l. a. imagen se convierte en una incrustación, una segunda IA ​​integrada en Imagen l. a. u.s. para dibujar l. a. imagen correspondiente. Esta segunda IA ​​es una llamada modelo de difusiónun tipo de pink neuronal que se desarrolló por primera vez en 2015.

Estas redes neuronales difieren de otros algoritmos de generación de imágenes en l. a. forma en que se entrenan. Para entrenar un modelo de difusión, los ingenieros primero le proporcionan imágenes que contienen un tipo de error conocido como ruido gaussiano. Luego, el modelo de difusión tiene l. a. tarea de encontrar una forma de eliminar el ruido gaussiano.

Los investigadores de IA suelen utilizar un conjunto de datos llamado COCO para comparar l. a. eficacia de los algoritmos de generación de imágenes. Google cube que Imagen superó significativamente a los sistemas de inteligencia synthetic de l. a. competencia, incluido el sistema DALL-E 2 de vanguardia de OpenAI, en una prueba interna que utilizó COCO. Imagen también logró superar a l. a. competencia en una prueba separada basada en DrawBench, un nuevo punto de referencia desarrollado por Google.

El anuncio de Imagen de Google llega pocas semanas después de que el gigante de las búsquedas debutó PaLM, otra IA de vanguardia desarrollada por sus investigadores. Está diseñado para tareas de procesamiento de lenguaje herbal y presenta 540 mil millones de parámetros, los ajustes de configuración que ayudan a determinar cómo una pink neuronal toma decisiones. Según Google, PaLM puede superar a l. a. sofisticada pink neuronal GPT-3 de OpenAI al realizar ciertas tareas.

Imagen: Google

Muestre su apoyo a nuestra misión uniéndose a nuestra comunidad de expertos Dice Membership y Dice Tournament. Únase a l. a. comunidad que incluye Amazon Internet Services and products y el CEO de Amazon.com, Andy Jassy, ​​el fundador y CEO de Dell Applied sciences, Michael Dell, el CEO de Intel, Pat Gelsinger, y muchas más luminarias y expertos.

Pasaporte En Linea