Actualización Google Gemini 1.5 Pro: Escucha, aprende y mejora
Google Gemini 1.5 Pro: Un paso adelante
Ahora, el modelo Google Gemini 1.5 Pro es capaz de reverberar con lo que oye. Se ha mejorado para escuchar archivos de audio cargados y destilar información de cosas como las llamadas de ganancias o el audio de los videos, y todo esto sin tener que remitirse a un guion o transcripción escrita. Por ejemplo, si una empresa publica su llamada de ganancias en audio, Gemini 1.5 Pro puede escucharlo y resumir los puntos clave, todo sin necesidad de un documento de texto.
Durante su evento Google Next, Google también anunció que pondrá a disposición del público por primera vez a Gemini 1.5 Pro a través de su plataforma para construir aplicaciones de inteligencia artificial, Vertex AI. Gemini 1.5 Pro, anunciado por primera vez en febrero, es un paso adelante significativo para Google. Según informes de TechCrunch, esta nueva versión del modelo medio de la familia Gemini ya supera en rendimiento al modelo más grande y potente, Gemini Ultra.
Lo realmente impresionante de Gemini 1.5 Pro es que puede entender instrucciones complicadas y elimina la necesidad de ajustar los modelos finamente, es decir, es más autónomo y eficiente. Por ejemplo, si le das a Gemini 1.5 Pro una serie de instrucciones complejas sobre cómo clasificar y organizar los datos, puede realizar la tarea sin requerir ajustes adicionales. Esto representa un gran ahorro de tiempo y recursos para los desarrolladores.
Gemini 1.5 Pro: Más allá del chatbot y actualización a modelos existentes
Ahora bien, es importante mencionar que Gemini 1.5 Pro no está disponible para personas sin acceso a Vertex AI. En la actualidad, la mayoría de las personas interactúan con los modelos de lenguaje Gemini a través del chatbot Gemini. Gemini Ultra alimenta el chatbot avanzado de Gemini y, aunque es poderoso y también capaz de entender comandos largos, no es tan rápido como Gemini 1.5 Pro. Por ejemplo, si estás utilizando el chatbot de Gemini para hacer preguntas complejas, es probable que recibas las respuestas más rápidamente si estás utilizando Gemini 1.5 Pro en lugar de Gemini Ultra.
Aparte, Google no solo actualizó a Gemini 1.5 Pro, sino también a otros modelos de IA de gran tamaño. Imagen 2, el modelo de generación de texto a imagen que ayuda a potenciar las capacidades de generación de imágenes de Gemini, también recibió adiciones interesantes. Por ejemplo, agregaron funcionalidades de 'inpainting' y 'outpainting', que permiten a los usuarios agregar o eliminar elementos de las imágenes. También introdujeron el nuevo SynthID, una función de marca de agua digital que se aplica a todas las imágenes creadas a través de los modelos de Imagen.
Colectivamente, estas mejoras hacen que los modelos de imagen de Google sean más versátiles y efectivos. Muchas de las nuevas funciones de Imagen, como 'inpainting' y 'outpainting', han sido parte de otros modelos de texto a imagen como Stability AI's Stable Cascade y Getty's Generativo AI de iStock. Google también es consciente de la necesidad de respuestas actualizadas, por lo que está trabajando en formas de vincular sus respuestas de IA con Google Search para que respondan con información actualizada, un punto crítico especialmente en conversaciones sobre eventos actuales.
La actualización de estos modelos de Google es un testimonio del progreso rápido y constante de la inteligencia artificial, y sin lugar a dudas, debe ser emocionante para los usuarios ver cómo estas tecnologías pueden mejorar aún más nuestras vidas cotidianas.