Google ha desvelado Gemini, su innovadora inteligencia artificial multimodal; será parte integral de Bard, su rival de ChatGPT, y promete superar a otros modelos en rendimiento.

Google ha revelado la introducción de Gemini, su primera Inteligencia Artificial (IA) multimodal en su versión 1.0. Esta IA se divide en tres variantes – Gemini Ultra, Gemini Pro y Gemini Nano – para adaptarse a diferentes usos, desde dispositivos móviles hasta centros de datos.

En marzo, se informó desde The Information que el equipo de IA de Google y DeepMind estaban desarrollando un proyecto para desafiar y potencialmente superar a ChatGPT. Este proyecto, conocido internamente como Gemini, unifica los equipos de IA de Alphabet, la empresa matriz de Google, para forjar un nuevo modelo de IA.

Presentación de Gemini

Google ha lanzado oficialmente Gemini (1.0), un modelo de IA que marca el comienzo de una “nueva era de modelos” y es descrito como uno de los mayores logros de Google en ciencia e ingeniería, según declaraciones del CEO Sundar Pichai.

Demis Hassabis, CEO y cofundador de Google DeepMind, ha destacado que Gemini fue diseñado desde cero para ser intrínsecamente multimodal, capaz de entender, operar y fusionar sin problemas distintos tipos de información, incluyendo texto, código, audio, imagen y video.

Gemini también destaca por su flexibilidad, funcionando eficientemente tanto en centros de datos como en dispositivos móviles, adaptándose en tres tamaños distintos.

Gemini Ultra es la versión más avanzada, diseñada para tareas extremadamente complejas. Google también indica que Gemini Pro es ideal para una amplia gama de tareas, mientras que Gemini Nano está optimizado para eficiencia en dispositivos móviles.

Capacidades de Gemini

Rendimiento Superior al Humano Google ha informado que Gemini Ultra ha superado los estándares actuales en 30 de los 32 benchmarks académicos usados en la investigación y desarrollo de modelos de lenguaje de gran escala (LLM).

Además, esta versión de la nueva IA de Google ha sobrepasado a expertos humanos en la comprensión masiva de lenguajes multitarea (MMLU) con un 90%, cubriendo 57 disciplinas como matemáticas, física, historia, derecho y medicina.

En cuanto a los benchmarks de imágenes probados, Gemini Ultra ha “superado a los modelos anteriores de última generación” sin necesidad de sistemas de reconocimiento óptico de caracteres (OCR), que extraen texto para procesarlo.

Gemini, la innovadora IA multimodal de Google, destaca en el procesamiento y análisis de información, prometiendo avances significativos en múltiples sectores.

Google ha presentado Gemini, una Inteligencia Artificial (IA) multimodal que se destaca por su habilidad para procesar y analizar información de “cientos de miles de documentos”. Esta capacidad le permite leer, filtrar y comprender datos de manera eficiente, lo que Google espera que impulse progresos significativos en áreas diversas, desde la ciencia hasta las finanzas.

Gemini en su primera versión puede entender, explicar y generar código de alta calidad en lenguajes de programación ampliamente utilizados como Python, Java, C++ y Go. Además, se emplea como base para sistemas de codificación avanzados como AlphaCode 2, que resuelven problemas de programación complejos, incluyendo matemáticas avanzadas e informática teórica.

Integración en Bard y Pixel 8

La versión 1.0 de Gemini se está integrando en varios productos y plataformas de Google. Bard, en particular, incorporará una versión mejorada de Gemini Pro para mejorar sus capacidades de razonamiento, planificación y comprensión.

Gemini también llegará a la línea Pixel, específicamente al Pixel 8 Pro con la versión Gemini Nano, para potenciar características como la función ‘Resumir’ en la aplicación Grabadora y la ‘Respuesta inteligente’ en Gboard.

En los próximos meses, Gemini se incluirá en otros servicios de Google, como Búsqueda, Anuncios, Chrome y Duet AI. Además, se está probando para acelerar la Experiencia Generativa de Búsqueda (SGE) para los usuarios.

A partir del 13 de diciembre, los desarrolladores tendrán acceso a Gemini Pro a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI.

En cuanto a Gemini Ultra, Google está llevando a cabo “exhaustivas comprobaciones de confianza y seguridad”, que incluyen la colaboración con equipos externos y la mejora del modelo mediante el método de Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *