Saltear al contenido principal

Google lanza Gemini, su modelo de IA más potente que supera a los expertos humanos en MMLU

google-gemini

Google dio su próximo salto en inteligencia artificial el miércoles con el lanzamiento del proyecto Gemini, un modelo de inteligencia artificial  entrenado para comportarse  de forma humana que probablemente intensificará el debate sobre las posibles promesas y peligros de la tecnología.

El lanzamiento se desarrollará en fases, con versiones menos sofisticadas de Gemini llamadas “Nano” y “Pro” que se incorporarán inmediatamente al chatbot Bard de Google  y su teléfono inteligente  Pixel 8 Pro.

Con la ayuda de Gemini, Google promete que Bard será más intuitivo y mejor en las tareas que implican planificación. En el Pixel 8 Pro, Gemini podrá resumir rápidamente las grabaciones realizadas en el dispositivo y proporcionar respuestas automáticas en los servicios de mensajería, empezando por WhatsApp, según Google.

Los mayores avances de Gemini no llegarán hasta principios del próximo año, cuando su modelo Ultra se utilizará para lanzar “Bard Advanced“, una versión mejorada del chatbot que inicialmente sólo se ofrecerá a una audiencia de prueba.

google-gemini

La IA, al principio, sólo funcionará en inglés en todo el mundo, aunque los ejecutivos de Google aseguraron a los periodistas durante una sesión informativa que la tecnología no tendrá problemas para diversificarse eventualmente hacia otros idiomas.

Basado en una demostración de Gemini para un grupo de reporteros, “Bard Advanced” de Google podría ser capaz de realizar múltiples tareas con IA sin precedentes al reconocer y comprender simultáneamente presentaciones que involucran texto, fotos y video.

Gemini también eventualmente se incorporará al motor de búsqueda dominante de Google, aunque el momento de esa transición aún no se ha detallado.

“Este es un hito importante en el desarrollo de la IA y el comienzo de una nueva era para nosotros en Google“,  declaró Demis Hassabis, director ejecutivo de Google DeepMind, la división de IA detrás de Gemini. Google prevaleció sobre otros postores, incluida la matriz de Facebook, Meta, para adquirir DeepMind, con sede en Londres, hace casi una década, y desde entonces la fusionó con su división “Brain” para centrarse en el desarrollo de Gemini.

Google está promocionando las habilidades de resolución de problemas de la tecnología como especialmente hábil en matemáticas y física, alimentando esperanzas entre los optimistas de la IA de que puede conducir a avances científicos que mejoren la vida de los humanos.

Dato:

Asimismo, Google ha revelado que Gemini Ultra redefine los estándares en el campo de la inteligencia artificial. Este modelo avanzado se distingue por su capacidad excepcional para procesar y comprender imágenes, audios y videos naturales, así como en su habilidad para realizar razonamientos matemáticos. De acuerdo con los informes, Gemini Ultra ha logrado superar los resultados previamente establecidos por modelos de última generación en 30 de los 32 puntos de referencia académicos, los cuales son considerados pilares en la investigación y desarrollo de Modelos de Lenguaje de Gran Escala (LLM).

También te puede interesar:   Google predice que el factor de clasificación de los backlinks disminuirá

La empresa ha informado que Gemini Ultra ha alcanzado un hito significativo, obteniendo una puntuación del 90,0% en MMLU (Comprensión Masiva de Lenguajes Multitarea). Este logro es particularmente notable dado que es la primera vez que un modelo sobrepasa la habilidad de expertos humanos en esta área. MMLU es una prueba rigurosa que combina 57 materias diversas, incluyendo matemáticas, física, historia, derecho, medicina y ética, para evaluar de manera integral tanto el conocimiento como las habilidades de resolución de problemas.

Además, Gemini Ultra ha establecido un nuevo estándar en el punto de referencia MMMU (Multimodal Multi-task Understanding), alcanzando una puntuación destacada del 59,4%. Este benchmark abarca tareas que involucran múltiples modalidades y requieren un razonamiento deliberado y profundo en diferentes dominios. Este avance subraya la capacidad de Gemini Ultra para liderar y transformar el panorama de la inteligencia artificial en la actualidad.

Pero a un lado opuesto del debate sobre la IA le preocupa que la tecnología eventualmente eclipse la inteligencia humana, lo que resultaría en la pérdida de millones de empleos y tal vez comportamientos aún más destructivos, como amplificar la información errónea o desencadenar el despliegue de armas nucleares.

Estamos abordando este trabajo con audacia y responsabilidad“,  escribió el director ejecutivo de Google, Sundar Pichai, en una publicación de blog . “Eso significa ser ambiciosos en nuestra investigación y buscar capacidades que traerán enormes beneficios a las personas y a la sociedad, al mismo tiempo que incorporamos salvaguardias y trabajamos en colaboración con gobiernos y expertos para abordar los riesgos a medida que la IA se vuelve más capaz”.

Es probable que la llegada de Gemini suba la apuesta en una  competencia de IA  que se ha ido intensificando durante el último año, con la startup OpenAI de San Francisco y su rival de la industria desde hace mucho tiempo, Microsoft.

Respaldado por la fuerza financiera y el poder informático de Microsoft, OpenAI ya estaba profundamente inmerso en el desarrollo de su modelo de IA más avanzado, GPT-4, cuando lanzó la herramienta gratuita ChatGPT a fines del año pasado. Ese chatbot impulsado por IA saltó a la fama mundial, generando rumores sobre la promesa comercial de la IA generativa y presionando a Google para que expulsara a Bard en respuesta.

Justo cuando Bard llegaba a escena,  OpenAI lanzó GPT-4 en marzo  y desde entonces ha estado desarrollando nuevas capacidades dirigidas a consumidores y clientes comerciales, incluida una función presentada en noviembre que permite al chatbot analizar imágenes. Ha estado compitiendo por negocios contra otras startups rivales de IA como Anthropic e incluso su socio, Microsoft, que tiene derechos exclusivos sobre la tecnología de OpenAI a cambio de los miles de millones de dólares que ha invertido en la startup.

También te puede interesar:   Qué afecta el contrato de Google con Appen en el servicio de su motor de Búsqueda

Hasta ahora, la alianza ha sido una bendición para Microsoft, cuyo valor de mercado ha aumentado más del 50% en lo que va del año, principalmente debido a la creencia de los inversores de que la IA se convertirá en una mina de oro para la industria tecnológica. La empresa matriz de Google, Alphabet, también ha estado siguiendo la misma ola: su valor de mercado ha aumentado más de 500.000 millones de dólares, o alrededor del 45%, en lo que va del año. A pesar de la anticipación que rodea a Gemini en los últimos meses, las acciones de Alphabet cayeron ligeramente en las operaciones del miércoles.

La participación cada vez más profunda de Microsoft en OpenAI durante el año pasado, junto con los intentos más agresivos de OpenAI de comercializar sus productos, ha generado preocupaciones de que la organización sin fines de lucro se haya desviado de su misión original de proteger a la humanidad a medida que avanza la tecnología.

Esas preocupaciones se magnificaron el mes pasado cuando  la junta directiva de OpenAI despidió abruptamente  al director ejecutivo Sam Altman en una disputa que giraba en torno a cuestiones de confianza no reveladas. Después de una reacción que amenazó con destruir la empresa y provocar un éxodo masivo de talentos de ingeniería de IA a Microsoft,  OpenAI recuperó a Altman como director ejecutivo  y reorganizó su junta directiva.

Con la salida de Gemini, OpenAI puede encontrarse tratando de demostrar que su tecnología sigue siendo más inteligente que la de Google.

“Estoy asombrado de lo que es capaz de hacer”, dijo Eli Collins, vicepresidente de producto de Google DeepMind, sobre Gemini.

En una conferencia de prensa virtual, Google se negó a compartir el recuento de parámetros de Gemini, una, pero no la única, medida de la complejidad de un modelo. Un  documento técnico  publicado el miércoles describió la versión más capaz de Gemini superando a GPT-4 en exámenes de opción múltiple, matemáticas de escuela primaria y otros puntos de referencia, pero reconoció las dificultades actuales para lograr que los modelos de IA alcancen habilidades de razonamiento de mayor nivel.

Algunos científicos informáticos ven límites en lo que se puede hacer con modelos de lenguaje grandes, que funcionan prediciendo repetidamente la siguiente palabra en una oración y son propensos a inventar errores conocidos como alucinaciones.

“Hicimos un gran progreso en lo que se llama factualidad con Gemini. Así que Gemini es nuestro mejor modelo en ese sentido. Pero todavía es, yo diría, un problema de investigación sin resolver”, dijo Collins.

Calificar

Blogger y Especialista SEO LATAM, me gusta ayudar creando contenidos sobre SEO, Marketing Online y Tendencias Digitales. Trabajo como apoyo en varias agencias SEO & digitales en todo LATAM, como también realizo asesorías y campañas SEO Internacional en Argentina, Colombia, Chile, México, Perú, España y Estados Unidos. Como profesional de SEO & Marketing Online, brindo todo lo mejor para cumplir los objetivos deseados para cada negocio y empresa a través de campañas orgánicas. Sígueme en Twitter @Fotosarnold.

También te puede interesar...
banner hablemos de seo
Suscríbete a Nuestro Newsletter

No te pierdas las últimas actualizaciones sobre SEO y Marketing Online, manténte notificado y entérate todo con las mejores noticias!

Comentarios

Esta entrada tiene 0 comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Volver arriba