Google dio su próximo salto en inteligencia artificial el miércoles con el lanzamiento del proyecto Gemini, un modelo de inteligencia artificial entrenado para comportarse de forma humana que probablemente intensificará el debate sobre las posibles promesas y peligros de la tecnología.
El lanzamiento se desarrollará en fases, con versiones menos sofisticadas de Gemini llamadas “Nano” y “Pro” que se incorporarán inmediatamente al chatbot Bard de Google y su teléfono inteligente Pixel 8 Pro.
Con la ayuda de Gemini, Google promete que Bard será más intuitivo y mejor en las tareas que implican planificación. En el Pixel 8 Pro, Gemini podrá resumir rápidamente las grabaciones realizadas en el dispositivo y proporcionar respuestas automáticas en los servicios de mensajería, empezando por WhatsApp, según Google.
Los mayores avances de Gemini no llegarán hasta principios del próximo año, cuando su modelo Ultra se utilizará para lanzar “Bard Advanced“, una versión mejorada del chatbot que inicialmente sólo se ofrecerá a una audiencia de prueba.
La IA, al principio, sólo funcionará en inglés en todo el mundo, aunque los ejecutivos de Google aseguraron a los periodistas durante una sesión informativa que la tecnología no tendrá problemas para diversificarse eventualmente hacia otros idiomas.
Basado en una demostración de Gemini para un grupo de reporteros, “Bard Advanced” de Google podría ser capaz de realizar múltiples tareas con IA sin precedentes al reconocer y comprender simultáneamente presentaciones que involucran texto, fotos y video.
Gemini también eventualmente se incorporará al motor de búsqueda dominante de Google, aunque el momento de esa transición aún no se ha detallado.
“Este es un hito importante en el desarrollo de la IA y el comienzo de una nueva era para nosotros en Google“, declaró Demis Hassabis, director ejecutivo de Google DeepMind, la división de IA detrás de Gemini. Google prevaleció sobre otros postores, incluida la matriz de Facebook, Meta, para adquirir DeepMind, con sede en Londres, hace casi una década, y desde entonces la fusionó con su división “Brain” para centrarse en el desarrollo de Gemini.
Google está promocionando las habilidades de resolución de problemas de la tecnología como especialmente hábil en matemáticas y física, alimentando esperanzas entre los optimistas de la IA de que puede conducir a avances científicos que mejoren la vida de los humanos.
Dato:
Asimismo, Google ha revelado que Gemini Ultra redefine los estándares en el campo de la inteligencia artificial. Este modelo avanzado se distingue por su capacidad excepcional para procesar y comprender imágenes, audios y videos naturales, así como en su habilidad para realizar razonamientos matemáticos. De acuerdo con los informes, Gemini Ultra ha logrado superar los resultados previamente establecidos por modelos de última generación en 30 de los 32 puntos de referencia académicos, los cuales son considerados pilares en la investigación y desarrollo de Modelos de Lenguaje de Gran Escala (LLM).
La empresa ha informado que Gemini Ultra ha alcanzado un hito significativo, obteniendo una puntuación del 90,0% en MMLU (Comprensión Masiva de Lenguajes Multitarea). Este logro es particularmente notable dado que es la primera vez que un modelo sobrepasa la habilidad de expertos humanos en esta área. MMLU es una prueba rigurosa que combina 57 materias diversas, incluyendo matemáticas, física, historia, derecho, medicina y ética, para evaluar de manera integral tanto el conocimiento como las habilidades de resolución de problemas.
Además, Gemini Ultra ha establecido un nuevo estándar en el punto de referencia MMMU (Multimodal Multi-task Understanding), alcanzando una puntuación destacada del 59,4%. Este benchmark abarca tareas que involucran múltiples modalidades y requieren un razonamiento deliberado y profundo en diferentes dominios. Este avance subraya la capacidad de Gemini Ultra para liderar y transformar el panorama de la inteligencia artificial en la actualidad.
Pero a un lado opuesto del debate sobre la IA le preocupa que la tecnología eventualmente eclipse la inteligencia humana, lo que resultaría en la pérdida de millones de empleos y tal vez comportamientos aún más destructivos, como amplificar la información errónea o desencadenar el despliegue de armas nucleares.
“Estamos abordando este trabajo con audacia y responsabilidad“, escribió el director ejecutivo de Google, Sundar Pichai, en una publicación de blog . “Eso significa ser ambiciosos en nuestra investigación y buscar capacidades que traerán enormes beneficios a las personas y a la sociedad, al mismo tiempo que incorporamos salvaguardias y trabajamos en colaboración con gobiernos y expertos para abordar los riesgos a medida que la IA se vuelve más capaz”.
Es probable que la llegada de Gemini suba la apuesta en una competencia de IA que se ha ido intensificando durante el último año, con la startup OpenAI de San Francisco y su rival de la industria desde hace mucho tiempo, Microsoft.
Respaldado por la fuerza financiera y el poder informático de Microsoft, OpenAI ya estaba profundamente inmerso en el desarrollo de su modelo de IA más avanzado, GPT-4, cuando lanzó la herramienta gratuita ChatGPT a fines del año pasado. Ese chatbot impulsado por IA saltó a la fama mundial, generando rumores sobre la promesa comercial de la IA generativa y presionando a Google para que expulsara a Bard en respuesta.
Justo cuando Bard llegaba a escena, OpenAI lanzó GPT-4 en marzo y desde entonces ha estado desarrollando nuevas capacidades dirigidas a consumidores y clientes comerciales, incluida una función presentada en noviembre que permite al chatbot analizar imágenes. Ha estado compitiendo por negocios contra otras startups rivales de IA como Anthropic e incluso su socio, Microsoft, que tiene derechos exclusivos sobre la tecnología de OpenAI a cambio de los miles de millones de dólares que ha invertido en la startup.
Hasta ahora, la alianza ha sido una bendición para Microsoft, cuyo valor de mercado ha aumentado más del 50% en lo que va del año, principalmente debido a la creencia de los inversores de que la IA se convertirá en una mina de oro para la industria tecnológica. La empresa matriz de Google, Alphabet, también ha estado siguiendo la misma ola: su valor de mercado ha aumentado más de 500.000 millones de dólares, o alrededor del 45%, en lo que va del año. A pesar de la anticipación que rodea a Gemini en los últimos meses, las acciones de Alphabet cayeron ligeramente en las operaciones del miércoles.
La participación cada vez más profunda de Microsoft en OpenAI durante el año pasado, junto con los intentos más agresivos de OpenAI de comercializar sus productos, ha generado preocupaciones de que la organización sin fines de lucro se haya desviado de su misión original de proteger a la humanidad a medida que avanza la tecnología.
Esas preocupaciones se magnificaron el mes pasado cuando la junta directiva de OpenAI despidió abruptamente al director ejecutivo Sam Altman en una disputa que giraba en torno a cuestiones de confianza no reveladas. Después de una reacción que amenazó con destruir la empresa y provocar un éxodo masivo de talentos de ingeniería de IA a Microsoft, OpenAI recuperó a Altman como director ejecutivo y reorganizó su junta directiva.
Con la salida de Gemini, OpenAI puede encontrarse tratando de demostrar que su tecnología sigue siendo más inteligente que la de Google.
“Estoy asombrado de lo que es capaz de hacer”, dijo Eli Collins, vicepresidente de producto de Google DeepMind, sobre Gemini.
En una conferencia de prensa virtual, Google se negó a compartir el recuento de parámetros de Gemini, una, pero no la única, medida de la complejidad de un modelo. Un documento técnico publicado el miércoles describió la versión más capaz de Gemini superando a GPT-4 en exámenes de opción múltiple, matemáticas de escuela primaria y otros puntos de referencia, pero reconoció las dificultades actuales para lograr que los modelos de IA alcancen habilidades de razonamiento de mayor nivel.
Algunos científicos informáticos ven límites en lo que se puede hacer con modelos de lenguaje grandes, que funcionan prediciendo repetidamente la siguiente palabra en una oración y son propensos a inventar errores conocidos como alucinaciones.
“Hicimos un gran progreso en lo que se llama factualidad con Gemini. Así que Gemini es nuestro mejor modelo en ese sentido. Pero todavía es, yo diría, un problema de investigación sin resolver”, dijo Collins.
Esta entrada tiene 0 comentarios