DestacadosInteligencia Artificial

Google presenta Inteligencia Artificial Gemini y supera a GPT-4 de OpenAI, éste es su potencial

Google reservará la versión Ultra para 2024.

La competencia en el ámbito de la inteligencia artificial (IA) se ha vuelto una carrera frenética por la supremacía. En medio de los avances continuos en ChatGPT, que ha alcanzado su cuarta versión, y los sucesivos anuncios de gigantes multinacionales sobre sus propios sistemas, Google ha sorprendido al mundo este miércoles con el lanzamiento de Gemini.

Google presenta Inteligencia Artificial Gemini y supera a GPT-4 de OpenAI, éste es su potencial

Google reserva la versión Ultra para 2024

Esta plataforma de inteligencia artificial multimodal tiene la capacidad de procesar y generar texto, código, imágenes, audio y vídeo a partir de diversas fuentes de datos.

La versión Ultra, programada para su lanzamiento a principios del próximo año, según Eli Collins, vicepresidente de productos en Google DeepMind, supera a los humanos en la comprensión masiva del lenguaje multitarea (MMLU).

Este estándar de evaluación se ha construido a partir de 57 materias que abarcan ciencias, tecnología, ingeniería, matemáticas (STEM), humanidades y ciencias sociales, estableciendo así un nuevo hito en la capacidad de las máquinas para abordar tareas complejas en diversos campos del conocimiento.

Más que una Inteligencia Artificial

Collins asegura que Gemini “representa nuestro modelo de inteligencia artificial más grande y competente, inspirado en la manera en que las personas comprenden y se relacionan con el mundo.”

Describiéndolo como más parecido a un colaborador útil que a una simple pieza de programación inteligente, destaca la orientación hacia una interacción más natural y efectiva con los usuarios.

Durante la presentación, Gemini demostró su capacidad al identificar una forma geométrica, analizar la fórmula para determinar su área y corregir un error en la misma, ofreciendo una solución precisa al problema.

Texto, imágenes, voz, Gemini te entenderá

De esta manera, la plataforma puede generar resultados a partir de datos de imágenes, texto alfanumérico y voz.

Además, ha sido capaz de reconocer diversas formas y dibujos, algunos basados únicamente en puntos dispersos, proponiendo usos para las figuras u objetos presentados, elaborando relatos a partir de propuestas alternativas y creando gráficos actualizados con la información obtenida por la propia plataforma.

Según el vicepresidente de DeepMind, Gemini ha alcanzado una puntuación superior al 90% en MMLU, el sistema de evaluación para la comprensión del lenguaje multitarea. “Es el primer modelo de inteligencia artificial que supera a los expertos humanos en este estándar de la industria”, afirmó.

Bard y su buscador con esteroides

Gemini también ha superado con éxito (59,4%) el examen de comprensión de tareas multimodales que incluyen demandas que requieren un razonamiento deliberado”.

Esta IA no se limita a ser una simple aplicación; es una plataforma diseñada para integrar el último modelo de inteligencia artificial en los servicios existentes, que van desde Bard, la competencia de ChatGPT, hasta el motor de búsqueda, los gestores de servicios, los dispositivos móviles con Android y los centros de datos a gran escala.

Con el propósito de facilitar esta integración, Gemini estará disponible en tres variantes distintas: Nano, que ya está disponible para los desarrolladores de Android; Pro, programado para su lanzamiento a partir del 13 de diciembre; y Ultra, que se implementará a principios del próximo año en una fecha aún por determinar.

Cumpliendo con la normativa europea

Sissie Hsiao, encargada de asistentes y Bard, ha anunciado la integración de Gemini en este último servicio de chat en inglés, disponible actualmente para 180 países.

Esta incorporación se extenderá gradualmente a otros idiomas, aunque Hsiao ha reconocido la necesidad de confirmar la compatibilidad con la próxima normativa europea sobre inteligencia artificial, que regula estas plataformas de diálogo. Con la inclusión en Bard, Gemini se extenderá automáticamente a todas las aplicaciones compatibles.

El proceso se llevará a cabo en dos fases: la primera fase utilizará una versión de Pro, que proporcionará al chat capacidades avanzadas de razonamiento, planificación y comprensión, según Hsiao.

Mejor entrenamiento para mejores resultados

Gemini ha sido concebido como un sistema multimodal desde su inicio, lo que significa que no se ha entrenado con distintas modalidades de datos para luego unificar sus capacidades diferenciadas.

En cambio, su programación se ha diseñado desde el principio para abarcar la diversidad de fuentes. Según explica Collins, “esto permite a Gemini comprender sin problemas una amplia variedad de entradas mucho mejor que los modelos existentes, destacando así sus capacidades de última generación”.

Además, la plataforma tiene la capacidad de programar, incluyendo desarrollos complejos. En este contexto, Amin Vahdat, vicepresidente en Google Cloud, afirma:

“En el futuro, veremos a los programadores emplear modelos de IA de alta capacidad como herramientas colaborativas que asisten en todo el proceso de desarrollo de software, desde el análisis de problemas hasta el soporte en la implementación, el rendimiento y las capacidades”.

Cumple con principios éticos para IA

En cuanto a la seguridad, Google sostiene que Gemini supera “las evaluaciones más exhaustivas realizadas hasta la fecha” en comparación con otros modelos.

La empresa asegura haber sometido la plataforma a análisis exhaustivos de todos los riesgos existentes y potenciales, manteniendo un examen continuo que incluye “pruebas de estrés”. Además, se han aplicado los principios éticos de inteligencia artificial de la propia compañía, estableciendo así las normas éticas para el desarrollo de sus tecnologías.

A pesar de los notables avances, los responsables de Gemini reconocen que la plataforma no es infalible. Admiten que pueden surgir errores y alucinaciones (respuestas que aparentan ser seguras pero que no están respaldadas por datos).

Artículos relacionados

Back to top button