Duelo entre ChatGPT vs Gemini

La apasionante competición entre las IAs de los buscadores. En nuestro artículo analizamos en qué se diferencian las declaraciones de ChatGPT 3.5 de las generadas por Gemini en términos de calidad y veracidad. Nuestra comparación aporta datos interesantes.

El revuelo en torno a la IA generativa comenzó a principios de 2023, cuando ChatGPT de OpenAI (chat.openai.com) entró en escena y presionó a las grandes corporaciones. Mientras Microsoft compraba OpenAI por muchos miles de millones de dólares, Google desarrollaba su propio producto. Sin embargo, Bard cometió un grave error durante la primera demostración, por lo que Google rebautizó el desarrollo posterior como Gemini (gemini.google.com).

Leer: Proyector vs televisor: ¿Cuál es la mejor opción para tus tardes de cine y videojuegos?

Una diferencia radica en las fuentes de datos. Gemini obtiene continuamente información de Internet y, por tanto, dispone de la información más reciente. En la versión gratuita, ChatGPT no tiene en cuenta nada que haya tenido lugar después de enero de 2022. Como resultado, no puede responder a la pregunta «¿Quién fue el campeón de Champions en 2023?». Gemini, en cambio, lo sabe: «El campeón de la UEFA Champions league de 2022/2023 fue el Manchester City Football Club. Ganaron el campeonato con una victoria por 1:0 ante el Inter de Milán «.

Gemini puede emitir imágenes y nombrar las fuentes que ha utilizado. ChatGPT, por su parte, recuerda las preguntas formuladas y permite una conversación basada en respuestas anteriores. Seis preguntas ilustran el rendimiento de los dos contrincantes en distintas áreas.

La primera disciplina consiste en proporcionar datos certeros

Para averiguar cómo difieren las respuestas a preguntas sobre hechos, se utiliza la pregunta «¿Quién inventó la bombilla? ChatGPT responde que Thomas Edison inventó la primera bombilla práctica y la patentó en 1880, pero señala que otros inventores como Humphry Davy, Warren de la Rue, Joseph Swan y Heinrich Göbel estaban trabajando en tecnologías similares.

Gemini afirma que la pregunta no es tan fácil de responder: «A menudo se cita a Thomas Alva Edison como el inventor de la bombilla, y esto es cierto en la medida en que produjo la primera lámpara de filamento de carbono en 1879, que ardía brillantemente y durante varios días. Edison fue también quien hizo que la bombilla tuviera éxito comercial. Sin embargo, antes de Edison hubo muchos otros inventores que ya habían desarrollado bombillas. Ya en 1835, el escocés James Bowman Lindsay presentó la primera bombilla experimental. En 1841, el inglés Frederick de Moleyns recibió la que probablemente fue la primera patente de una bombilla incandescente».

La comprobación de los hechos muestra que el químico Davy se dedicó a las lámparas de arco, pero no a las bombillas. Warren de la Rue era astrónomo. Sólo Swan y Göbel investigaron en este campo, pero faltan los nombres correspondientes. La respuesta de Géminis no tiene nada de malo. Punto a favor de Géminis.

Ahora toca mostrar creatividad y escribir un poema

La segunda disciplina es la creatividad. La tarea: «Escribe un poema corto para mi hija, a la que le gustan los perros, escalar y leer libros».

ChatGPT da salida a cuatro párrafos de cuatro versos cada uno. El primer verso dice: «En un jardín, a lo lejos y a lo ancho, una niña retoza, llena de alegría. Con una sonrisa tan maravillosa, disfruta de cada hora».

El poema de Géminis es mucho más corto y empieza así: «Amante de los perros, ratón trepador, ratón de biblioteca, lee en casa. Con la nariz peluda a su lado, sube todas las escaleras».

Los versos de ChatGPT son más creativos y convincentes en cuanto a contenido, alcance y lenguaje. Punto para ChatGPT.

La siguiente tarea consiste en resumir textos y otros medios de comunicación

La pregunta «Resuma el libro Dune de Frank Herbert en 1000 palabras» revela distintos enfoques.

Gemini divide las respuestas en varias secciones que resumen los puntos clave de la trama, por ejemplo: «Las Bene Gesserit son una poderosa hermandad que lleva siglos manipulando las líneas de sangre del universo para crear un Kwisatz Haderach, un líder mesiánico que, según se dice, posee habilidades sobrehumanas». También hay una referencia casi irónica al hecho de que 1.000 palabras apenas bastan para resumir la compleja obra y que el ciclo de novelas consta de seis volúmenes.

ChatGPT carece de todo esto y sólo resume el contenido muy superficialmente. Por ejemplo, dice: «La madre de Paul, Lady Jessica, pertenece a la orden Bene Gesserit, una misteriosa organización hermana con habilidades mentales y físicas». ChatGPT no revela cuáles son estas habilidades. Punto para Géminis.

Leer: Tipos de puertos de computadora

Explicar cuestiones técnicas de forma comprensible

La siguiente tarea es explicar cuestiones técnicas. Con la pregunta «Explica cómo funciona un LED», ambos ofrecen un resultado convincente y explican de forma concluyente el concepto de un LED, utilizando a veces términos incómodos como «band gap» o «reflector well». No obstante, ambos señalan las ventajas de los LED frente a las bombillas incandescentes y las lámparas halógenas. Empate; un punto para Gemini y otro para ChatGPT.

Programar un script Python que calcula los números primos

Ahora se trata de crear un código de programa que resuelva un problema específico. Por ejemplo, se utiliza un script Python para emitir los primeros 500 números primos. El prompt correspondiente es: «Escribe un programa en Python que calcula los primeros 500 números primos».

Gemini produce un programa bien comentado y explica los componentes individuales. Pero el resultado tiene un gran defecto: no calcula los primeros 500 números primos, sino los números primos en el rango de hasta 500. El programa de ChatGPT se ve visualmente mejor, por lo que las explicaciones son más escasas. Sin embargo, proporciona el resultado correcto. Punto para ChatGPT.

Tratar de realizar cálculos matemáticas

La última disciplina se llama matemáticas. Se debe calcular el resultado de 3elevado a 33, aunque este orden de magnitud es bastante raro en la vida cotidiana. Para la tarea 3 ^ 33, ChatGPT emite el resultado correcto 5.559.060.566.555.523, pero afirma que el número tiene 17 puestos. Gemini parece totalmente sobrecargado y cree que el resultado es 28.251.875.843 – más bien inadecuado para tareas matemáticas. Punto para ChatGPT.

Por lo tanto, el duelo da un nivel final de 4:3 para ChatGPT, pero es arbitrario y de ninguna manera representativo. Sin embargo, da una idea de las fortalezas y debilidades.

Deja un comentario