¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

En I/O 2024, Google anunció su próxima línea de modelos Gemma 2, y ahora la compañía finalmente está lanzando los modelos livianos bajo una licencia de código abierto. Se dice que el nuevo modelo Gemma 2 27B es muy prometedor, superando a algunos modelos más grandes como el Llama 3 70B y el Qwen 1.5 32B. Para probar esta afirmación, comparemos Gemma 2 y Llama 3, dos de los principales modelos de código abierto en la actualidad.

Escritura creativa

Primero, veamos qué tan buenas son Gemma 2 y Llama 3 cuando se trata de escritura creativa. El autor del artículo pidió a ambas modelos que escribieran una historia corta sobre la relación entre la luna y el sol. Ambos hacen un gran trabajo, pero el modelo Gemma 2 de Google destaca gracias a su prosa atractiva y su buena historia.

¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

Por otro lado, Llama 3 parece un poco aburrido y robótico. Google siempre ha sido bueno en la generación de texto con los modelos Gemini y el Gemma 2 27B más pequeño no es una excepción.

Opción ganadora: Gemma 2

Pruebas multilingües

En la próxima ronda, veremos qué tan bien ambos modelos manejan idiomas distintos del inglés. Como Google anuncia que Gemma 2 es bueno para comprender varios idiomas, el autor lo comparó con el modelo Llama 3 de Meta. El autor pidió a ambos modelos que tradujeran un pasaje en hindi. Tanto Gemma 2 como Llama 3 tuvieron un muy buen desempeño.

¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

El autor también probó con otro idioma, el bengalí, y los modelos dieron resultados igualmente buenos. Al menos para las lenguas indias, se puede decir que Gemma 2 y Llama 3 están bien entrenados en un corpus grande. Sin embargo, el Gemma 2 27B es casi 2,5 veces más pequeño que el Llama 3 70B, lo que lo hace aún más impresionante.

Opciones ganadoras: Gemma 2 y Llama 3

Comprueba la lógica

Si bien Gemma 2 y Llama 3 no son los modelos más inteligentes del mercado, pueden realizar algunas pruebas de razonamiento comunes al igual que modelos mucho más grandes. En la comparación anterior entre Llama 3 y GPT-4 , el modelo 70B de Meta fue impresionante ya que demostró una inteligencia bastante buena incluso en su tamaño más pequeño.

¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

En esta ronda, Llama 3 derrotó a Gemma 2 con una gran diferencia de puntuación. Llama 3 respondió 2 de 3 preguntas correctamente, mientras que Gemma 2 tuvo dificultades para responder incluso una correctamente. Gemma 2 simplemente no está entrenada para resolver preguntas de razonamiento complejas.

Por otra parte, Llama 3 tiene una base de razonamiento sólida, que probablemente se puede inferir del conjunto de datos cifrados. A pesar de su pequeño tamaño (al menos comparado con modelos de billones de parámetros como GPT-4), exhibe un nivel de inteligencia más que aceptable. En última instancia, utilizar más tokens para entrenar el modelo en realidad da como resultado un modelo más poderoso.

Opción ganadora: Llama 3

Siga las instrucciones

En la siguiente ronda, el autor pidió a Gemma 2 y Llama 3 que crearan 10 palabras que terminaran con la palabra “NPU”. Y Llama 3 obtuvo 10/10 respuestas correctas. Por el contrario, Gemma 2 solo produjo 7 oraciones correctas de 10. En muchas versiones anteriores, los modelos de Google, incluido Gemini, no siguieron bien las instrucciones del usuario. Y la misma tendencia continúa con Gemma 2.

¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

Seguir las instrucciones del usuario es crucial para los modelos de IA. Asegura confiabilidad y genera retroalimentación precisa sobre lo que usted ha instruido. Desde el punto de vista de la seguridad, también ayuda a mantener el modelo en tierra para un mejor cumplimiento de los protocolos de seguridad.

Opción ganadora: Llama 3

Encuentre información

Tanto Gemma 2 como Llama 3 tienen una longitud de contexto de 8K tokens. El autor agregó un enorme bloque de texto, extraído directamente del libro Orgullo y prejuicio, que contiene más de 17.000 caracteres y 3.800 tokens. Como siempre, el autor coloca una cita aleatoria en algún lugar del texto y pide a ambos modelos que la encuentren.

¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

Gemma 2 rápidamente descubrió la información y señaló que la cita fue insertada al azar. Llama 3 también encontró y sugirió que esta afirmación parecía fuera de lugar. En términos de memoria de contexto larga, aunque limitada a tokens de 8K, ambos modelos son bastante fuertes en este sentido.

Tenga en cuenta que el autor ejecutó esta prueba en HuggingChat (web) porque meta.ai se negó a ejecutar este mensaje, probablemente debido al contenido protegido por derechos de autor.

Opciones ganadoras: Gemma 2 y Llama 3

Comprueba si hay alucinaciones

Los modelos más pequeños tienden a sufrir alucinaciones de IA debido a datos de entrenamiento limitados y a menudo inventan información cuando el modelo se encuentra con temas desconocidos. Entonces el autor agregó el nombre de su país inventado para probar si Gemma 2 y Llama 3 estaban alucinando. Y sorprendentemente, no lo hicieron, lo que significa que tanto Google como Meta tienen una base bastante buena para sus modelos.

¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?

El autor también planteó otra pregunta (falsa) para probar la validez de los modelos, pero nuevamente, no eran alucinógenos. Por cierto, el autor probó Llama 3 en HuggingChat mientras meta.ai navegaba por Internet en busca de información actualizada sobre temas relevantes.

Opciones ganadoras: Gemma 2 y Llama 3

Concluir

Si bien el modelo Gemma 2 27B de Google no obtiene buenos resultados en las pruebas de razonamiento, es capaz de realizar otras tareas. Es ideal para la escritura creativa, admite varios idiomas, tiene buena memoria y, sobre todo, no es tan alucinógeno como los modelos anteriores.

Llama 3 es mejor, por supuesto, pero también es un modelo significativamente más grande, entrenado con 70 mil millones de parámetros. Los desarrolladores encontrarán útil el modelo Gemma 2 27B para una amplia gama de casos de uso. Y por si fuera poco, también está disponible el Gemma 2 9B.

Además, los usuarios deberían probar el Gemini 1.5 Flash, que es un modelo mucho más pequeño y también admite entrada multimodal. Sin mencionar que es increíblemente rápido y eficiente.

Sign up and earn $1000 a day ⋙

Leave a Comment

7 sencillos ajustes tecnológicos que mejoran drásticamente tu calidad de vida

7 sencillos ajustes tecnológicos que mejoran drásticamente tu calidad de vida

Crear una relación saludable con la tecnología puede parecer desalentador, pero los pequeños cambios a menudo hacen una gran diferencia.

8 cosas que no sabías que podías hacer en la aplicación Galería de Samsung

8 cosas que no sabías que podías hacer en la aplicación Galería de Samsung

La aplicación Galería de Samsung es más capaz de lo que crees, aunque quizá no sea evidente a primera vista.

El teléfono inteligente plegable de Microsoft no tendrá pliegues

El teléfono inteligente plegable de Microsoft no tendrá pliegues

Se dice que Microsoft está cerca de lanzar su primer teléfono inteligente plegable cuando recibió una patente para un teléfono plegable con la capacidad de plegarse 360 ​​grados pero sin crear arrugas en la pantalla el 1 de octubre.

Google prueba una marca de verificación azul en sus búsquedas

Google prueba una marca de verificación azul en sus búsquedas

Google está probando una nueva función de verificación a través de una marca de verificación azul en la búsqueda. Esta función ayudará a los usuarios a evitar hacer clic en enlaces de sitios web falsos o fraudulentos.

Distinguir Microsoft 365 y Office 2024

Distinguir Microsoft 365 y Office 2024

A primera vista, Microsoft 365 y Office 2024 pueden parecer muy similares, ya que ambos brindan acceso a las aplicaciones populares y ampliamente utilizadas de Microsoft.

Últimos códigos de Elemental Dungeons y cómo introducirlos

Últimos códigos de Elemental Dungeons y cómo introducirlos

Los códigos de Elemental Dungeons son una forma necesaria de recompensa para los jugadores. Al igual que en cualquier otro juego en línea en Roblox, los jugadores pueden recibir estas ayudas a cambio de dinero u otros artículos.

Cómo repetir la barra de título de una tabla en Word

Cómo repetir la barra de título de una tabla en Word

Al imprimir un documento de Word o crear una tabla en Word, repetir el título en Word nos ayuda a rastrear el título de manera más conveniente y leer el título del documento sin problemas en diferentes páginas, especialmente con títulos largos.

Cómo crear mensajes animados en iMessage iOS 18

Cómo crear mensajes animados en iMessage iOS 18

El nuevo iMessage de iOS 18 se actualiza con mensajes animados, efectos de texto con muchas opciones para utilizar en los mensajes que envíes.

¿Por qué los cerdos son el némesis de las serpientes?

¿Por qué los cerdos son el némesis de las serpientes?

Hay un dato interesante sobre los cerdos que no todo el mundo conoce: los cerdos son considerados enemigos de las serpientes, porque cuando estos dos animales se encuentran, la mayoría de las serpientes se convertirán en alimento para los cerdos.

¿Cuál es la distancia entre la Tierra y Júpiter, el planeta más grande del Sistema Solar?

¿Cuál es la distancia entre la Tierra y Júpiter, el planeta más grande del Sistema Solar?

¿Cuál es la distancia de la Tierra a Júpiter? Si no lo sabes, este artículo te dirá a qué distancia está Júpiter de la Tierra.

Descubre los generales fuera de meta de la temporada S1 2023 Lien Quan Mobile

Descubre los generales fuera de meta de la temporada S1 2023 Lien Quan Mobile

¿Qué generales están fuera del meta de Mobile Alliance? Vamos a explorar ahora

Temporada 7.5 de Graves DTCL: Artículos estándar, plantilla de Graves Loi Long

Temporada 7.5 de Graves DTCL: Artículos estándar, plantilla de Graves Loi Long

Graves DTCL de la temporada 1, temporada 3 y temporada 6 cuestan solo 1 de oro y parece ser solo un campeón adicional para estimular al clan, el rol principal en el juego inicial todavía se usa pero no mucho. A partir de la temporada 7.5 de DTCL, el precio de Graves se ha disparado a 4 de oro y es definitivamente un carry indispensable si decides jugar con Dragón Trueno o Artillero.

Cómo usar sonidos de aplicaciones independientes en Samsung

Cómo usar sonidos de aplicaciones independientes en Samsung

Con los teléfonos Samsung, debes utilizar la función de sonido de la aplicación independiente. Por ejemplo, puedes reproducir Apple Music y tu teléfono enviará el audio a través de los altavoces de tu automóvil.

Buenas citas sobre el trabajo, buenos estados sobre el trabajo te inspiran a alcanzar el éxito.

Buenas citas sobre el trabajo, buenos estados sobre el trabajo te inspiran a alcanzar el éxito.

Hay muchos estados positivos sobre el trabajo en Internet. En este artículo te resumiremos algunos estados laborales buenos y significativos.

Subtítulos de aniversario de bodas, estados de aniversario de bodas significativos y dulces

Subtítulos de aniversario de bodas, estados de aniversario de bodas significativos y dulces

¿Cuál es un título bueno y significativo para un aniversario de bodas? El artículo resumirá para usted breves y concisos subtítulos de aniversario que pueden hacer que su pareja los recuerde para siempre.