¿Gemma 2 o Llama 3 es el mejor modelo de código abierto?
Se dice que el nuevo modelo Gemma 2 27B es muy prometedor, superando a algunos modelos más grandes como el Llama 3 70B y el Qwen 1.5 32B.
Llama 3 y GPT-4 son dos de los modelos de lenguaje grande (LLM) más avanzados disponibles para el público. Veamos cuál LLM es mejor comparando ambos modelos en términos de multimodalidad, longitud del contexto, rendimiento y costo.
Tabla de contenido
GPT-4 es el último modelo de lenguaje grande (LLM) desarrollado por OpenAI. Se basa en la base de modelos GPT-3 más antiguos mientras utiliza diferentes técnicas de entrenamiento y optimización utilizando un conjunto de datos mucho más grande. Esto aumentó significativamente el tamaño de los parámetros de GPT-4, que se rumorea que tiene un total de 1,7 billones de parámetros de sus modelos expertos más pequeños. Con nuevo entrenamiento, optimizaciones y una mayor cantidad de parámetros, GPT-4 ofrece mejoras en el razonamiento, la resolución de problemas, la comprensión del contexto y un mejor manejo de instrucciones matizadas.
Actualmente existen 3 variantes del modelo:
Ahora puede acceder a los tres modelos GPT-4 suscribiéndose al servicio API de OpenAI, interactuando con ChatGPT o a través de servicios como Descript, Perplexity AI y muchos otros servicios auxiliares de Microsoft.
Llama 3 es un LLM de código abierto desarrollado por Meta AI (empresa matriz de Facebook, Instagram y WhatsApp), entrenado utilizando una combinación de ajuste supervisado, muestreo y optimización de políticas con un conjunto de datos diverso, que incluye millones de anotaciones humanas. Por ejemplo, su programa de entrenamiento se centra en indicaciones de alta calidad y clasificación de prioridades, con el objetivo de crear un modelo de IA flexible y capaz.
Puedes acceder a Llama 3 a través de Meta AI, su chatbot de IA generativa. Alternativamente, puede ejecutar LLM localmente en su computadora descargando modelos de Llama 3 y cargándolos a través de Ollama, Open WebUI o LM Studio.
El lanzamiento de GPT-4o finalmente trajo información inicial que muestra que GPT-4 es multimodal. Ahora puede acceder a estas funciones multimodales interactuando con ChatGPT utilizando el modelo GPT-4o. A partir de junio de 2024, GPT-4o no tiene ninguna forma incorporada de generar video y audio. Sin embargo, es capaz de generar texto e imágenes basándose en entradas de vídeo y audio.
Llama 3 también planea ofrecer un modelo multimodal para el próximo Llama 3 400B. Lo más probable es que integre tecnologías similares con CLIP (Contrast Language-Imager Pre-Training) para generar imágenes utilizando técnicas de aprendizaje de disparo cero. Pero como el Llama 400B todavía está en entrenamiento, la única forma de que los modelos 8B y 70B generen imágenes es usar extensiones como LLaVa, Visual-LLaMA y LLaMA-VID. A partir de ahora, Llama 3 es un modelo basado puramente en el lenguaje que puede tomar texto, imágenes y audio como entrada para generar texto.
La longitud del contexto se refiere a la cantidad de texto que un modelo puede procesar a la vez. Este es un factor importante al considerar las capacidades de un LLM porque determina la cantidad de contexto en el que el modelo puede operar al interactuar con el usuario. En general, una mayor longitud de contexto hace que el LLM sea mejor porque proporciona un mayor nivel de coherencia y continuidad y puede reducir la repetición de errores durante la interacción.
|
Modelo |
Descripción de los datos de entrenamiento |
Parámetros |
Longitud del contexto |
GQA |
Número de tokens |
Conocimiento limitado |
|---|---|---|---|---|---|---|
|
Llama 3 |
Combinar datos en línea disponibles públicamente |
8B |
8k |
Tener |
15T+ |
Marzo de 2023 |
|
Llama 3 |
Combinar datos en línea disponibles públicamente |
70B |
8k |
Tener |
15T+ |
Diciembre de 2023 |
Los modelos Llama 3 tienen una longitud de contexto efectiva de 8.000 tokens (aproximadamente 6.400 palabras). Esto significa que el modelo Llama 3 tendrá una memoria contextual de alrededor de 6.400 palabras en interacción. Cualquier palabra que exceda el límite de 8000 tokens será ignorada y no proporcionará ningún contexto adicional durante la interacción.
|
Modelo |
Describir |
Ventana de contexto |
Datos de entrenamiento |
|---|---|---|---|
|
GPT-4o |
Modelo multimodal, más económico y rápido que el GPT-4 Turbo |
128.000 tokens (API) |
Hasta octubre de 2023 |
|
GPT-4-Turbo |
El modelo GPT-4 Turbo está aerodinámico y ofrece gran visibilidad. |
128.000 tokens (API) |
Hasta diciembre de 2023 |
|
GPT-4 |
El primer modelo GPT-4 |
8,192 tokens |
Hasta septiembre de 2021 |
Por el contrario, GPT-4 ahora admite longitudes de contexto significativamente mayores de 32.000 tokens (aproximadamente 25.600 palabras) para usuarios de ChatGPT y 128.000 tokens (aproximadamente 102.400 palabras) para aquellos que utilizan el punto final de API. Esto le da al modelo GPT-4 una ventaja en la gestión de conversaciones extendidas y la capacidad de leer documentos largos o incluso libros enteros.
Comparemos el rendimiento mirando el informe de referencia Llama 3 del 18 de abril de 2024 de Meta AI y GPT-4 del 14 de mayo de 2024, el informe de GitHub de OpenAI. Aquí están los resultados:
|
Modelo |
Universidad de Michigan |
GPQA |
MATEMÁTICAS |
Evaluación humana |
GOTA |
|---|---|---|---|---|---|
|
GPT-4o |
88.7 |
53.6 |
76.6 |
90.2 |
83.4 |
|
GPT-4 Turbo |
86.5 |
49.1 |
72.2 |
87.6 |
85.4 |
|
Llama3 8B |
68.4 |
34.2 |
30.0 |
62.2 |
58.4 |
|
Llama3 70B |
82.0 |
39.5 |
50.4 |
81.7 |
79.7 |
|
Llama3 400B |
86.1 |
48.0 |
57.8 |
84.1 |
83.5 |
Esto es lo que mide cada criterio:
Los últimos puntos de referencia resaltan las diferencias de rendimiento entre los modelos GPT-4 y Llama 3. Si bien el modelo Llama 3 8B parece estar significativamente por detrás, los modelos 70B y 400B tienen un rendimiento inferior pero similar al de los modelos GPT-4o y GPT-4 Turbo en términos de conocimiento académico y general, lectura y comprensión, razonamiento y lógica, y codificación. Sin embargo, ningún modelo de Llama 3 ha logrado aún el rendimiento de GPT-4 en términos puramente matemáticos.
El costo es un factor importante para muchos usuarios. El modelo GPT-4o de OpenAI está disponible de forma gratuita para todos los usuarios de ChatGPT con un límite de 16 mensajes cada 3 horas. Si necesita más, deberá suscribirse a ChatGPT Plus por $20 al mes para ampliar el límite de mensajes de GPT-4o a 80 y obtener acceso a modelos GPT-4 adicionales.
Por otro lado, los modelos Llama 3 8B y 70B son de código abierto y gratuitos, lo que puede ser una ventaja significativa para desarrolladores e investigadores que buscan una solución rentable sin comprometer el rendimiento.
Los modelos GPT-4 son ampliamente accesibles a través del chatbot de IA generativa ChatGPT de OpenAI y a través de su API. También puedes usar GPT-4 en Microsoft Copilot, que es una forma de usar GPT-4 de forma gratuita . Esta amplia disponibilidad garantiza que los usuarios puedan aprovechar fácilmente sus capacidades en diferentes casos de uso. Por el contrario, Llama 3 es un proyecto de código abierto que proporciona flexibilidad de modelo y fomenta una experimentación y colaboración más amplia dentro de la comunidad de IA. Este enfoque de acceso abierto podría democratizar la tecnología de IA y ponerla a disposición de un público más amplio.
Si bien ambos modelos están disponibles, GPT-4 es mucho más fácil de usar porque está integrado en herramientas y servicios de productividad populares. Por otro lado, Llama 3 está integrado principalmente en plataformas de investigación y negocios como Amazon Bedrock, Ollama y DataBricks (a excepción del soporte de chat de Meta AI), lo que no atrae a un mercado más grande de usuarios no técnicos.
Entonces, ¿cuál LLM es mejor? GPT-4 es un mejor LLM. GPT-4 se destaca por su multimodalidad, con capacidades avanzadas en el manejo de entradas de texto, imágenes y audio, mientras que características similares de Llama 3 aún están en desarrollo. GPT-4 también ofrece una longitud de contexto mucho mayor y un mejor rendimiento, y es ampliamente accesible a través de herramientas y servicios populares, lo que hace que GPT-4 sea más fácil de usar.
Sin embargo, es importante destacar que los modelos Llama 3 han tenido un muy buen desempeño para un proyecto libre y de código abierto. Como tal, Llama 3 sigue siendo un LLM destacado, preferido por investigadores y empresas por su naturaleza gratuita y de código abierto, al tiempo que ofrece un rendimiento impresionante, flexibilidad y funciones de seguridad confiables. Si bien es posible que el consumidor general no encuentre una utilidad para el Llama 3 de inmediato, sigue siendo la opción más viable para muchos investigadores y empresas.
En resumen, mientras que GPT-4 se destaca por sus capacidades multimodales avanzadas, mayor longitud de contexto e integración perfecta en herramientas ampliamente utilizadas, Llama 3 ofrece una alternativa valiosa con su naturaleza de código abierto, lo que permite una mayor personalización y ahorro de costos. Entonces, en términos de aplicación, GPT-4 es ideal para quienes buscan facilidad de uso y funciones integrales en un solo modelo, mientras que Llama 3 es adecuado para desarrolladores e investigadores que buscan flexibilidad y adaptabilidad.
¿Tiene problemas con el Error H de Microsoft Teams durante las actualizaciones? Descubra cómo solucionar el Error H de Microsoft Teams, sus causas comunes y soluciones rápidas para restablecer una colaboración fluida. Actualizado con las últimas soluciones.
¿Tienes problemas con el llavero de errores de Microsoft Teams para Mac? Descubre soluciones paso a paso y probadas para macOS y recupera una colaboración fluida. ¡Soluciones rápidas en el interior!
¿Cansado de que el error 1200 de Microsoft Teams bloquee tus llamadas? Descubre soluciones rápidas y paso a paso para iOS y Android y vuelve a trabajar en equipo sin problemas rápidamente, ¡sin necesidad de conocimientos técnicos!
¿Frustrado porque tu grabación de Microsoft Teams falló? Descubre las razones más comunes, como problemas de permisos, límites de almacenamiento y fallos de red, además de soluciones paso a paso para evitar futuros fallos y grabar siempre de forma impecable.
¿Frustrado porque las salas de reuniones no aparecen en tu reunión de Teams? Descubre las principales razones por las que no puedes verlas en Teams y sigue nuestras soluciones paso a paso para que funcionen correctamente en minutos. ¡Ideal tanto para organizadores como para participantes!
¿Tienes problemas con un error de red de Microsoft Teams en una red Wi-Fi pública? Obtén soluciones instantáneas como ajustes de VPN, comprobaciones de puertos y borrado de caché para restaurar llamadas y reuniones sin problemas. Guía paso a paso para una solución rápida.
¿Perdiste archivos importantes en Microsoft Teams? Descubre la ubicación exacta de la Papelera de reciclaje de Microsoft Teams y sigue nuestros pasos comprobados para recuperar archivos eliminados de forma rápida y sencilla, ¡sin necesidad de conocimientos técnicos!
Descubre cómo configurar el estado "Fuera de oficina" en Microsoft Teams con sencillos pasos para escritorio, móvil y sincronización con Outlook. Mantén la profesionalidad mientras estás fuera: ¡configuración rápida en minutos!
Descubre exactamente dónde encontrar el código QR de Microsoft Teams para iniciar sesión móvil ultrarrápido. Guía paso a paso con imágenes para conectarte en segundos, ¡sin necesidad de contraseñas!
¿Tienes problemas con el error al unirte a una reunión de Microsoft Teams? Descubre pasos comprobados para solucionarlo mediante enlaces directos. Soluciones rápidas para unirte sin problemas, ¡sin necesidad de conocimientos técnicos!
Domine la instalación del complemento de Microsoft Teams para Outlook 2026 sin esfuerzo. Aumente su productividad con una programación y reuniones fluidas. ¡Siga nuestros pasos probados y actualizados para un éxito inmediato!
¿Frustrado por "¿Dónde está mi calendario de Teams?"? Soluciona los problemas de sincronización en Microsoft Teams paso a paso. Restaura la vista de tu calendario y sincroniza sin esfuerzo: ¡consejos de expertos incluidos!
¿Tienes problemas con el inicio de sesión de Microsoft Teams en Chromebooks? Descubre soluciones paso a paso para resolver problemas de inicio de sesión rápidamente. Borra la caché, actualiza apps y mucho más para trabajar en equipo sin problemas. ¡Funciona con la última versión de Chrome OS!
Descubre la forma más sencilla de cambiar tu foto de perfil de Microsoft Teams en iPhone y Android. Guía paso a paso con capturas de pantalla para actualizaciones fluidas en la última versión de la app. ¡Mejora tu imagen profesional hoy mismo!
¿Te encuentras con un error en Microsoft Teams hoy? Esta guía paso a paso para la solución de problemas de Microsoft Teams te muestra las primeras comprobaciones para resolverlo rápidamente. Soluciones rápidas para la conectividad, la caché y las actualizaciones para que puedas volver a chatear sin problemas.