Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Ahora que los LLM cuánticos están disponibles en HuggingFace y en ecosistemas de IA como H20, Text Gen y GPT4All, que le permiten cargar pesos LLM en su computadora, ahora tiene una opción para una IA gratuita, flexible y segura. ¡Aquí están los 9 mejores LLM locales/presenciales que puedes probar ahora mismo!

Tabla de contenido

1. Hermes 2 Pro GPTQ

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Hermes 2 Pro es un modelo de lenguaje avanzado perfeccionado por Nous Research. Utiliza una versión actualizada y reducida del conjunto de datos OpenHermes 2.5, junto con los nuevos conjuntos de datos Function Calling y JSON desarrollados por la propia empresa. Este modelo se basa en la arquitectura Mistral 7B y ha sido entrenado con 1.000.000 de instrucciones/conversaciones de calidad GPT-4 o superior, en su mayoría datos sintéticos.

Modelo

Hermes 2 Pro GPTQ

Tamaño del modelo

7,26 GB

Parámetros

7 mil millones

Cuantización

4 bits

Tipo

Mistral

Licencia

Apache 2.0

El Hermes 2 Pro en el Mistral 7B es el nuevo modelo insignia del Hermes 7B, que ofrece un rendimiento mejorado en una variedad de puntos de referencia, incluidos AGIEval, BigBench Reasoning, GPT4All y TruthfulQA. Sus capacidades avanzadas lo hacen adecuado para muchas tareas de procesamiento del lenguaje natural (PLN), como generación de código, creación de contenido y aplicaciones de IA conversacional.

2. Zephyr 7B Beta

Zephyr es una serie de modelos de lenguaje entrenados para actuar como asistentes útiles. Zephyr-7B-Beta es el segundo modelo de la serie, refinado a partir de Mistral-7B-v0.1 mediante Optimización de Preferencia Directa (DPO) en una mezcla de conjuntos de datos sintéticos disponibles públicamente.

Modelo

Zephyr 7B Beta

Tamaño del modelo

7,26 GB

Parámetros

7 mil millones

Cuantización

4 bits

Tipo

Mistral

Licencia

Apache 2.0

Al eliminar la alineación incorporada de los conjuntos de datos de entrenamiento, Zephyr-7B-Beta demuestra un rendimiento mejorado en puntos de referencia como MT-Bench, lo que aumenta su utilidad en una variedad de tareas. Sin embargo, este ajuste puede generar una generación de texto problemática cuando se lo solicita de determinadas maneras.

3. Falcon Instruct GPTQ

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Esta versión cuantificada de Falcon se basa en una arquitectura de solo decodificador refinada en el modelo Falcon-7b sin procesar de TII. El modelo base Falcon se entrena utilizando 1,5 billones de tokens en circulación provenientes de Internet público. Como modelo solo decodificador basado en comandos con licencia Apache 2, Falcon Instruct es perfecto para pequeñas empresas que buscan un modelo para usar en la traducción de idiomas y la ingesta de datos.

Modelo

Falcon-7B-Instruct

Tamaño del modelo

7,58 GB

Parámetros

7 mil millones

Cuantización

4 bits

Tipo

Halcón

Licencia

Apache 2.0

Sin embargo, esta versión de Falcon no es ideal para realizar ajustes finos y solo está destinada a la inferencia. Si desea ajustar Falcon, tendrá que utilizar el modelo sin procesar, lo que puede requerir acceso a hardware de entrenamiento de nivel empresarial como NVIDIA DGX o AMD Instinct AI Accelerators.

4. GPT4ALL-J Groovy

GPT4All-J Groovy es un modelo de solo decodificador ajustado por Nomic AI y con licencia Apache 2.0. GPT4ALL-J Groovy se basa en el modelo GPT-J original, conocido por su excelente capacidad para generar texto a partir de indicaciones. GPT4ALL -J Groovy ha sido ajustado a un modelo conversacional, lo cual es ideal para aplicaciones de generación de texto rápidas y creativas. Esto hace que GPT4All-J Groovy sea ideal para los creadores de contenido, ayudándolos con su escritura y composición, ya sea poesía, música o historias.

Modelo

GPT4ALL-J Groovy

Tamaño del modelo

3,53 GB

Parámetros

7 mil millones

Cuantización

4 bits

Tipo

GPT-J

Licencia

Apache 2.0

Lamentablemente, el modelo GPT-J de referencia se entrenó en un conjunto de datos solo en inglés, lo que significa que incluso este modelo GPT4ALL-J perfeccionado solo puede conversar y realizar aplicaciones de generación de texto en inglés.

5. Instrucciones de DeepSeek Coder V2

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

DeepSeek Coder V2 es un modelo de lenguaje avanzado que mejora la programación y el razonamiento matemático. DeepSeek Coder V2 admite múltiples lenguajes de programación y ofrece una longitud de contexto extendida, lo que lo convierte en una herramienta versátil para los desarrolladores.

Modelo

Instrucciones de DeepSeek Coder V2

Tamaño del modelo

13 GB

Parámetros

33 mil millones

Cuantización

4 bits

Tipo

Búsqueda profunda

Licencia

Apache 2.0

En comparación con su predecesor, DeepSeek Coder V2 muestra mejoras significativas en tareas relacionadas con el código, el razonamiento y las capacidades generales. Amplía el soporte para lenguajes de programación de 86 a 338 y extiende la longitud del contexto de 16K a 128K tokens. En pruebas de referencia, supera a modelos como GPT-4 Turbo, Claude 3 Opus y Gemini 1.5 Pro en pruebas de referencia criptográficas y matemática.

6. Mixtral-8x7B

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Mixtral-8x7B es una mezcla de modelos expertos (MoE) desarrollados por Mistral AI. Cuenta con 8 expertos por MLP, totalizando 45 mil millones de parámetros. Sin embargo, solo se activan dos expertos por token durante la inferencia, lo que lo hace computacionalmente eficiente, con velocidad y costo comparables a un modelo de 12 mil millones de parámetros.

Modelo

Mixtral-8x7B

Tamaño del modelo

12 GB

Parámetros

45 mil millones (8 expertos)

Cuantización

4 bits

Tipo

Mistral MoE

Licencia

Apache 2.0

Mixtral admite una longitud de contexto de 32k tokens y supera a Llama 2 en 70B en la mayoría de los puntos de referencia, igualando o superando el rendimiento de GPT-3.5. Habla con fluidez varios idiomas, incluidos inglés, francés, alemán, español e italiano, lo que lo convierte en una opción versátil para una variedad de tareas de PNL.

7. Mago Vicuña Sin Censura-GPTQ

Wizard-Vicuna GPTQ es la versión cuántica de Wizard Vicuna basada en el modelo LlaMA. A diferencia de la mayoría de los LLM lanzados al público, Wizard-Vicuna es un modelo sin censura con la asociación eliminada. Esto significa que el modelo no tiene los mismos estándares de seguridad y éticos que la mayoría de los otros modelos.

Modelo

Wizard-Vicuña-30B-Sin censura-GPTQ

Tamaño del modelo

16,94 GB

Parámetros

30 mil millones

Cuantización

4 bits

Tipo

Llama

Licencia

GPL 3

Si bien puede representar un problema para el control de alineación de la IA, tener un LLM sin censura también saca lo mejor del modelo al permitirle responder sin restricciones. Esto también permite a los usuarios agregar su propia alineación personalizada sobre cómo debe actuar o responder la IA en función de una indicación determinada.

8. Orca Mini-GPTQ

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

¿Estás buscando probar un modelo entrenado utilizando un método de aprendizaje único? Orca Mini es una implementación no oficial del documento de investigación Orca de Microsoft. Este modelo se entrena utilizando un enfoque de aprendizaje profesor-alumno, donde el conjunto de datos se llena con explicaciones en lugar de solo indicaciones y respuestas. En teoría, esto debería hacer que el estudiante sea más inteligente, en el sentido de que el modelo puede comprender el problema en lugar de simplemente buscar pares de entrada y salida como funciona el LLM convencional.

9. Llama 2 13B Chat GPTQ

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Llama 2 es el sucesor del Llama LLM original, ofreciendo un rendimiento y una versatilidad mejorados. La variante 13B Chat GPTQ está optimizada para aplicaciones de inteligencia artificial conversacional para el diálogo en inglés.

Algunos de los modelos enumerados anteriormente vienen en múltiples versiones en términos de especificaciones. En general, las versiones con especificaciones más altas producen mejores resultados pero requieren hardware más potente, mientras que las versiones con especificaciones más bajas producen resultados de menor calidad pero pueden funcionar en hardware de gama más baja. Si no está seguro de si su PC puede ejecutar este modelo, pruebe primero una versión con especificaciones más bajas y luego continúe hasta que sienta que la caída del rendimiento ya no es aceptable.

Sign up and earn $1000 a day ⋙

Leave a Comment

Los ciberdelincuentes están difundiendo malware mediante... Búsqueda de Google

Los ciberdelincuentes están difundiendo malware mediante... Búsqueda de Google

Los expertos en seguridad de Palo Alto Networks han descubierto una nueva campaña de ataque que propaga malware a través de los resultados de búsqueda de Google.

Google agrega una función para abrir aplicaciones automáticamente después de instalarlas en Play Store

Google agrega una función para abrir aplicaciones automáticamente después de instalarlas en Play Store

Google está añadiendo una nueva característica pequeña pero largamente esperada a Play Store.

Alto salario pero sin trabajo: cómo Tim Cook retiene el talento

Alto salario pero sin trabajo: cómo Tim Cook retiene el talento

Después de que Tim Cook asumió el cargo de CEO en 2011, en un esfuerzo por mantener la confianza pública en Apple, retuvo a los empleados senior pagándoles sin obligarlos a trabajar.

¿Dónde encontrar el área de Dead Pool en Fortnite?

¿Dónde encontrar el área de Dead Pool en Fortnite?

Dead Pool es una de las áreas temáticas de Mortal Kombat agregadas a Fortnite desde la actualización v34.21.

¿El teléfono en modo avión pero aún usando wifi atrae rayos?

¿El teléfono en modo avión pero aún usando wifi atrae rayos?

¿Debes utilizar el teléfono durante tormentas y relámpagos? ¿Las señales de los teléfonos celulares pueden ser alcanzadas por un rayo? ¿Un teléfono en modo avión pero que aún utiliza wifi atrae rayos?

¿Cuando apareció la primera lluvia en la Tierra?

¿Cuando apareció la primera lluvia en la Tierra?

Una nueva investigación realizada por un equipo de investigadores de Australia y China sugiere que la primera lluvia apareció en la Tierra hace unos 4 mil millones de años, 500 millones de años antes de lo que se pensaba.

Lo más peligroso del mundo, solo 5 minutos de contacto pueden matarte.

Lo más peligroso del mundo, solo 5 minutos de contacto pueden matarte.

Este objeto se encuentra en la zona de Chernóbil, Ucrania, resultado de una de las fugas radiactivas más horribles de la historia. Este objeto tiene la forma de un pie gigante, por eso se le llama Pie de Elefante.

Último código del personaje principal Clash Clash

Último código del personaje principal Clash Clash

El código de juego Chu Cong Xung Xung Xung permite a los jugadores recibir soporte cuando ingresan por primera vez al juego. Estas recompensas te ayudarán a familiarizarte con el juego más rápido y definitivamente atraerán nuevos jugadores. Ingresa el código del juego Chu Cong Xung Xung Xung a continuación para recibir un regalo.

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Los 9 mejores LLM locales/presenciales que puedes probar ahora mismo

Ahora que los LLM cuánticos están disponibles en HuggingFace y en ecosistemas de IA como H20, Text Gen y GPT4All, que le permiten cargar pesos LLM en su computadora, ahora tiene una opción para una IA gratuita, flexible y segura.

Razones para cambiar de la aplicación de grabadora de voz nativa de Android a Dolby On

Razones para cambiar de la aplicación de grabadora de voz nativa de Android a Dolby On

La grabadora de voz predeterminada en los teléfonos Android tiene fallas y carece de funciones esenciales como cancelación de ruido efectiva y herramientas de edición potentes.

Cómo establecer el nivel de volumen predeterminado para cada aplicación

Cómo establecer el nivel de volumen predeterminado para cada aplicación

Establecer un nivel de volumen predeterminado para cada aplicación es útil en algunos casos, como cuando estás viendo un video usando la aplicación de Youtube y quieres reducir el volumen del tono de llamada y del tono de mensaje para no ser molestado.

Colección de hermosos diseños de uñas para San Valentín.

Colección de hermosos diseños de uñas para San Valentín.

El brillo rosa y el esmalte de uñas rojo son especialmente adecuados para las uñas del día de San Valentín. ¿Qué podría ser mejor que eso? Este artículo te resumirá hermosos diseños de uñas para una dulce cita en el día de San Valentín.

Estado para cambiarte a ti mismo, título para cambiarte a ti mismo para crear motivación en la vida.

Estado para cambiarte a ti mismo, título para cambiarte a ti mismo para crear motivación en la vida.

A continuación encontrarás estados sobre cómo cambiarte a ti mismo y subtítulos sobre cómo cambiarte a ti mismo que te ayudarán a tener más motivación para adaptarte a los cambios de la vida.

Una filtración de iOS 19 revela un diseño completamente nuevo

Una filtración de iOS 19 revela un diseño completamente nuevo

A finales de junio pasado, Bloomberg informó que Apple había comenzado el desarrollo de iOS 19, macOS 16, watchOS 12 y VisionOS 3 para el próximo año.

La versión súper reducida de Windows 11 tiene un tamaño de poco más de 100 MB

La versión súper reducida de Windows 11 tiene un tamaño de poco más de 100 MB

El desarrollador NTDEV ha creado una versión reducida de Windows 11 que solo tiene 100 MB.