Foxconn anuncia un modelo de lenguaje grande (LLM) perfeccionado a partir de Llama 3.1 de Meta

Foxconn, la compañía más conocida por fabricar iPhones y otros productos de hardware de Apple, acaba de sorprender a todos al anunciar su primer modelo de lenguaje de gran tamaño (LLM), llamado FoxBrain, que pretende ser utilizado para mejorar la gestión de la cadena de suministro y fabricación.

El fabricante taiwanés afirma que FoxBrain fue entrenado con solo 120 GPU H100 de Nvidia. Este LLM está desarrollado básicamente en base a la arquitectura Llama 3.1 de Meta, con 70 mil millones de parámetros mediante destilación. El concepto de refinamiento de LLM implica utilizar un modelo "padre" y entrenar un modelo "hijo" en función de sus respuestas. Foxconn también admitió que su LLM no es tan bueno como el modelo refinado de DeepSeek (China), pero el rendimiento general está muy cerca de los estándares de clase mundial.

Al hablar sobre este logro, el Dr. Yung-Hui Li, director del Centro de Investigación de Inteligencia Artificial del Instituto de Investigación Hon Hai (Foxconn), dijo:

En los últimos meses, la mejora de las capacidades de razonamiento y el uso eficiente de las GPU se ha convertido gradualmente en una tendencia importante en el campo de la IA. Nuestro modelo FoxBrain adoptó una estrategia de entrenamiento muy eficiente, centrándose en optimizar el proceso de entrenamiento en lugar de acumular potencia informática a ciegas.

“Mediante métodos de entrenamiento cuidadosamente diseñados y la optimización de recursos, hemos logrado construir un modelo de IA local con fuertes capacidades de razonamiento”.

Foxconn anuncia un modelo de lenguaje grande (LLM) perfeccionado a partir de Llama 3.1 de Meta

Foxconn no sólo ensambla productos de Apple, sino que también fabrica los servidores de inteligencia artificial de Nvidia. Junto con 120 GPU H100, FoxBrain se amplía utilizando la red Quantum-2 InfiniBand de Nvidia, y el entrenamiento lleva aproximadamente 4 semanas (por un costo computacional total de 2,688 días de GPU). Foxconn generó 98 mil millones de tokens de datos de preentrenamiento de alta calidad en chino tradicional con una longitud de ventana de contexto de hasta 128 000 tokens.

La asociación entre Foxconn y Nvidia no es nueva, y las dos compañías también están trabajando en otros proyectos, incluida la construcción de la instalación de fabricación de GPU Blackwell más grande del mundo.

Nvidia también proporcionó a Foxconn la supercomputadora Taipei-1 para completar el proceso de preentrenamiento del modelo. Foxconn dijo que FoxBrain se convertirá en un “motor clave” para actualizar las tres plataformas principales de la compañía: Fabricación inteligente, Vehículos eléctricos inteligentes y Ciudades inteligentes.

Sign up and earn $1000 a day ⋙

Leave a Comment

Se espera que los precios de los chips de 2 nm aumenten drásticamente

Se espera que los precios de los chips de 2 nm aumenten drásticamente

Según se informa, TSMC comenzó a aceptar pedidos de obleas de 2 nm a principios de este mes, con precios estimados en hasta 30.000 dólares por oblea.

OpenAI está a punto de adquirir Windsurf, uno de los editores de código de IA más potentes del mundo.

OpenAI está a punto de adquirir Windsurf, uno de los editores de código de IA más potentes del mundo.

OpenAI está en conversaciones para adquirir Windsurf, el editor de código impulsado por IA líder de la industria.

5 tendencias de smartphones que deberían eliminarse

5 tendencias de smartphones que deberían eliminarse

Ya sean decisiones de diseño poco prácticas o características que nadie realmente pidió, algunas de estas tendencias deben desaparecer para siempre.

Cómo ocultar la información de contacto en Instagram

Cómo ocultar la información de contacto en Instagram

De forma predeterminada, la información de contacto personal aparece en tu perfil de Instagram. Esto afectará la privacidad personal. El siguiente artículo le guiará sobre cómo ocultar la información de contacto en Instagram.

Cómo cerrar sesión en una cuenta de Telegram de forma remota

Cómo cerrar sesión en una cuenta de Telegram de forma remota

La aplicación Telegram guardará todos los dispositivos conectados a la cuenta en una lista para que podamos rastrearlos. Y desde esta lista podemos comprobar si hay inicios de sesión no autorizados.

Último código mundial legendario (25/04/2025) y cómo canjearlo por recompensas

Último código mundial legendario (25/04/2025) y cómo canjearlo por recompensas

Legendary World ayuda a los jugadores a recibir una serie de diamantes, cofres del tesoro y fragmentos de personajes de alto nivel a través de un código de regalo.

¿Qué es Google Store? ¿Qué hay en Google Store?

¿Qué es Google Store? ¿Qué hay en Google Store?

Google Store ha tenido una historia interesante.

Cómo eliminar adware en la computadora

Cómo eliminar adware en la computadora

Las cuestiones de seguridad y privacidad siempre deben tomarse en serio. Después de todo, están estrechamente relacionados con tu vida, así que mantente muy alerta ante el malware y otras amenazas.

Cómo solucionar el error Sin acceso a Internet IPv4/IPv6 en Windows

Cómo solucionar el error Sin acceso a Internet IPv4/IPv6 en Windows

En esta guía, Quantrimang.com explorará algunos pasos de solución de problemas para ayudarlo a resolver el error Sin acceso a Internet IPv4/IPv6 y restaurar su conexión a Internet.

Nvidia espera que los conectores de alimentación de las RTX 5090/5080 no se derritan gracias a la nueva tecnología de conector PCIe

Nvidia espera que los conectores de alimentación de las RTX 5090/5080 no se derritan gracias a la nueva tecnología de conector PCIe

Seguramente mucha gente todavía no ha olvidado el escándalo de la "explosión" en la línea de tarjetas gráficas Nvidia RTX serie 40.

Por qué los usuarios están decepcionados con la línea de productos Galaxy S25 de Samsung

Por qué los usuarios están decepcionados con la línea de productos Galaxy S25 de Samsung

Mucha gente estaba ansiosa por ver lo que Samsung traería con la serie Galaxy S25, pero después de ver todo lo que la compañía tiene para ofrecer, no pudieron evitar sentirse decepcionados. No hay mucho que esperar de la actualización de este año.

Los científicos están observando un fenómeno extremadamente raro: un planeta que es tragado por una estrella.

Los científicos están observando un fenómeno extremadamente raro: un planeta que es tragado por una estrella.

Este evento es extremadamente raro, pero el equipo espera observar más en el futuro gracias al JWST y otros observatorios avanzados que estarán en funcionamiento.

Cómo identificar agujeros de serpiente en tu jardín

Cómo identificar agujeros de serpiente en tu jardín

Las serpientes no cavan sus propias madrigueras, pero eso no significa que no puedan refugiarse en madrigueras creadas por otra cosa. A continuación te indicamos cómo identificar y tratar los agujeros de serpientes en tu jardín.

¿Cuál es la función de la barba de un perro? ¿Todas las razas de perros tienen barba?

¿Cuál es la función de la barba de un perro? ¿Todas las razas de perros tienen barba?

¿Para qué tienen los perros dos bigotes debajo de la barbilla? ¡Aprendamos sobre los efectos de los bigotes de los perros!

Cómo ver los recuerdos de las historias en Instagram

Cómo ver los recuerdos de las historias en Instagram

Instagram ha introducido una función llamada Recuerdos similar a la función En este día de Facebook, que te permite revisar y recordar tus publicaciones antiguas.