Foxconn anuncia un modelo de lenguaje grande (LLM) perfeccionado a partir de Llama 3.1 de Meta

Foxconn, la compañía más conocida por fabricar iPhones y otros productos de hardware de Apple, acaba de sorprender a todos al anunciar su primer modelo de lenguaje de gran tamaño (LLM), llamado FoxBrain, que pretende ser utilizado para mejorar la gestión de la cadena de suministro y fabricación.

El fabricante taiwanés afirma que FoxBrain fue entrenado con solo 120 GPU H100 de Nvidia. Este LLM está desarrollado básicamente en base a la arquitectura Llama 3.1 de Meta, con 70 mil millones de parámetros mediante destilación. El concepto de refinamiento de LLM implica utilizar un modelo "padre" y entrenar un modelo "hijo" en función de sus respuestas. Foxconn también admitió que su LLM no es tan bueno como el modelo refinado de DeepSeek (China), pero el rendimiento general está muy cerca de los estándares de clase mundial.

Al hablar sobre este logro, el Dr. Yung-Hui Li, director del Centro de Investigación de Inteligencia Artificial del Instituto de Investigación Hon Hai (Foxconn), dijo:

En los últimos meses, la mejora de las capacidades de razonamiento y el uso eficiente de las GPU se ha convertido gradualmente en una tendencia importante en el campo de la IA. Nuestro modelo FoxBrain adoptó una estrategia de entrenamiento muy eficiente, centrándose en optimizar el proceso de entrenamiento en lugar de acumular potencia informática a ciegas.

“Mediante métodos de entrenamiento cuidadosamente diseñados y la optimización de recursos, hemos logrado construir un modelo de IA local con fuertes capacidades de razonamiento”.

Foxconn anuncia un modelo de lenguaje grande (LLM) perfeccionado a partir de Llama 3.1 de Meta

Foxconn no sólo ensambla productos de Apple, sino que también fabrica los servidores de inteligencia artificial de Nvidia. Junto con 120 GPU H100, FoxBrain se amplía utilizando la red Quantum-2 InfiniBand de Nvidia, y el entrenamiento lleva aproximadamente 4 semanas (por un costo computacional total de 2,688 días de GPU). Foxconn generó 98 mil millones de tokens de datos de preentrenamiento de alta calidad en chino tradicional con una longitud de ventana de contexto de hasta 128 000 tokens.

La asociación entre Foxconn y Nvidia no es nueva, y las dos compañías también están trabajando en otros proyectos, incluida la construcción de la instalación de fabricación de GPU Blackwell más grande del mundo.

Nvidia también proporcionó a Foxconn la supercomputadora Taipei-1 para completar el proceso de preentrenamiento del modelo. Foxconn dijo que FoxBrain se convertirá en un “motor clave” para actualizar las tres plataformas principales de la compañía: Fabricación inteligente, Vehículos eléctricos inteligentes y Ciudades inteligentes.

Sign up and earn $1000 a day ⋙

Leave a Comment

7 sencillos ajustes tecnológicos que mejoran drásticamente tu calidad de vida

7 sencillos ajustes tecnológicos que mejoran drásticamente tu calidad de vida

Crear una relación saludable con la tecnología puede parecer desalentador, pero los pequeños cambios a menudo hacen una gran diferencia.

8 cosas que no sabías que podías hacer en la aplicación Galería de Samsung

8 cosas que no sabías que podías hacer en la aplicación Galería de Samsung

La aplicación Galería de Samsung es más capaz de lo que crees, aunque quizá no sea evidente a primera vista.

El teléfono inteligente plegable de Microsoft no tendrá pliegues

El teléfono inteligente plegable de Microsoft no tendrá pliegues

Se dice que Microsoft está cerca de lanzar su primer teléfono inteligente plegable cuando recibió una patente para un teléfono plegable con la capacidad de plegarse 360 ​​grados pero sin crear arrugas en la pantalla el 1 de octubre.

Google prueba una marca de verificación azul en sus búsquedas

Google prueba una marca de verificación azul en sus búsquedas

Google está probando una nueva función de verificación a través de una marca de verificación azul en la búsqueda. Esta función ayudará a los usuarios a evitar hacer clic en enlaces de sitios web falsos o fraudulentos.

Distinguir Microsoft 365 y Office 2024

Distinguir Microsoft 365 y Office 2024

A primera vista, Microsoft 365 y Office 2024 pueden parecer muy similares, ya que ambos brindan acceso a las aplicaciones populares y ampliamente utilizadas de Microsoft.

Últimos códigos de Elemental Dungeons y cómo introducirlos

Últimos códigos de Elemental Dungeons y cómo introducirlos

Los códigos de Elemental Dungeons son una forma necesaria de recompensa para los jugadores. Al igual que en cualquier otro juego en línea en Roblox, los jugadores pueden recibir estas ayudas a cambio de dinero u otros artículos.

Cómo repetir la barra de título de una tabla en Word

Cómo repetir la barra de título de una tabla en Word

Al imprimir un documento de Word o crear una tabla en Word, repetir el título en Word nos ayuda a rastrear el título de manera más conveniente y leer el título del documento sin problemas en diferentes páginas, especialmente con títulos largos.

Cómo crear mensajes animados en iMessage iOS 18

Cómo crear mensajes animados en iMessage iOS 18

El nuevo iMessage de iOS 18 se actualiza con mensajes animados, efectos de texto con muchas opciones para utilizar en los mensajes que envíes.

¿Por qué los cerdos son el némesis de las serpientes?

¿Por qué los cerdos son el némesis de las serpientes?

Hay un dato interesante sobre los cerdos que no todo el mundo conoce: los cerdos son considerados enemigos de las serpientes, porque cuando estos dos animales se encuentran, la mayoría de las serpientes se convertirán en alimento para los cerdos.

¿Cuál es la distancia entre la Tierra y Júpiter, el planeta más grande del Sistema Solar?

¿Cuál es la distancia entre la Tierra y Júpiter, el planeta más grande del Sistema Solar?

¿Cuál es la distancia de la Tierra a Júpiter? Si no lo sabes, este artículo te dirá a qué distancia está Júpiter de la Tierra.

Descubre los generales fuera de meta de la temporada S1 2023 Lien Quan Mobile

Descubre los generales fuera de meta de la temporada S1 2023 Lien Quan Mobile

¿Qué generales están fuera del meta de Mobile Alliance? Vamos a explorar ahora

Temporada 7.5 de Graves DTCL: Artículos estándar, plantilla de Graves Loi Long

Temporada 7.5 de Graves DTCL: Artículos estándar, plantilla de Graves Loi Long

Graves DTCL de la temporada 1, temporada 3 y temporada 6 cuestan solo 1 de oro y parece ser solo un campeón adicional para estimular al clan, el rol principal en el juego inicial todavía se usa pero no mucho. A partir de la temporada 7.5 de DTCL, el precio de Graves se ha disparado a 4 de oro y es definitivamente un carry indispensable si decides jugar con Dragón Trueno o Artillero.

Cómo usar sonidos de aplicaciones independientes en Samsung

Cómo usar sonidos de aplicaciones independientes en Samsung

Con los teléfonos Samsung, debes utilizar la función de sonido de la aplicación independiente. Por ejemplo, puedes reproducir Apple Music y tu teléfono enviará el audio a través de los altavoces de tu automóvil.

Buenas citas sobre el trabajo, buenos estados sobre el trabajo te inspiran a alcanzar el éxito.

Buenas citas sobre el trabajo, buenos estados sobre el trabajo te inspiran a alcanzar el éxito.

Hay muchos estados positivos sobre el trabajo en Internet. En este artículo te resumiremos algunos estados laborales buenos y significativos.

Subtítulos de aniversario de bodas, estados de aniversario de bodas significativos y dulces

Subtítulos de aniversario de bodas, estados de aniversario de bodas significativos y dulces

¿Cuál es un título bueno y significativo para un aniversario de bodas? El artículo resumirá para usted breves y concisos subtítulos de aniversario que pueden hacer que su pareja los recuerde para siempre.