Deepseek lanza el modelo de lenguaje gratuito v3 que funciona bien en configuraciones de hardware comunes

La startup china de inteligencia artificial DeepSeek acaba de lanzar oficialmente su último modelo de lenguaje grande (LLM), DeepSeek-V3-0324. Con una capacidad de hasta 641 GB, este modelo fue anunciado en la plataforma AI Hugging Face sin que se revelara mucha información, en línea con el estilo hermético sobre nuevos productos que la compañía siempre ha aplicado hasta ahora.

Lo especial de este modelo es la licencia MIT, que permite su uso libre para fines comerciales. Los resultados iniciales de referencia muestran que DeepSeek-V3-0324 es capaz de ejecutarse en configuraciones de hardware convencionales, como Mac Studio de Apple con el chip M3 Ultra. El científico de IA Awni Hannun informó que fue posible lograr velocidades de procesamiento de más de 20 tokens por segundo utilizando esta configuración. Esta capacidad de ejecutar un modelo de lenguaje grande en hardware básico en las instalaciones contrasta marcadamente con el enfoque tradicional de utilizar una infraestructura de centro de datos masiva para respaldar modelos de IA avanzados.

Deepseek lanza el modelo de lenguaje gratuito v3 que funciona bien en configuraciones de hardware comunes

Según la información de DeepSeek, las pruebas iniciales han mostrado mejoras significativas con respecto a versiones anteriores. Este modelo ha sido probado rigurosamente por partes interesadas internas y ha demostrado un rendimiento excelente, superando incluso a todos los demás modelos de la competencia y superando al Claude Sonnet 3.5 de Anthropic en tareas que no requieren un pensamiento profundo. Sin embargo, a diferencia de los modelos estilo Sonnet que requieren una suscripción paga, DeepSeek-V3-0324 se puede descargar y usar completamente gratis.

Técnicamente, DeepSeek-V3-0324 utiliza una arquitectura mixta de expertos (MoE). Se destaca por su capacidad de utilizar de forma selectiva alrededor de 37 mil millones de los 685 mil millones de parámetros por tarea, aumentando la eficiencia al reducir las demandas computacionales y manteniendo el rendimiento. Este modelo también aplica tecnologías de Atención Latente Multi-Cabeza (MLA) y Predicción Multi-Token (MTP), que contribuyen a mejorar la memoria de contexto y acelerar la salida.

Los usuarios pueden acceder a DeepSeek-V3-0324 a través de Hugging Face, la interfaz de chat y la API de OpenRouter, así como la plataforma de chat de DeepSeek si lo desean. El proveedor de servicios de inferencia Hyperbolic Labs también proporciona acceso al modelo.

Con el lanzamiento de DeepSeek-V3-0324, la compañía continúa afirmando su posición en la carrera por desarrollar modelos de lenguaje grandes, al tiempo que proporciona una opción poderosa y accesible para la comunidad de investigación y desarrollo de IA. La capacidad de ejecutarse en hardware comercial junto con una licencia gratuita seguramente abrirá muchas oportunidades de aplicación práctica para este modelo en el futuro cercano.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft integra DeepSeek en la plataforma PC Copilot+

Microsoft integra DeepSeek en la plataforma PC Copilot+

En enero, Microsoft anunció planes para llevar versiones optimizadas para NPU del modelo DeepSeek-R1 directamente a las computadoras Copilot+ que funcionan con procesadores Qualcomm Snapdragon X.

Cómo registrar rápidamente una cuenta de DeepSeek

Cómo registrar rápidamente una cuenta de DeepSeek

La aplicación de inteligencia artificial DeepSeek, con sede en China, lidera actualmente las listas de la tienda de aplicaciones.

Los estafadores utilizan Deepseek para robar datos de los usuarios

Los estafadores utilizan Deepseek para robar datos de los usuarios

Los malos están creando miles de sitios web similares a DeepSeek con la esperanza de que usuarios desprevenidos les den su información personal.

Softbank planea superar a Microsoft y convertirse en el mayor inversor de OpenAI

Softbank planea superar a Microsoft y convertirse en el mayor inversor de OpenAI

El gigante inversor japonés Softbank planea invertir entre 15 y 25 mil millones de dólares en OpenAI. Si el acuerdo se concreta, Softbank se convertirá en el mayor inversor de OpenAI, reemplazando a Microsoft, que actualmente ocupa el puesto.

Estos anuncios falsos de DeepSeek están difundiendo malware peligroso

Estos anuncios falsos de DeepSeek están difundiendo malware peligroso

Una serie de anuncios fraudulentos de DeepSeek en Google están enviando malware peligroso que roba información a usuarios de DeepSeek desprevenidos.

Huawei lanza el teléfono plegable Pura X con asistente de inteligencia artificial DeepSeek

Huawei lanza el teléfono plegable Pura X con asistente de inteligencia artificial DeepSeek

Huawei se embarca en una era completamente libre de Android con el Pura X, un nuevo teléfono plegable que ejecuta el software HarmonyOS 5 de la compañía y no incluye una opción para que las personas usen el sistema operativo de Google.

4 razones por las que deberías dejar de usar ChatGPT y empezar a usar DeepSeek

4 razones por las que deberías dejar de usar ChatGPT y empezar a usar DeepSeek

DeepSeek es el nombre de una empresa china de inteligencia artificial y de su chatbot del mismo nombre. Los modelos estrella de la compañía, DeepSeek-V3 y DeepSeek-R1, han causado sensación porque son más baratos de entrenar y usar que sus homólogos.

Olvídate de la RTX 5070, ni siquiera la RTX 5080 puede vencer a la RTX 4090

Olvídate de la RTX 5070, ni siquiera la RTX 5080 puede vencer a la RTX 4090

La semana pasada no ha sido feliz para los inversores ni para los fans de Nvidia.

8 grandes desventajas de los teléfonos con pantalla plegable que no esperabas

8 grandes desventajas de los teléfonos con pantalla plegable que no esperabas

No se puede negar que los teléfonos plegables son geniales. Pero después de usarlo durante un tiempo, este dispositivo presenta algunas peculiaridades. ¡Aquí hay 5 desventajas principales de los teléfonos con pantalla plegable que no esperabas!

Adobe lleva la tecnología de creación de videos con IA a Premiere Pro

Adobe lleva la tecnología de creación de videos con IA a Premiere Pro

Adobe ha acercado la tecnología de creación de videos con inteligencia artificial a las masas de una manera nueva, aunque todavía no ha creado una película terminada utilizando esta tecnología.

Últimos códigos de Genshin Impact de abril de 2025

Últimos códigos de Genshin Impact de abril de 2025

El código Genshin Impact 5.5 te ayuda a canjearlos por piedras primordiales, minerales mágicos, experiencia y muchas otras recompensas.

Cómo convertir tu iPad en una pantalla extra para tu Mac

Cómo convertir tu iPad en una pantalla extra para tu Mac

macOS Catalina y iPadOS incluyen soporte para una nueva función llamada Sidecar, diseñada para permitirte usar tu iPad como pantalla secundaria para tu Mac.

Fondo de pantalla 1280, hermoso fondo de pantalla del teléfono Nokia 1280

Fondo de pantalla 1280, hermoso fondo de pantalla del teléfono Nokia 1280

Este es un conjunto de fondos de pantalla de Nokia 1280, si alguna vez envió un mensaje de texto para obtener fondos de pantalla 1280, fondos de pantalla de teléfonos de ladrillo, entonces intente mirar estos fondos de pantalla.

Avión espacial hipersónico alcanza una velocidad de 11.115 km/h

Avión espacial hipersónico alcanza una velocidad de 11.115 km/h

Venus Aerospace ha revelado las primeras imágenes de su nuevo avión hipersónico llamado Stargazer, que puede alcanzar una velocidad máxima de 11.115 km/h, equivalente a Mach 9.

Comer plátanos en el desayuno ayuda a reducir la hinchazón.

Comer plátanos en el desayuno ayuda a reducir la hinchazón.

La hinchazón puede afectar a cualquiera. La buena noticia es que el desayuno es un buen momento para agregar algunos ingredientes a tu comida que ayudarán a reducir la hinchazón. Ese ingrediente es el plátano.

OpenAI anuncia una importante actualización para la generación de imágenes con IA en ChatGPT

OpenAI anuncia una importante actualización para la generación de imágenes con IA en ChatGPT

OpenAI acaba de presentar oficialmente una notable actualización de la capacidad de generación de imágenes de IA en ChatGPT, un importante paso adelante en lugar de utilizar un modelo de generación de imágenes separado como el DALL-E anterior.

Deepseek lanza el modelo de lenguaje gratuito v3 que funciona bien en configuraciones de hardware comunes

Deepseek lanza el modelo de lenguaje gratuito v3 que funciona bien en configuraciones de hardware comunes

La startup china de inteligencia artificial DeepSeek acaba de lanzar oficialmente su último modelo de lenguaje grande (LLM), DeepSeek-V3-0324.

Razones para dejar Gboard y cambiar al teclado Samsung

Razones para dejar Gboard y cambiar al teclado Samsung

Gboard ha sido durante mucho tiempo el teclado preferido en los teléfonos Android. Sin embargo, muchas personas han cambiado recientemente al teclado Samsung y no han mirado atrás.

Dulces y románticos deseos de fin de semana para los enamorados

Dulces y románticos deseos de fin de semana para los enamorados

Envíale dulces y románticos deseos de fin de semana a tu amante. Aunque sean sólo palabras o mensajes, serán regalos espirituales significativos que ayudarán a fortalecer su relación.

La serie de televisión de Harry Potter necesita los siguientes elementos para tener éxito

La serie de televisión de Harry Potter necesita los siguientes elementos para tener éxito

Se espera que el remake de Harry Potter de HBO se estrene en 2026. Esto es lo que hace que la versión televisiva de Harry Potter sea un éxito.

Impresionantes imágenes de la superluna desde todo el mundo.

Impresionantes imágenes de la superluna desde todo el mundo.

No es raro encontrar imágenes hermosas de la luna en Internet. El artículo resumirá para usted las imágenes de la luna más hermosas del mundo.

Los usuarios de AMD Ryzen deberían instalar esta actualización del BIOS para obtener un aumento de rendimiento gratuito

Los usuarios de AMD Ryzen deberían instalar esta actualización del BIOS para obtener un aumento de rendimiento gratuito

Ahora, AMD ha respondido a los problemas con su línea de CPU insignia de bajo rendimiento con una nueva actualización que podría ofrecer algunos cuadros más por segundo.

El valor de X cae de 44 mil millones de dólares a menos de 10 mil millones de dólares

El valor de X cae de 44 mil millones de dólares a menos de 10 mil millones de dólares

En octubre de 2022, Elon Musk gastó 44 mil millones de dólares para adquirir X, pero hasta la fecha el valor de la plataforma ha caído un 78,6% a aproximadamente 9,4 mil millones de dólares.