Los chips de Huawei impulsan la inteligencia artificial DeepSeek

Huawei DeepSeek

Las guerras de la IA se están calentando con DeepSeek, un modelo chino de IA que afirma superar significativamente a sus competidores estadounidenses en cuanto a eficiencia de costes. Su chatbot de código abierto ha impulsado a la aplicación a la primera posición en la App Store en 51 países, y ahora se ha revelado que funciona con un chip de IA de Huawei.

El modelo de lenguaje grande (LLM) DeepSeek R1 se entrenó en Nvidia H100, pero utiliza un chip Ascend 910C para la inferencia, que es la acción de utilizar el modelo entrenado para generar respuestas.




La información proviene de @Dorialexander, quien señala que los chips Ascend no se ocupan del entrenamiento, por lo que los requisitos de energía de la GPU no son tan altos.

Sin embargo, el rendimiento relativamente inferior del Ascend 910C limita su idoneidad para el entrenamiento. Huawei planea abordar este problema con el próximo chip 920C que pretende competir con Blackwell B200, el chipset líder de Nvidia para operaciones de IA.




Acerca del autor
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.