Conecta con Nosotros

Hola, ¿qué estás buscando?

Tecnología

DeepSeek revela costos bajos en entrenamiento de su IA R1

DeepSeek reporta costos de 294 mil dólares para entrenar su IA R1, sorprendiendo al sector.

DeepSeek, una empresa china de inteligencia artificial, ha revelado que el costo de entrenamiento de su modelo R1 alcanzó los 294 mil dólares. Este monto es considerablemente más bajo en comparación con los gastos reportados por empresas estadounidenses del sector. La información fue publicada en la revista académica Nature, lo que podría reactivar el debate sobre la posición de Pekín en la carrera global por el desarrollo de la inteligencia artificial.

Este anuncio, considerado inusual, representa la primera estimación pública de los costos asociados con la formación del modelo R1. En el artículo, el fundador de la compañía, Liang Wenfeng, se menciona como coautor y se detalla que el modelo, enfocado en el razonamiento, fue entrenado utilizando 512 chips H800 de Nvidia durante un total de 80 horas.

Una versión anterior del artículo, que se publicó en enero, no contenía esta información específica. La cifra presentada por DeepSeek contrasta notablemente con las declaraciones de Sam Altman, CEO de OpenAI, quien en 2023 afirmó que el costo de entrenamiento de los llamados “modelos fundacionales” superaba los 100 millones de dólares, aunque sin ofrecer cifras precisas.

Los altos costos en este ámbito suelen ser el resultado del uso intensivo de clústeres de chips durante un largo periodo, a menudo semanas o meses, para procesar grandes volúmenes de datos y código.

Sin embargo, algunas afirmaciones de DeepSeek sobre sus recursos han sido objeto de cuestionamientos en Estados Unidos. La compañía aseguró que utilizó los chips H800, diseñados por Nvidia para el mercado chino, tras las restricciones impuestas por Washington en 2022 que prohibieron la exportación de modelos más avanzados como los H100 y A100. Funcionarios estadounidenses informaron a Reuters que la empresa habría tenido acceso a “grandes volúmenes” de chips H100 a pesar de estas limitaciones.

Nvidia respondió afirmando que DeepSeek solo utilizó los chips H800 adquiridos de manera legal. En un documento adicional, la compañía admitió que posee chips A100, los cuales fueron empleados en fases preliminares del proyecto. “En lo que respecta a nuestra investigación sobre DeepSeek-R1, utilizamos las GPU A100 para preparar los experimentos con un modelo más pequeño”, explicaron los investigadores. Posteriormente, el entrenamiento principal se llevó a cabo utilizando los 512 H800.

La capacidad de DeepSeek para operar un clúster de supercomputación A100 ha sido un factor clave para atraer a algunos de los especialistas más destacados de China en el campo de la inteligencia artificial, según informes de Reuters.

Publicidad. Desplázate para seguir leyendo.

Te recomendamos

Tecnología

Nvidia y Intel anuncian una colaboración histórica para crear CPUs x86 personalizadas

Economía

Nvidia respaldará a Intel con una inversión significativa, sin acuerdo de fabricación.

Economía

Nvidia y Intel forjan una alianza histórica en inteligencia artificial y semiconductores.

Tecnología

Pekín impone restricciones a empresas tecnológicas para impulsar su industria de chips frente a Estados Unidos.

Última Hora

La Inteligencia Artificial revoluciona la vida cotidiana con herramientas como ChatGPT, Gemini y Copilot.

Tecnología

TikTok seguirá usando el algoritmo de ByteDance a pesar de la incertidumbre en su operación en EE.UU.

Mundo

China denuncia que acciones de EU ponen en riesgo la paz y soberanía en el Caribe tras retención de un buque pesquero.

Última Hora

Noticia de última hora que cambia todo.

Economía

China condena la propuesta de aranceles del 50% a sus autos y la califica como coerción inaceptable.

Seguridad

Las Fuerzas Armadas chinas vigilan el paso de buques militares por el estrecho de Taiwán.

Entretenimiento

Rusia promete ayuda a China para que supere el potencial nuclear de Estados Unidos en energía atómica.

Mundo

Trump acusa a Putin y Kim de conspirar mientras se reúnen en Pekín para celebrar el fin de la Segunda Guerra Mundial.

Publicidad

Copyright © Todos los derechos reservados. Este sitio web ofrece noticias generales y contenido educativo con fines únicamente informativos. Si bien nos esforzamos por brindar información precisa, no garantizamos la integridad ni la fiabilidad de los contenidos presentados. El contenido no debe considerarse asesoramiento profesional de ningún tipo. Se recomienda a los lectores verificar los datos y consultar a expertos adecuados cuando sea necesario. No nos hacemos responsables de ninguna pérdida o inconveniente derivado del uso de la información en este sitio.