Conecta con Nosotros

Hola, ¿qué estás buscando?

Seguridad

Google lanza ‘cascadas especulativas’ para LLM más eficientes

La nueva tecnología de Google mejora la inferencia de LLM con ‘cascadas especulativas’ más rápidas y económicas.

Google ha presentado su innovadora tecnología de ‘cascadas especulativas’, diseñada para optimizar la eficiencia y reducir los costos computacionales de los modelos grandes de lenguaje (LLM), como Gemma. Esta nueva técnica permite lograr inferencias más inteligentes y rápidas, combinando sistemas de decodificación especulativa con cascadas estándar, sin sacrificar la calidad en el proceso.

Mejoras en la inferencia de modelos de lenguaje

Los LLM son fundamentales en el ámbito de la Inteligencia Artificial, impulsando desde funciones de búsqueda avanzada hasta asistentes de programación creativos. Sin embargo, su uso intensivo genera un alto costo de inferencia, lo que se vuelve un desafío a medida que su implementación crece. Google ha señalado la urgencia de desarrollar LLM “más rápidos y económicos” para satisfacer la demanda creciente de usuarios.

La tecnología de ‘cascadas especulativas’ combina lo mejor de los sistemas de cascadas y la decodificación especulativa. Según un comunicado de Google, las cascadas permiten utilizar modelos más pequeños y rápidos, que procesan consultas sencillas, mientras que las tareas complejas se transfieren a modelos más grandes y costosos. Así, se busca maximizar la eficiencia al permitir que los modelos pequeños manejen la mayor cantidad de tareas posible.

Funcionamiento de las cascadas especulativas

La decodificación especulativa, por su parte, utiliza un modelo más pequeño para predecir una secuencia de ‘tokens’, que luego se verifica con el modelo más grande. Si el modelo grande acepta la predicción, genera múltiples tokens en un solo paso, lo que acelera el proceso y asegura que el resultado sea idéntico a lo que el modelo grande habría producido por sí solo.

Este enfoque no solo reduce la latencia, sino que también incrementa la velocidad de respuesta. Las pruebas realizadas con los modelos Gemma y T5 han demostrado que las ‘cascadas especulativas’ logran un “mejor equilibrio entre costo y calidad”, generando métricas de rendimiento superiores en comparación con métodos tradicionales.

Google destaca que este sistema híbrido ofrece una herramienta más potente y flexible para los desarrolladores, permitiendo un control preciso sobre el equilibrio entre costo y calidad. Esto abre la puerta a aplicaciones más inteligentes y rápidas, adaptándose a las necesidades del presente y del futuro en el ámbito de la Inteligencia Artificial.

Te recomendamos

Última Hora

PcComponentes ofrece descuentos inéditos en televisores OLED LG y Philips con envío rápido y precios imbatibles.

Política

Miguel Izaguirre Castro enfrenta inhabilitación temporal por tres meses.

Tecnología

OpenAI lanza Sora para Android, impulsando la creación de videos generados por IA.

Tecnología

Google y Epic Games llegan a un acuerdo para reformar el ecosistema de Android y la Play Store

Entretenimiento

Cada 5 de noviembre se rinde homenaje a quienes traen alegría a nuestras vidas.

Salud

La influenza aumenta durante el frío en Baja California Sur; conoce sus síntomas y cómo prevenirla.

Entretenimiento

La actriz Isabelle Huppert afirma que siempre ha optado por directores seguros.

Última Hora

Desaparecen los símbolos que conocías: alerta en tu pantalla principal Los cambios no son menores ni opcionales.

Última Hora

Sin embargo, aseguraron que es raro verlos tomando el sol, ya que cuando se meten al agua no suelen volver a salir.

Tecnología

El nuevo botón de Amazon utiliza IA para ofrecer recomendaciones personalizadas a los compradores.

Tecnología

Los Servicios de Google Play son cruciales para el funcionamiento de tu dispositivo Android.

Economía

Eli Defferary explica soluciones para quienes no pueden pagar su hipoteca.

Copyright © Todos los derechos reservados. Este sitio web ofrece noticias generales y contenido educativo con fines únicamente informativos. Si bien nos esforzamos por brindar información precisa, no garantizamos la integridad ni la fiabilidad de los contenidos presentados. El contenido no debe considerarse asesoramiento profesional de ningún tipo. Se recomienda a los lectores verificar los datos y consultar a expertos adecuados cuando sea necesario. No nos hacemos responsables de ninguna pérdida o inconveniente derivado del uso de la información en este sitio.