Nvidia Greenboost — En nuestro radar

Diego Navarro

Early Adopter Tech Analyst

Estado: 🟡 En observación
Por qué hablamos de esto: Promete ejecutar modelos locales de clase GPT-5 en hardware de consumo extendiendo la VRAM hacia la RAM y el NVMe mediante un hack de software (GitLab/Phoronix).

Lo que sabemos:
- Es un shim de CUDA en espacio de usuario desarrollado por Ferran Duarri que intercepta asignaciones de memoria mediante LD_PRELOAD (GitLab Documentation).
- Permite un offload nativo del KV cache para ExLlamaV3, una funcionalidad ausente en la mayoría de implementaciones actuales (Reddit/LocalLLaMA).
- Utiliza DMA-BUF e incluye un hilo de watchdog en el kernel para intentar mitigar cuelgues por falta de memoria (GitLab Issue #3).
- El rendimiento real está limitado por el ancho de banda del bus PCIe 4.0/5.0, ofreciendo apenas entre 2 y 5 tokens por segundo (Phoronix).

Las zonas grises:
- No existen comparativas oficiales de rendimiento frente a los quants locales de GPT-5 Mini en las nuevas GPUs Blackwell serie 50 (Dossier UsedBy).
- Faltan datos de estabilidad técnica para entornos de servidor que requieran alta disponibilidad (Dossier UsedBy).
- Se desconoce su compatibilidad con las funciones propietarias del driver NVIDIA 595.x "Blackwell-Ultra" (Dossier UsedBy).

Este artículo se actualizará cuando tengamos más datos. Mientras tanto, precaución.

Código limpio siempre,
Diego.

Diego Navarro

Diego Navarro - Early Adopter Tech Analyst at UsedBy.ai

Nvidia Greenboost — En nuestro radar

Artículos relacionados

Audiomass: Edición de audio multitrack en 100KB de vanilla JS

Protocolo Ético Magnifica Humanitas: La Interpretabilidad Mecanicista como Imperativo Moral

El estado de la búsqueda web en 2026: Kagi, Uruky y el modelo de suscripción

Mantente al día con las tendencias de adopción de IA