Nvidia Greenboost — En nuestro radar
Nvidia Greenboost — En nuestro radar

Estado: 🟡 En observación
Por qué hablamos de esto: Promete ejecutar modelos locales de clase GPT-5 en hardware de consumo extendiendo la VRAM hacia la RAM y el NVMe mediante un hack de software (GitLab/Phoronix).
Lo que sabemos:
- Es un shim de CUDA en espacio de usuario desarrollado por Ferran Duarri que intercepta asignaciones de memoria mediante LD_PRELOAD (GitLab Documentation).
- Permite un offload nativo del KV cache para ExLlamaV3, una funcionalidad ausente en la mayoría de implementaciones actuales (Reddit/LocalLLaMA).
- Utiliza DMA-BUF e incluye un hilo de watchdog en el kernel para intentar mitigar cuelgues por falta de memoria (GitLab Issue #3).
- El rendimiento real está limitado por el ancho de banda del bus PCIe 4.0/5.0, ofreciendo apenas entre 2 y 5 tokens por segundo (Phoronix).
Las zonas grises:
- No existen comparativas oficiales de rendimiento frente a los quants locales de GPT-5 Mini en las nuevas GPUs Blackwell serie 50 (Dossier UsedBy).
- Faltan datos de estabilidad técnica para entornos de servidor que requieran alta disponibilidad (Dossier UsedBy).
- Se desconoce su compatibilidad con las funciones propietarias del driver NVIDIA 595.x "Blackwell-Ultra" (Dossier UsedBy).
Este artículo se actualizará cuando tengamos más datos. Mientras tanto, precaución.
Código limpio siempre,
Diego.

Diego Navarro - Early Adopter Tech Analyst at UsedBy.ai
Artículos relacionados

Audiomass: Edición de audio multitrack en 100KB de vanilla JS
Audiomass es un editor de audio basado en web que prescinde de backend y plugins, ejecutándose totalmente en el cliente mediante Web Audio API. En un 2026 saturado de aplicaciones pesadas, esta utilid

Protocolo Ético Magnifica Humanitas: La Interpretabilidad Mecanicista como Imperativo Moral
El documento establece que la tecnología nunca es neutral y que los ingenieros cargan con una responsabilidad directa sobre el impacto de sus arquitecturas. Basándose en la participación de figuras cl

El estado de la búsqueda web en 2026: Kagi, Uruky y el modelo de suscripción
Google ha consolidado su transición de buscador a motor de respuestas con Gemini 3.5, capturando el 60% de las consultas sin que el usuario haga un solo clic (fuente: The Next Web). Ante este panorama
Mantente al día con las tendencias de adopción de IA
Recibe nuestros últimos informes y análisis en tu correo. Sin spam, solo datos.