Apple MLX en iPhone 16 Pro Max: inconsistencias numéricas en el chip A18 Pro

Diego Navarro

Early Adopter Tech Analyst

El Pitch

Apple MLX busca trasladar la eficiencia de NumPy al ecosistema de Apple Silicon para ejecutar modelos como Llama 3.2 y Phi-4 de forma nativa. La comunidad en Hacker News y GitHub ha seguido de cerca este framework por su promesa de convertir el iPhone 16 Pro Max en una estación de trabajo de IA local.

Bajo el capó

El rendimiento de MLX en dispositivos móviles está comprometido por fallos de precisión detectados específicamente en el silicio más reciente. Mientras que en los MacBook Pro con chips M-series el framework es sólido, en el chip A18 Pro del iPhone 16 Pro Max se están produciendo salidas numéricas erróneas en operaciones de punto flotante (Dossier UsedBy).

El investigador Rafael Costa documentó en enero de 2026 que los outputs de los tensores en este dispositivo son "un orden de magnitud incorrectos" si se comparan con el iPhone 15 Pro o modelos anteriores (rafaelcosta.me). Esto sugiere una regresión en el compilador de Metal o un defecto físico en las unidades MatMul del A18 Pro que no estaba presente en el chip A17.

A diferencia de CoreML, MLX se apoya casi exclusivamente en la GPU mediante Metal y no utiliza el Apple Neural Engine (ANE) para la mayoría de las operaciones de inferencia (GitHub #654). Esta dependencia técnica está causando problemas de consumo energético y consistencia de datos que los desarrolladores de LocalLLaMA llevan reportando desde principios de año (Reddit r/LocalLLaMA).

Otro punto crítico es la gestión de memoria unificada en iOS 19. La estrategia de "lazy evaluation" de MLX provoca cierres inesperados de la aplicación (memory kills) si el desarrollador no limpia manualmente la caché, un comportamiento derivado de las estrictas políticas de gestión de procesos en móviles (Reddit r/LocalLLaMA).

Aún no sabemos si estos errores de deriva numérica han sido heredados por la serie iPhone 17 lanzada a finales de 2025. Apple no ha emitido una respuesta oficial sobre si el problema del A18 Pro es un fallo de hardware permanente o si podrá corregirse mediante un parche de drivers en futuras versiones de iOS (Dossier UsedBy).

La opinión de Diego

Si estás pensando en desplegar lógica de inferencia crítica usando MLX en dispositivos móviles, detente ahora mismo. Es inaceptable que un iPhone 15 Pro supere en precisión técnica al modelo 16 Pro Max solo por un manejo deficiente de los tensores en el nuevo chip. Ahora mismo estamos en una "trampa de frameworks": CoreML es demasiado cerrado y MLX en móvil es, honestamente, un campo de minas numérico. No lo uses para nada que no sea un experimento de fin de semana hasta que Apple aclare si el A18 Pro tiene el silicio roto o simplemente el compilador de Metal necesita una revisión urgente.

Código limpio siempre,
Diego.

Diego Navarro

Diego Navarro - Early Adopter Tech Analyst at UsedBy.ai

Apple MLX en iPhone 16 Pro Max: inconsistencias numéricas en el chip A18 Pro

El Pitch

Bajo el capó

La opinión de Diego

Artículos relacionados

Audiomass: Edición de audio multitrack en 100KB de vanilla JS

Protocolo Ético Magnifica Humanitas: La Interpretabilidad Mecanicista como Imperativo Moral

El estado de la búsqueda web en 2026: Kagi, Uruky y el modelo de suscripción

Mantente al día con las tendencias de adopción de IA