Apple MLX en iPhone 16 Pro Max: inconsistencias numéricas en el chip A18 Pro
Apple MLX busca trasladar la eficiencia de NumPy al ecosistema de Apple Silicon para ejecutar modelos como Llama 3.2 y Phi-4 de forma nativa. La comunidad en Hacker News y GitHub ha seguido de cerca e

El Pitch
Apple MLX busca trasladar la eficiencia de NumPy al ecosistema de Apple Silicon para ejecutar modelos como Llama 3.2 y Phi-4 de forma nativa. La comunidad en Hacker News y GitHub ha seguido de cerca este framework por su promesa de convertir el iPhone 16 Pro Max en una estación de trabajo de IA local.
Bajo el capó
El rendimiento de MLX en dispositivos móviles está comprometido por fallos de precisión detectados específicamente en el silicio más reciente. Mientras que en los MacBook Pro con chips M-series el framework es sólido, en el chip A18 Pro del iPhone 16 Pro Max se están produciendo salidas numéricas erróneas en operaciones de punto flotante (Dossier UsedBy).
El investigador Rafael Costa documentó en enero de 2026 que los outputs de los tensores en este dispositivo son "un orden de magnitud incorrectos" si se comparan con el iPhone 15 Pro o modelos anteriores (rafaelcosta.me). Esto sugiere una regresión en el compilador de Metal o un defecto físico en las unidades MatMul del A18 Pro que no estaba presente en el chip A17.
A diferencia de CoreML, MLX se apoya casi exclusivamente en la GPU mediante Metal y no utiliza el Apple Neural Engine (ANE) para la mayoría de las operaciones de inferencia (GitHub #654). Esta dependencia técnica está causando problemas de consumo energético y consistencia de datos que los desarrolladores de LocalLLaMA llevan reportando desde principios de año (Reddit r/LocalLLaMA).
Otro punto crítico es la gestión de memoria unificada en iOS 19. La estrategia de "lazy evaluation" de MLX provoca cierres inesperados de la aplicación (memory kills) si el desarrollador no limpia manualmente la caché, un comportamiento derivado de las estrictas políticas de gestión de procesos en móviles (Reddit r/LocalLLaMA).
Aún no sabemos si estos errores de deriva numérica han sido heredados por la serie iPhone 17 lanzada a finales de 2025. Apple no ha emitido una respuesta oficial sobre si el problema del A18 Pro es un fallo de hardware permanente o si podrá corregirse mediante un parche de drivers en futuras versiones de iOS (Dossier UsedBy).
La opinión de Diego
Si estás pensando en desplegar lógica de inferencia crítica usando MLX en dispositivos móviles, detente ahora mismo. Es inaceptable que un iPhone 15 Pro supere en precisión técnica al modelo 16 Pro Max solo por un manejo deficiente de los tensores en el nuevo chip. Ahora mismo estamos en una "trampa de frameworks": CoreML es demasiado cerrado y MLX en móvil es, honestamente, un campo de minas numérico. No lo uses para nada que no sea un experimento de fin de semana hasta que Apple aclare si el A18 Pro tiene el silicio roto o simplemente el compilador de Metal necesita una revisión urgente.
Código limpio siempre,
Diego.

Diego Navarro - Early Adopter Tech Analyst at UsedBy.ai
Artículos relacionados
CVE-2026-31431 y la propuesta de moratorio de instalación de Xe Iaso
La vulnerabilidad Copy Fail ha invalidado el modelo de confianza en la cadena de suministro de software de Linux en mayo de 2026. Xe Iaso propone un moratorio inmediato en la instalación de cualquier
Cloudflare y la reestructuración por eficiencia en agentes de IA
Cloudflare ha ejecutado un pivot hacia un modelo operativo "agentic AI-first" tras registrar un aumento del 600% en la eficiencia de sus agentes internos. La compañía busca automatizar la gestión de s

Canvas sufre brecha masiva de 3.65 TB y caída global de servicios
Canvas es el sistema de gestión de aprendizaje (LMS) de Instructure que centraliza la educación de 30 millones de usuarios bajo un modelo SaaS multi-tenant. En Hacker News, el debate se centra en la f
Mantente al día con las tendencias de adopción de IA
Recibe nuestros últimos informes y análisis en tu correo. Sin spam, solo datos.