Apple MLX en iPhone 16 Pro Max: inconsistencias numéricas en el chip A18 Pro
Apple MLX busca trasladar la eficiencia de NumPy al ecosistema de Apple Silicon para ejecutar modelos como Llama 3.2 y Phi-4 de forma nativa. La comunidad en Hacker News y GitHub ha seguido de cerca e

El Pitch
Apple MLX busca trasladar la eficiencia de NumPy al ecosistema de Apple Silicon para ejecutar modelos como Llama 3.2 y Phi-4 de forma nativa. La comunidad en Hacker News y GitHub ha seguido de cerca este framework por su promesa de convertir el iPhone 16 Pro Max en una estación de trabajo de IA local.
Bajo el capó
El rendimiento de MLX en dispositivos móviles está comprometido por fallos de precisión detectados específicamente en el silicio más reciente. Mientras que en los MacBook Pro con chips M-series el framework es sólido, en el chip A18 Pro del iPhone 16 Pro Max se están produciendo salidas numéricas erróneas en operaciones de punto flotante (Dossier UsedBy).
El investigador Rafael Costa documentó en enero de 2026 que los outputs de los tensores en este dispositivo son "un orden de magnitud incorrectos" si se comparan con el iPhone 15 Pro o modelos anteriores (rafaelcosta.me). Esto sugiere una regresión en el compilador de Metal o un defecto físico en las unidades MatMul del A18 Pro que no estaba presente en el chip A17.
A diferencia de CoreML, MLX se apoya casi exclusivamente en la GPU mediante Metal y no utiliza el Apple Neural Engine (ANE) para la mayoría de las operaciones de inferencia (GitHub #654). Esta dependencia técnica está causando problemas de consumo energético y consistencia de datos que los desarrolladores de LocalLLaMA llevan reportando desde principios de año (Reddit r/LocalLLaMA).
Otro punto crítico es la gestión de memoria unificada en iOS 19. La estrategia de "lazy evaluation" de MLX provoca cierres inesperados de la aplicación (memory kills) si el desarrollador no limpia manualmente la caché, un comportamiento derivado de las estrictas políticas de gestión de procesos en móviles (Reddit r/LocalLLaMA).
Aún no sabemos si estos errores de deriva numérica han sido heredados por la serie iPhone 17 lanzada a finales de 2025. Apple no ha emitido una respuesta oficial sobre si el problema del A18 Pro es un fallo de hardware permanente o si podrá corregirse mediante un parche de drivers en futuras versiones de iOS (Dossier UsedBy).
La opinión de Diego
Si estás pensando en desplegar lógica de inferencia crítica usando MLX en dispositivos móviles, detente ahora mismo. Es inaceptable que un iPhone 15 Pro supere en precisión técnica al modelo 16 Pro Max solo por un manejo deficiente de los tensores en el nuevo chip. Ahora mismo estamos en una "trampa de frameworks": CoreML es demasiado cerrado y MLX en móvil es, honestamente, un campo de minas numérico. No lo uses para nada que no sea un experimento de fin de semana hasta que Apple aclare si el A18 Pro tiene el silicio roto o simplemente el compilador de Metal necesita una revisión urgente.
Código limpio siempre,
Diego.

Diego Navarro - Early Adopter Tech Analyst at UsedBy.ai
Artículos relacionados

SQLite: El estándar de la Library of Congress para la persistencia en el edge
SQLite ha dejado de ser considerado una base de datos "de juguete" para convertirse en el estándar de facto en despliegues local-first y arquitecturas edge en 2026. Su reconocimiento por parte de la L

La paradoja de la productividad y la elongación de artefactos por IA
Claude 4.5 Opus y GPT-5 han permitido que perfiles junior generen entregables que, a primera vista, parecen obra de un senior con años de experiencia. La comunidad en Hacker News está analizando cómo

Steam Controller 2026 y Steam Controller Puck: CAD abierto y sticks TMR
Valve ha trasladado la tecnología de sticks TMR y los trackpads duales de la Steam Deck a un mando independiente que busca estandarizar el input de alta precisión. La gran noticia para la comunidad de
Mantente al día con las tendencias de adopción de IA
Recibe nuestros últimos informes y análisis en tu correo. Sin spam, solo datos.