Los investigadores de IA de Apple han desarrollado un método revolucionario para ejecutar grandes modelos lingüísticos (LLM) en iPhones y otros dispositivos Apple con memoria limitada. Han inventado una innovadora técnica de utilización de la memoria flash para superar las limitaciones de memoria de los chatbots basados en LLM. La técnica consiste en almacenar los datos del modelo de IA en la memoria flash, más abundante en los dispositivos móviles que la RAM tradicional. Los investigadores utilizan dos técnicas clave, windowing y row-column bundling, para minimizar la transferencia de datos y maximizar el rendimiento de la memoria flash. Esto permite que los modelos de IA se ejecuten hasta el doble del tamaño de la memoria disponible del iPhone’, lo que se traduce en velocidades de procesamiento significativamente más rápidas. El avance abre posibilidades para funciones avanzadas de Siri, traducción de idiomas en tiempo real y funciones basadas en IA para fotografía y realidad aumentada en futuros iPhones. Apple también está desarrollando su propio modelo de IA generativa, llamado «Ajax», para competir con los modelos GPT-3 y GPT-4 de OpenAI. Ajax funciona con 200.000 millones de parámetros y pretende integrar más profundamente la IA en el ecosistema de Apple. Se espera que Apple ofrezca una combinación de IA basada en la nube y procesamiento en el dispositivo para funciones de IA generativa en el iPhone y el iPad a finales de 2024.
