Apple desarrolla un método innovador para ejecutar LLM en iPhones – MacRumors

Create a vivid, action-filled illustration showcasing an advanced technology development process in a whimsical and friendly manner. Include a robotic assistant operating a digital interface in its hand, projecting the Stable Video Diffusion technology. This 'projected' scene should entail a cascade of frames creating a fluid video. Ensure the robot appears to be in control of variables like motion strength, layout, and resolution. Overlay graphics should include a range of image formats (such as jpg and png thumbnails) converting to MP4. In the background, subtly portray other innovative models tagged with names like 'Stable Diffusion XL'. Keep the style close to 3:2 aspect ratio.

Los investigadores de IA de Apple han desarrollado un método revolucionario para ejecutar grandes modelos lingüísticos (LLM) en iPhones y otros dispositivos Apple con memoria limitada. Han inventado una innovadora técnica de utilización de la memoria flash para superar las limitaciones de memoria de los chatbots basados en LLM. La técnica consiste en almacenar los datos del modelo de IA en la memoria flash, más abundante en los dispositivos móviles que la RAM tradicional. Los investigadores utilizan dos técnicas clave, windowing y row-column bundling, para minimizar la transferencia de datos y maximizar el rendimiento de la memoria flash. Esto permite que los modelos de IA se ejecuten hasta el doble del tamaño de la memoria disponible del iPhone&#8217, lo que se traduce en velocidades de procesamiento significativamente más rápidas. El avance abre posibilidades para funciones avanzadas de Siri, traducción de idiomas en tiempo real y funciones basadas en IA para fotografía y realidad aumentada en futuros iPhones. Apple también está desarrollando su propio modelo de IA generativa, llamado «Ajax», para competir con los modelos GPT-3 y GPT-4 de OpenAI. Ajax funciona con 200.000 millones de parámetros y pretende integrar más profundamente la IA en el ecosistema de Apple. Se espera que Apple ofrezca una combinación de IA basada en la nube y procesamiento en el dispositivo para funciones de IA generativa en el iPhone y el iPad a finales de 2024.

Artículo completo

Deja una respuesta