¿Apple Intelligence es más eficiente que GPT-4? Ya tenemos la respuesta

La presentación de Apple Intelligence fue uno de los anuncios más destacados en la keynote inaugural del WWDC 2024. La empresa de Cupertino ha revelado detalles sobre el proceso de entrenamiento de su nuevo modelo de inteligencia artificial (IA) y los niveles de eficiencia que puede alcanzar en comparación con otros productos, como GPT-4 de OpenAI, Gemma de Meta y Phi de Microsoft.

El equipo de desarrollo de la firma publicó un artículo de investigación en el que explica que Apple Intelligence se compone de múltiples modelos generativos “con alta capacidad”. Diseñados para escribir y refinar texto, priorizar y resumir notificaciones, crear imágenes y realizar acciones in-app para simplificar las interacciones entre las aplicaciones.


En su Conferencia Mundial de Desarrolladores (WWDC), Apple presentó su primera incursión seria en la IA generativa, centrándose en la integración de aplicaciones y la privacidad de los datos. Pero estas nuevas prestaciones no serán para todos los equipos.


El documento detalla el proceso de construcción y adaptación de dos sistemas de IA que forman parte de la nueva familia de Apple. El primero es un algoritmo de lenguaje de 3,000 millones de parámetros habilitado para ejecutarse de manera local en los dispositivos. El segundo es un modelo más grande que opera sobre la plataforma en la nube Private Cloud Compute.

Ambas propuestas se entrenan bajo el marco de trabajo AXLearn de Apple, un proyecto de código abierto que fue lanzado en 2023. El esquema está basado en las tecnologías de aprendizaje automático JAX de Google y XLA de OpenAI. La combinación “nos permite entrenar a los modelos con alta eficiencia en varios hardware locales de capacitación y en servidores en la nube”, explican los desarrolladores.

El informe señala que durante el proceso de precapacitación se utilizó una base de datos autorizada que incluye contenidos “seleccionados para mejorar funciones específicas” y materiales disponibles públicamente. La información privada de los usuarios y el historial de interacciones con los servicios de Apple no se utilizaron para entrenar a los algoritmos. La empresa aclara que los ingenieros aplicaron filtros para eliminar malas palabras y publicaciones de baja calidad. “Empleamos una estrategia híbrida, incorporando datos sintéticos y producidos por humanos, y llevamos a cabo procedimientos exhaustivos de filtrado y curación de data”, indican.



Apple optimiza la eficiencia y el rendimiento de sus modelos de IA con una técnica conocida como “atención de consultas agrupadas”. Las representaciones numéricas de las palabras (tokens) se igualan en los mecanismos de entrada y salida de las solicitudes. Esto reduce el coste energético y la demanda de memoria en el dispositivo al ejecutar un programa de IA, sin comprometer la velocidad y precisión de las respuestas. “Con este conjunto de mejoras, en el iPhone 15 Pro podemos alcanzar una latencia de aproximadamente 0.6 milisegundos por token de solicitud y una tasa de generación de 30 tokens por segundo”, asegura la compañía.

Apple Intelligence se mide ante otros sistemas de IA

La investigación comparó la eficiencia de los algoritmos de Apple Intelligence con otros de código abierto, como Phi-3, Gemma, Mistral y DBRX. Las pruebas también consideraron los modelos comerciales GPT-3.5-Turbo y GPT-4-Turbo.

El primer ensayo evaluó la capacidad global de los sistemas para cubrir las necesidades de los usuarios. Un grupo de calificadores humanos determinó que la propuesta de Apple para dispositivos alcanzó puntajes más altos respecto a Phi-3-mini, Mistral-7B y Gemma-7B. “Nuestro modelo de servidor se compara favorablemente con DBRX-Instruct, Mixtral-8x22B y GPT-3.5-Turbo y es altamente eficiente”, asegura el equipo de ingenieros.

La capacidad de los productos para generar contenido dañino o equivocado se midió mediante un conjunto de mensajes contradictorios. El equipo de evaluación obtuvo las tasas de infracción de cada programa y concluyó que “tanto el modelo en el dispositivo como el de servidor de Apple son sólidos cuando se enfrentan a indicaciones adversas, y alcanzan niveles de infracción más bajos que el resto de los programas comerciales y de código abierto”.

Esta información pertenece a su autor original y se encuentra disponible en: https://es.wired.com/articulos/apple-intelligence-es-mas-eficiente-que-gpt-4-ya-tenemos-la-respuesta

case studies

See More Case Studies

Contact us

Partner with Us for Comprehensive IT

We’re happy to answer any questions you may have and help you determine which of our services best fit your needs.

Your benefits:
What happens next?
1

We Schedule a call at your convenience 

2

We do a discovery and consulting meting 

3

We prepare a proposal 

Schedule a Free Consultation