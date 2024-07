El equipo de investigación de Apple Intelligence de Apple ha lanzado dos nuevos modelos de lenguaje pequeños pero de alto rendimiento utilizados para entrenar a los generadores de IA.

El equipo de aprendizaje automático de Apple participa en un proyecto de código abierto de DataComp for Language Models junto con otros actores de la industria.

Los dos modelos que Apple ha producido recientemente coinciden o superan a otros modelos de entrenamiento líderes, como Llama 3 y Gemma.

Este tipo de modelos de lenguaje se utilizan para entrenar motores de IA, como ChatGPT, al proporcionar un marco estándar. Esto incluye una arquitectura, parámetros y filtrado de conjuntos de datos para proporcionar datos de mayor calidad para que los motores de IA se extraen.

I am really excited to introduce DataComp for Language Models (DCLM), our new testbed for controlled dataset experiments aimed at improving language models. 1/x pic.twitter.com/uNe5mUJJxb