Modelo de Código Abierto
Un Modelo de Código Abierto (OSM, por sus siglas en inglés) es un modelo de inteligencia artificial o aprendizaje automático cuya arquitectura subyacente, datos de entrenamiento (o métodos) y, a menudo, los pesos del modelo se ponen a disposición del público bajo una licencia de código abierto. Esto contrasta marcadamente con los modelos propietarios y de código cerrado, donde el funcionamiento interno es mantenido en secreto por la empresa desarrolladora.
Para las empresas, los OSM democratizan el acceso a capacidades avanzadas de IA. Permiten a las organizaciones inspeccionar, modificar, ajustar y desplegar modelos completamente dentro de sus propios entornos seguros. Esta transparencia es crucial para el cumplimiento normativo, la protección de la propiedad intelectual y la mitigación de riesgos de bloqueo de proveedores asociados con la dependencia exclusiva de grandes API cerradas.
La funcionalidad central de un OSM es su accesibilidad. Los investigadores y desarrolladores pueden descargar los pesos del modelo preentrenado. Luego, pueden utilizar técnicas como el ajuste fino (entrenamiento adicional en conjuntos de datos propietarios específicos) o la cuantización para adaptar el modelo de propósito general a la resolución de problemas de negocio altamente específicos sin necesidad de reconstruir todo el modelo fundacional desde cero.
Este concepto está estrechamente relacionado con el Aprendizaje por Transferencia (Transfer Learning), que es la práctica de aprovechar el conocimiento adquirido de una tarea para mejorar el rendimiento en una tarea relacionada, y el Ajuste Fino (Fine-Tuning), que es el proceso de adaptar un OSM preentrenado a un nuevo dominio.