开源模型
开源模型(OSM)是一种人工智能或机器学习模型,其底层架构、训练数据(或方法)以及通常的模型权重都根据开源许可证公开可用。这与开发公司将内部工作原理保密的专有、闭源模型形成了鲜明对比。
对于企业而言,OSM 实现了对先进人工智能能力的民主化访问。它们允许组织完全在其自己的安全环境中检查、修改、微调和部署模型。这种透明度对于监管合规、知识产权保护以及减轻仅依赖大型闭源 API 所带来的供应商锁定风险至关重要。
OSM 的核心功能在于其可访问性。研究人员和开发人员可以下载预训练的模型权重。然后,他们可以使用微调(在特定专有数据集上进一步训练)或量化等技术,将通用模型适应于解决高度特定的业务问题,而无需从头开始重建整个基础模型。
这个概念与迁移学习(Transfer Learning)密切相关,迁移学习是指利用从一个任务中学到的知识来提高在相关任务上的性能;它还与微调(Fine-Tuning)相关,微调是调整预训练的 OSM 以适应新领域的过程。