-
定义
- 大语言模型的简称,参数量超过10亿、具备泛化能力的模型,可以被称为大模型。
-
大模型和小模型的区别
- AI建模方法
- 大模型为深度学习、自然语言处理、多模态技术
- 小模型为机器学习、深度学习、自然语言处理、计算机视觉等
- 参数量
- 大模型参数量规模在10亿以上
- 小模型参数量规模是几万至几百万参数
- 应用场景
- 大模型应用在泛语言类场景(自然语言、编程语言等)、多模态场景(文本、图像、音频、视频)
- 小模型应用在场景更加多样,但生成类场景效果差,不具备多模态
- 泛化能力
- 大模型泛化能力强,处理多任务效果好
- 小模型泛化能力弱,处理多任务效果差
- 可解释性
- 大模型可解释性弱
- 小模型可解释性强
- 训练
- 大模型冷启动成本低,任务对齐成本高
- 小模型冷启动成本高,任务对齐成本低
- 推理
- 大模型反馈速度慢,准确率低
- 小模型反馈速度快,准确率高
