• 定义

    • 大语言模型的简称,参数量超过10亿、具备泛化能力的模型,可以被称为大模型。
  • 大模型和小模型的区别

  1. AI建模方法
    • 大模型为深度学习、自然语言处理、多模态技术
    • 小模型为机器学习、深度学习、自然语言处理、计算机视觉等
  2. 参数量
    • 大模型参数量规模在10亿以上
    • 小模型参数量规模是几万至几百万参数
  3. 应用场景
    • 大模型应用在泛语言类场景(自然语言、编程语言等)、多模态场景(文本、图像、音频、视频)
    • 小模型应用在场景更加多样,但生成类场景效果差,不具备多模态
  4. 泛化能力
    • 大模型泛化能力强,处理多任务效果好
    • 小模型泛化能力弱,处理多任务效果差
  5. 可解释性
    • 大模型可解释性弱
    • 小模型可解释性强
  6. 训练
    • 大模型冷启动成本低,任务对齐成本高
    • 小模型冷启动成本高,任务对齐成本低
  7. 推理
    • 大模型反馈速度慢,准确率低
    • 小模型反馈速度快,准确率高