LLaMA

xmg2024 2025-12-19 09:59:54

Categories： Tags：

前世

LLaMA（Large Language Model Meta AI）是Meta（Facebook）于2023年2月发布的开源大语言模型。从LLaMA 1到LLaMA 2（2023年7月）、LLaMA 3（2024年4月），持续推动开源AI生态发展。

LLaMA 3是当前最强的开源大语言模型，包含8B、70B、405B等版本。采用Apache 2.0开源协议，推动AI民主化。在开源社区广泛使用，衍生出众多微调版本（如Llama-2-Chat、Vicuna等），成为开源AI生态的基石。

基于Transformer架构，采用：1）RMSNorm归一化；2）SwiGLU激活函数；3）RoPE位置编码；4）分组查询注意力（GQA）降低推理成本；5）大规模数据预训练（15T tokens）。训练数据质量优化，去除低质量数据。

优点：1）完全开源，可自由使用和修改；2）性能接近闭源模型；3）支持本地部署，数据安全；4）社区活跃，生态丰富。

缺点：1）需要大量计算资源；2）中文能力相对较弱；3）需要技术团队进行部署和优化；4）某些版本有使用限制。

将继续开源更大规模的模型，推动AI民主化。多模态能力将增强，支持图像、音频等。模型压缩和量化技术将降低部署门槛。预计LLaMA 4将进一步提升性能，成为开源AI的标杆。