Meta发布最强开源模型Llama 3.1

作者: AI信息Gap

时间: 2024-07-23

标签: Meta

阅读(1620)

北美时间7月23日，Meta（原Facebook，脸书）公司正式官宣发布了开源模型Llama 3.1。不出意外的话，根据各项AI模型基准测试的结果来看，Llama 3.1将会成为史上最强大的开源LLM模型。Llama 3.1模型具备128K的上下文长度，支持八种语言，并推出了首个开放源码前沿级AI模型Llama 3.1 405B。作为首个开源的前沿级AI模型，Llama 3.1 405B在通用知识、可控性、数学、工具使用和多语言翻译等方面拥有最先进的能力，能与目前市场上最好的闭源模型相媲美，如GPT-4o和Claude 3.5 Sonnet。

Llama 3.1通过扩展上下文长度、增强推理能力和改进工具使用，能够支持高级应用如长文本摘要、多语言对话代理和编程助手。此外，Meta还注重该模型的开放性和可扩展性，鼓励开发者创建自定义代理和新型智能行为，同时配备了如Llama Guard 3和Prompt Guard等安全工具，以支持负责任的开发。

Llama 3.1的三种型号
和大多数AI模型一样，Llama 3.1也包含三种型号：405B、70B和8B，表示模型的参数量依次降低。这三档模型均支持128K上下文长度，增强了长文本处理和对话能力。

405B 型号：这是Llama 3.1系列的最强模型，具有最广泛的使用案例。它以4050亿参数成为目前参数量最大（参数量越大某种程度上意味着“智商”越高）的开源模型，适用于复杂的数学问题和多语言翻译等任务。
70B 型号：高性能且性价比很高的中端模型，类似于Claude 3系列中的Claude 3 Sonnet，能适用于多种使用案例。它在性能和成本之间取得了良好的平衡，非常适合需要强大但不及最大模型资源需求的应用。
8B 型号：轻量级且超高速，几乎可以在任何设备上运行。它特别适合资源受限的环境，仍能提供强大的语言处理能力。

Llama 3.1基准测试结果
Llama 3.1 405B模型在多个测试中表现优秀，在某些领域甚至超过了目前AI领域最强模型GPT-4o和Claude 3.5 Sonnet。
24181259-2024-07-24T10:12:57.png

Meta发布最强开源模型Llama 3.1

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅