**埃隆·马斯克的 AI 初创公司推出 Grok-1.5**
**提升:**
- 上下文理解:上下文窗口从 8192 扩展至 128k,与 GPT-4 相当,可处理更长、更复杂的提示。
- 推理和能力:在处理编程和数学任务方面大幅提升,超越现有模型,包括 Grok-1、Mistral Large 和 Claude 2。
**数学表现:**
- MATH 基准测试:50.6%,超越 Claude 3 Sonnet
- GSM8K 基准测试:90%
**编程表现:**
- HumanEval 基准测试:74.1%,仅次于 Claude 3 Opus
**图像:**
(举报)