← 返回资讯
产品发布

Anthropic 发布 Claude Opus 4:多模态推理能力大幅跃升

Anthropic 于本周正式发布了其最新旗舰大语言模型 Claude Opus 4,这是迄今为止性能最强的 Claude 系列模型。在多项主流基准测试中,Opus 4 均超越此前版本,并在代码生成、长文档推理、数学建模等核心能力上展现出显著进步。

核心能力升级

Claude Opus 4 的上下文窗口扩展至 400K tokens,约合 30 万个汉字,这意味着用户可以一次性输入整本书籍或数千页的企业报告,让模型完成系统性分析。Anthropic 表示,Opus 4 在处理超长文档时的"幻觉率"(即模型凭空捏造信息的概率)降低了约 38%,在复杂法律合同分析和财务报告解读等场景中尤为突出。

在代码能力方面,Opus 4 在 HumanEval 基准上的通过率达到 91.2%,比上一代 Opus 提升约 7 个百分点。尤其是在多文件协同编辑、跨语言代码迁移以及自动化测试生成等复杂任务上,Opus 4 展现出更接近高级工程师水准的能力。

多模态理解大幅增强

Opus 4 对图像和表格的理解能力同样显著提升。在处理包含复杂图表的金融报告时,模型可以准确提取数据并进行跨维度对比分析,这是此前版本难以可靠完成的任务。Anthropic 的研究团队在发布博客中透露,模型在视觉推理方面采用了全新的训练数据策略,专门针对中文和日文等非英语场景进行了优化。

企业部署加速

多家头部企业已率先获得 Opus 4 的早期访问权限。据悉,某国际律所已将 Opus 4 集成入其合同审查工作流,将原本需要 4 小时的初审环节压缩至约 25 分钟,准确率维持在律师核查标准以上。

国内方面,部分通过 AWS Bedrock 接入 Claude API 的科技公司也表示正在测试 Opus 4 在中文客服和知识库问答方面的应用效果,反馈普遍优于前代。

定价与访问方式

Claude Opus 4 目前通过 Claude.ai 专业版以及 Anthropic API 提供访问。API 定价为每百万输入 tokens 15 美元、每百万输出 tokens 75 美元,与行业旗舰模型持平。Anthropic 同步提供按需降速的 Batch API,价格降低 50%,适合对实时性要求不高的批量处理场景。

对于希望将 AI 融入日常工作流的个人用户和小型团队而言,Claude Opus 4 的发布意味着一个新的能力基准正式树立。如何将这些能力系统化地转化为实际的工作效率,正是本站 Playbook 所重点覆盖的内容。

深度学习

将 AI 工具转化为实际生产力

了解行业动态只是第一步。如何系统地将 AI 融入你的工作流、构建可复用的操作框架,才是真正的竞争优势所在。

获取 Playbook