DeepSeek V3 与前沿 AI 模型的成本

DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3，该模型在多个前沿评估中表现出色，尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B，但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告，展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本，并指出 DeepSeek 在资源有限的情况下取得了显著进展。