AI资讯

DeepSeek发布全新图像生成模型Janus-Pro

深度求索(DeepSeek)发布了全新的多模态AI模型家族Janus Pro,声称其表现优于OpenAI的DALL-E 3。这些模型参数规模从10亿到70亿不等,采用MIT许可证,可自由商用。Janus Pro在多项基准测试中表现优异,尽管部分模型仅支持小分辨率图像处理,但其紧凑规模和高效性能令人瞩目。深度求索的崛起引发了关于美国AI领先地位及AI芯片需求持续性的讨论。

Read More
谈谈AI

DeepSeek V3 与前沿 AI 模型的成本

DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。

Read More
AI博文

为什么AI领域都在讨论DeepSeek

DeepSeek发布全新大语言模型DeepSeek-R1,性能媲美OpenAI o1,却以更低成本开源,迅速引发硅谷和AI行业的广泛讨论。这篇报道详细分析了其技术突破、市场冲击及未来前景。

Read More
AI资讯

DeepSeek 声称其“推理模型”在某些基准测试上击败了 OpenAI 的 o1

DeepSeek 公布其新一代推理模型(reasoning model)DeepSeek-R1,宣称在 AIME、MATH-500、SWE-bench Verified 等基准测试(benchmarks)上击败 OpenAI 的 o1。R1 拥有 6710 亿参数(parameters),并提供从 15 亿到 700 亿参数不等的多个蒸馏版本,兼具高可用性与商业化灵活性。该模型通过自我事实核对(fact-check),在数学、编程等推理场景中表现优异。新规背景下,中美围绕 AI 技术竞争加剧,DeepSeek 的表现引发业界广泛关注。

Read More