DeepSeek V3 与前沿 AI 模型的成本
DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。
Read MoreDeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。
Read MoreArm CEO Rene Haas在《The Verge》采访中探讨了AI对硬件的影响,预测AGI将不再遥远,可能在未来两到三年内实现。他还谈到了Arm如何在AI和数据中心市场中获得更大的份额,并分析了与软银、Nvidia的合作及Arm的未来战略。
Read MoreIlya Sutskever 在 NeurIPS 2024 的演讲回顾了序列学习(Sequence-to-Sequence Learning)领域的十年历程,并展望了未来人工智能(AI)的发展方向。他提出了“数据峰值”(Peak Data)挑战,探讨了合成数据(Synthetic Data)和代理系统(Agents)的潜力,并预测未来模型可能具备推理能力和自我意识(Self-Awareness)。尽管演讲被批评内容过于宽泛,但它成功引发了对AI未来发展的深入讨论。
Read MoreGoogle正式推出Android XR操作系统,旨在支持头戴显示器和智能眼镜等扩展现实(XR)设备。这款全新系统结合Gemini AI技术,提供沉浸式应用、多窗口浏览和实时翻译等功能,预计将在2025年伴随三星的Moohan设备上市,标志着Google布局扩展现实生态的重要一步。
Read More谷歌推出最新AI模型Gemini 2,引领“智能代理时代”。Gemini 2 Flash以两倍速度和更强推理能力超越前代,支持原生生成图像、语音和文本,并引入智能代理功能,如“深度研究”和开发者工具。谷歌计划于2025年将其整合至所有产品。
Read More谷歌量子团队正式发布新一代105量子比特超导芯片“Willow”,展现量子纠错和新规模量子优越性的突破性成果。通过大幅提升量子比特的相干时间和门保真度,谷歌在实现可扩展量子计算方面迈出重要一步。这一技术进展为未来逻辑量子比特的稳定操作铺平了道路,是量子计算领域的又一里程碑。
Read MoreOpenAI正式推出Sora文本生成视频AI模型,支持视频生成、图像动画化及视频重混等多项功能。订阅计划分为Plus与Pro,提供不同的分辨率与时长支持,同时强调内容审核与透明性。虽然已在美国和其他国家上线,但欧洲市场的发布暂时推迟。
Read MoreNVIDIA宣布在越南设立首个研发中心,并与政府合作建立AI数据中心,进一步推动AI技术在医疗、教育、交通等行业的应用。这一战略布局彰显了越南作为区域AI中心的潜力,同时巩固了NVIDIA在全球主权AI领域的领导地位。
Read MoreOpenAI推出ChatGPT Pro订阅服务,月费200美元,为用户提供几乎无限的工具使用权限和独家访问更强大的AI模型o1 pro模式。此服务主要面向深度用户和研究人员,支持复杂数学、科学和编程任务处理。免费计划仍保留,20美元的ChatGPT Plus订阅不变。未来更新将增加网页浏览和文件上传功能,或发布新一代生成式AI视频模型Sora。
Read MoreDeepMind 推出 Genie 2,一款强大的 AI 模型,可通过图片和文本描述即时生成互动的 3D 游戏世界,具有丰富的模拟效果和高拟真度。该工具适合用于原型设计和 AI 智能体研究,或将引领 AI 世界模型的下一次技术革新。
Read More