谷歌发布Gemini 2:迈入“智能代理时代”
谷歌正式推出其最新的AI模型Gemini 2,首发版本为快速且强大的Gemini 2 Flash。这一模型标志着谷歌进入“智能代理时代”,即AI能够无需人为干预独立完成任务。
Gemini 2的背景
谷歌于一年多前首次推出Gemini AI,开启了一个全新的AI时代,包括AI概述、Gemini聊天机器人等。最初,Gemini 2仅向开发者或订阅Gemini Advanced的用户提供实验性访问。然而,即便如此,Gemini 2 Flash在几乎所有基准测试中表现优于其前代版本,且运行更快、更轻量。
谷歌CEO桑达尔·皮查伊表示,Gemini 2具备先进的推理能力,这一功能也将应用于Google搜索的AI概述中,以提供更精确的复杂、多步骤问题解答。
Gemini 2的亮点与新功能
谷歌将Gemini 2定义为“智能代理时代”的开端。该模型不仅具有与OpenAI的o1类似的高级推理能力,还能原生生成图像、语音和文本等多种形式的输出。
性能提升
- 速度与效率:Gemini 2 Flash的速度是前旗舰模型Gemini Pro 1.5的两倍,并在关键基准测试中表现更佳。
- 原生生成能力:相比需要调用其他模型(如Imagen)的Gemini 1,Gemini 2 Flash可以直接生成图像、文本和语音。
- 推理与视觉能力:在推理能力、视觉理解、音频转语音以及视频分析方面,Gemini 2 Flash显著优于所有前代模型。
谷歌DeepMind的CEO德米斯·哈萨比斯称Gemini 2 Flash为“主力模型”,以低延迟和高性能见长,适用于多种AI任务。
智能代理与新功能
Gemini 2引入了“智能代理”概念。这一技术使AI模型能够创建自身的多个版本来完成多样化任务。Gemini 2内置了“深度研究”功能,能够代替用户浏览网页并生成复杂主题的报告。这一功能是Gemini Advanced的一部分。
哈萨比斯表示:“智能代理的实际应用是一个充满可能性的研究领域,我们正在通过一系列原型探索这一新前沿。”他提到,这包括:
- Project Astra:在Google I/O上亮相的通用虚拟助手。
- Project Mariner:探索浏览器中人与代理互动的未来。
- Jules:一款为开发者设计的代码代理工具。
产品适配
Gemini 2 Flash目前可通过Gemini Advanced订阅中的模型菜单访问,并标记为“实验性”。开发者还可以通过Gemini API或Google Gemini AI Studio使用该模型。谷歌计划于2025年将Gemini 2全面引入其所有产品。