Google发布Gemini 2.0 Flash Thinking实验版 拥有推理能力

站长云网 2024-12-20 5iter.com 站长云网

Google发布了一种新的"推理"人工智能模型--但它还处于实验阶段,新模型名为Gemini2.0FlashThinkingExperimental(一个拗口的名字),可在AIStudio中使用,这是Google的人工智能原型开发平台。模型卡将其描述为"最适合多模态理解、推理和编码",能够在编程、数学和物理等领域"推理最复杂的问题"。

在X上的一篇帖子中,负责AIStudio产品的LoganKilpatrick称Gemini2.0FlashThinkingExperimental是"(Google)推理之旅的第一步"。Google人工智能研究部门GoogleDeepMind的首席科学家杰夫-迪恩(JeffDean)在自己的帖子中说,Gemini2.0FlashThinkingExperimental"训练使用思想来加强推理"。

迪恩说:"当我们增加推理时间的计算量时,我们看到了可喜的成果。"推理时间指的是模型在考虑问题时"运行"所使用的计算量。

Gemini2.0FlashThinkingExperimental基于Google最近发布的Gemini2.0Flash模型而构建,在设计上似乎与OpenAI的o1和其他所谓的推理模型相似。与大多数人工智能不同的是,推理模型可以有效地自我检查事实,这有助于它们避免一些通常会绊倒人工智能模型的陷阱。

缺点是,推理模型通常需要更长的时间(通常是几秒到几分钟)才能得出解决方案。

给定一个提示后,双子座2.0快速思维实验系统会暂停一下再做出反应,同时考虑一些相关的提示,并沿途"解释"其推理过程。一段时间后,模型会总结出它认为最准确的答案。

Google的推理模型有时会在计算字母上遇到困难。图片来源:Google

在OpenAIo1发布之后,不仅是Google,其他竞争对手的人工智能实验室也纷纷推出了推理模型。11月初,由量化交易员资助的人工智能研究公司DeepSeek推出了其首个推理模型的预览版DeepSeek-R1。同月,阿里巴巴的Qwen团队 发布了 它声称这是o1的第一个"开放"挑战者。

彭博社在10月份报道,Google有几个团队正在开发推理模型。随后,TheInformation在11月份的报道显示,该公司至少有200名研究人员专注于这项技术。

并不是每个人都相信推理模型是最好的发展方向。首先,由于运行推理模型需要大量的计算能力,因此推理模型往往价格昂贵。虽然到目前为止推理模型在基准测试中表现出色,但推理模型能否保持目前的发展速度还很不确定。

责任编辑:站长云网