早在12月份,Google首次宣布了Gemini2.0Flash机型,该机型在关键基准测试中的表现优于Gemini1.5Pro机型,速度也提高了2倍。Gemini2.0Flash支持多模态输入(如图像、视频和音频)和多模态输出(如文本、图像和音频)。
今天,Google宣布Gemini2.0Flash模型将成为网络和移动平台上所有Gemini应用程序用户的默认模型。在接下来的几周内,Google将继续提供旧版的Gemini1.5Flash和1.5Pro模式,以便用户能够继续其现有的对话。
Gemini团队成员帕特里克-凯恩(PatrickKane)就双子座2.0Flash的可用性撰文如下:
Gemini应用程序现在使用Gemini2.0Flash。该模式可在多个关键基准方面提供快速响应和更强的性能,为头脑风暴、学习或写作等任务提供日常帮助。
Gemini应用现在采用了Imagen3,这是Google最先进的图像生成模型,可以根据文本输入创建更精确的图像,并具有更丰富的细节和纹理。Gemini和GeminiAdvanced用户只需使用文本描述他们想要创建的图像,Gemini就能生成人工智能创建的图像。不过,Gemini高级用户也可以创建以人物为主题的图像。
在提供新的GeminiFlash2.0模型的同时,Gemini高级用户还可以访问1M标记上下文窗口,从而可以上传大量文件,并优先访问深度研究等新功能。
开发人员现在可以通过AIStudio和VertexAI访问Gemini2.0Flash模型。新的多模式实时API支持实时音频、视频流输入,并能使用多种组合工具。随着Gemini2.0Flash模型和Imagen3的发布,Google将继续为用户和开发者带来先进的人工智能功能。