4 月 18 日消息来自 IT 之家。谷歌公司在 4 月 17 日发布了公告。公告宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出了 Gemini 2.5 Flash Preview 预览 AI 模型。
用户能够通过 Gemini 应用内的模型选择器来直接使用,并且可以结合 Canvas 工具对文档和代码编辑进行优化。
IT 之家曾有报道,Gemini 2.5 Flash 是一个混合推理模型,它拥有“动态且可控”的计算能力,开发者可以依据查询请求的复杂程度来灵活地调整处理时间。
谷歌称,Gemini 2.5 Flash 适宜用于“高容量”及“实时”的应用场合,像客户服务和文档解析等。谷歌在其博客文章里提到:这款工作型模型是专门为降低成本和实现低延迟而进行优化的,是响应式虚拟助手以及实时总结工具的理想引擎。
谷歌官方公布了定价。Gemini 2.5 Flash 模型的情况如下:每 100 万 tokens 的输入是 0.15 美元;每 100 万 tokens 的输出(不含推理)为 0.6 美元;每 100 万 tokens 的输出(含推理)为 3.5 美元。
开发者能够依据自身需求开启或关闭推理功能,还可以灵活地对响应质量、成本和延迟进行调整。Gemini 2.5 Flash 是首款全混合推理模型,它与 Anthropic 和 Grok 的前沿模型相比较,成本更低,并且在表现上也毫不逊色。