Gemini 2.5 Flash 是什么?
Gemini 2.5 Flash 是 Google 推出的首個完全混合推理模型,允許開發人員靈活控制模型的思考功能,可開啟或關閉。它還支持設置思考預算,幫助開發者在質量、成本和延遲之間找到最佳平衡。即使關閉思考功能,模型仍能保持 2.0 Flash 的高速度,并進一步提升性能,兼具高效推理和成本效益。目前處于預覽階段,支持通過 API 在 Google AI Studio 和 Vertex AI 中使用。

Gemini 2.5 Flash 的主要特性
- 混合推理能力:Gemini 2.5 Flash 支持開啟或關閉思考功能,即使關閉思考,仍能保持快速響應。
- 推理預算控制:開發者可設置思考預算,靈活調整推理深度,平衡質量、成本和延遲。
- 高性價比:在性能與成本的權衡上表現出色,以較低成本實現與其他領先模型相當的性能。
- 推理能力提升:在需要多步推理的復雜任務上表現出色,能夠生成更準確和全面的答案。
- 靈活的 API 支持:通過 Google AI Studio 和 Vertex AI 提供 API 接口,方便開發者集成和使用。
Gemini 2.5 Flash 性能表現
在 GPQA 知識問答中,24k 思考預算下性能提升了6%;在 LiveCodeBench 代碼任務中,16k 思考預算下性能最佳。在大模型排行榜中,Gemini 2.5 Flash 以1392 ELO 高分位居第二,與 GPT-4.5-preview、Grok 3 并駕齊驅。

如何使用Gemini 2.5 Flash ?
Gemini 2.5 Flash 現已通過 Google AI Studio 和 Vertex AI 中的 Gemini API 以及 Gemini 應用程序中的專用下拉菜單提供預覽版。
