谷歌于6月17日正式推出了其Gemini 2.5混合推理模型家族中的三款新模型:2.5 Pro、Flash以及2.5 Flash-Lite。其中,2.5 Flash-Lite预览版在性价比和速度方面表现尤为突出,成为该系列中最具吸引力的版本。这款模型在编码、数学、科学、推理和多模态基准测试中的整体性能优于前代2.0 Flash-Lite,特别适合处理高吞吐量且对延迟有严格要求的任务,比如翻译和分类。与之前的版本相比,2.5 Flash-Lite不仅延迟更低,还支持与Google搜索及代码执行工具的连接,接受多模态输入,并提供长达100万token的上下文窗口长度。