本文的内容都是针对网页版来说的(gemini.google.com)
套餐:Google AI Pro
先从优点开始讲讲吧。
首先就是识图能力。Gemini 的识图能力在我印象里一直很优秀,这点延续了 Gemini 2.5 Pro 时期,对于我来说是最优秀的一档。有时候一些问题只需要截图发给它就能让它获取足够的信息。我也经常会倒腾 ComfyUI,有时候一些图片的提示词不知道怎么描述合适,就发给 Gemini,让它帮我写提示词。一般出来的提示词也都还不错。
接下来就是一些个人向的吐槽了。Gemini 在 1.5 版本后就一直主打超长上下文(网页版的 Pro 套餐承诺的上下文是 1M)。虽然早期都不怎么样,但是在 Gemini 2.5 Pro 这个时期(尤其是 0325)它的上下文表现是我个人用的模型中最好的。哪怕我用的只是网页版,它的上下文性能依旧很优秀。
但在 Gemini 3 Pro 发布后,头一个月可能还好,后面退步十分明显。我自己的使用场景下,它可能在几轮对话后就出现了错乱。表现是只记得头尾,中间内容完全忘记了(我使用的很多 LLM 时都与到过,但 3 Pro 非常明显)。
因为以前我对 Gemini 的识图功能比较信任,所以有些日志信息或者报错都是用截图发给它的。这个习惯导致了我使用 3 Pro 时会非常难受。它可能在对话几轮有很大概率会忽略了你刚刚发送的截图,然后根据你之前发送的图片进行回答😅。
然后是它的一些表达方式。2.5 Pro 也会用一些绝对化的表述,但 3 Pro 这种表述可以说让我感到厌烦。一些情况并不是绝对会发生的,在 3 Pro 的表述下似乎这是绝对会发生的,而且发生的概率极高。
换种方式来说就是自信过度且固执。如果在开头几轮对话时它认定了某些东西是事实,那么之后对话你很难很难能够纠正它的一些错误表述。哪怕你跟它说明了错误,它很大概率也会反过来质问用户。最好的办法就是新开一个对话……
最后就是让我无语的记忆系统。这个系统在 2.5 Pro 时期可能还好(也是因为没有出多久)。但上了 3 Pro 之后,它经常会闹出一些令我无语的事情。打个比方,我在个人使用场景中添加了「我不吃菠菜」的指令。但我在需要它分析一些报错日志的时候,它可能就会说「因为你不吃菠菜,所以这个问题可以这样解决……」。人在生气的时候真的会很生气……
目前我虽然还续着 Gemini 的套餐,但主力 LLM 已经又回到了 ChatGPT 上。虽然 ChatGPT 的速度是真的慢……但对我来说至少是可用的,确确实实能够帮我解决很多问题。 真的无比怀念 3 Pro 出来之前的 Gemini,希望正式版发布会有改善吧。
上文的吐槽内容我无法确定是模型本身的问题还是网页端产品策略/上下文压缩导致的。
3 月 19 日更新:感觉新的 3.1 Pro 还是有一样的问题。比如经常会用括号来解释一些概念,但里面的解释还是强行关联的😅。
部分信息可能已经过时