在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

谷歌 Gemini 2.5 API 推“隱式緩存”,開發(fā)者成本最高降低 75%

2025/5/10 11:14:22 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 5 月 10 日消息,科技媒體 WinBuzzer 昨日(5 月 9 日)發(fā)布博文,報道稱谷歌為其 Gemini 2.5 API,推出了“隱式緩存”(Implicit Caching)功能,自動識別并重用 API 請求中的常見前綴,開發(fā)者的成本最高可以降低 75%。

該功能適用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自動檢測 API 請求中的重復(fù)前綴并加以重用,開發(fā)者的使用成本最高可以降低 75%。

IT之家注:與 2024 年 5 月推出的“顯式緩存”(Explicit Caching)不同,隱式緩存無需開發(fā)者手動配置,系統(tǒng)默認開啟,節(jié)省成本的同時大幅簡化操作流程。

為幫助開發(fā)者充分利用隱式緩存,谷歌建議在構(gòu)建提示詞(Prompt)時,將穩(wěn)定、常見的內(nèi)容放在開頭,后面再添加用戶特定的變量內(nèi)容。此外,短時間內(nèi)發(fā)送具有相似前綴的請求也能提高緩存命中率。

谷歌還設(shè)定了最低 Token 數(shù)量要求:Gemini 2.5 Flash 需 1024 個 Token,Gemini 2.5 Pro 則需 2048 個 Token。API 響應(yīng)中新增的“cached_content_token_count”字段會顯示緩存 Token 的使用情況和優(yōu)惠計費詳情。

與此同時,顯式緩存仍作為可選方案,支持 Gemini 2.5 及 2.0 模型,允許開發(fā)者自定義緩存內(nèi)容和生存時間(TTL,默認 1 小時)。

谷歌此舉雖宣稱成本節(jié)省 75%,但實際效果尚待第三方驗證,且可能因使用模式不同而有所差異。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:Gemini谷歌,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知