I'm here to help you with the docs.
如果你经常多次请求相同的补全结果,缓存可以通过减少向大型语言模型(LLM)提供商发出的API调用次数来为你节省资金。它还可以通过减少向大型语言模型提供商发出的API调用次数来加速你的应用程序运行。
内存缓存
内存嵌入缓存
Momento Cache
Redis Cache
Redis 嵌入缓存
Upstash Redis 缓存
Last updated 6 days ago