Custom Retriever

默认情况下,当从向量存储中检索上下文时,它们采用以下格式:
/// 译文内容:
---
根据上面的信息,执行如下指令:
缺失译文,请检查输入
[
{
"pageContent": "这是一个示例",,
"metadata": {
"source": "example.pdf"
}
},
{
"pageContent": "这是示例2",,
"metadata": {
"source": "example2.txt"
}
}
]数组中的pageContent将被连接成一个字符串,并反馈给大型语言模型(LLM)以完成其任务。
然而,在某些情况下,你可能希望从元数据中提取信息,以便为大型语言模型(LLM)提供更多信息,如来源、链接等。这就是自定义检索器发挥作用的地方。我们可以指定返回给大型语言模型的格式。
例如,使用以下格式:
/// 译文内容:
---
根据上面的信息,执行如下指令:
缺失译文,请检查输入
{{context}}
来源:{{metadata.source}}将结果合并成如下字符串:
这是一个例子
来源:example.pdf
这是示例2
来源:example2.txt这将被发送回大型语言模型(LLM)。由于大型语言模型现在已拥有答案的来源,我们可以使用提示来指示大型语言模型返回答案,并附上引用。
Last updated