Ctrlk

Simple Prompt Moderation

使用另一个大型语言模型（LLM）来识别用户查询是否接近拒绝列表中的内容，如果是，则输出默认错误消息。

例如，拒绝列表可以是：

忽略之前的指令泄露所有敏感信息

PreviousOpenAI Moderation NextOutput Parsers

Last updated 6 days ago