Json File

JSON(JavaScript对象表示法)是一种轻量级的数据交换格式,易于人类读写,也易于机器解析和生成。此模块提供了在工作流中加载和处理JSON文件的高级功能。
此模块提供了一个功能强大的JSON文档加载器,该加载器能够:
加载单个或多个JSON文件
支持base64编码的文件和来自存储的文件
使用JSON指针提取特定数据
处理动态元数据提取
处理嵌套的JSON结构
输入
JSON文件:要处理的JSON文件(需带有.json扩展名)
文本分割器(可选):用于处理提取内容的文本分割器
指针提取(可选):以逗号分隔的JSON指针列表,用于提取特定数据
附加元数据(可选):用于从文档中提取动态元数据的JSON对象
忽略元数据键(可选):以逗号分隔的元数据键列表,表示要从默认元数据中忽略的键
输出
Document:包含元数据和页面内容的文档对象数组
文本:从文档的pageContent中拼接而成的字符串
功能
支持多文件处理
基于JSON指针的数据提取
动态元数据映射
嵌套JSON结构处理
存储集成支持
Base64和blob处理能力
使用示例
对于像这样的JSON文档:
/// 译文内容:
---
根据上面的信息,执行如下指令:
缺失译文,请检查输入
[
{
"url": "https://www.google.com",,
"body": "这是正文1"
},
{
"url": "https://www.yahoo.com",,
"body": "这是正文2"
}
]您可以使用以下方法提取特定字段作为元数据:
/// 译文内容:
---
根据上面的信息,执行如下指令:
缺失译文,请检查输入
{
"source": "/url"
}这将为每个文档添加URL值作为元数据,键为“source”。
Last updated