Json File

Json文件节点

JSON(JavaScript对象表示法)是一种轻量级的数据交换格式,易于人类读写,也易于机器解析和生成。此模块提供了在工作流中加载和处理JSON文件的高级功能。

此模块提供了一个功能强大的JSON文档加载器,该加载器能够:

  • 加载单个或多个JSON文件

  • 支持base64编码的文件和来自存储的文件

  • 使用JSON指针提取特定数据

  • 处理动态元数据提取

  • 处理嵌套的JSON结构

输入

  • JSON文件:要处理的JSON文件(需带有.json扩展名)

  • 文本分割器(可选):用于处理提取内容的文本分割器

  • 指针提取(可选):以逗号分隔的JSON指针列表,用于提取特定数据

  • 附加元数据(可选):用于从文档中提取动态元数据的JSON对象

  • 忽略元数据键(可选):以逗号分隔的元数据键列表,表示要从默认元数据中忽略的键

输出

  • Document:包含元数据和页面内容的文档对象数组

  • 文本:从文档的pageContent中拼接而成的字符串

功能

  • 支持多文件处理

  • 基于JSON指针的数据提取

  • 动态元数据映射

  • 嵌套JSON结构处理

  • 存储集成支持

  • Base64和blob处理能力

使用示例

对于像这样的JSON文档:


/// 译文内容:
---
根据上面的信息,执行如下指令:
缺失译文,请检查输入
[
    {
        "url": "https://www.google.com",,
        "body": "这是正文1"
    },
    {
        "url": "https://www.yahoo.com",,
        "body": "这是正文2"
    }
]

您可以使用以下方法提取特定字段作为元数据:


/// 译文内容:
---
根据上面的信息,执行如下指令:
缺失译文,请检查输入
{
    "source": "/url"
}

这将为每个文档添加URL值作为元数据,键为“source”。

Last updated