Csv File

CSV文件节点

CSV(逗号分隔值)是一种用于存储表格数据的简单文件格式,如电子表格或数据库。此模块提供了在工作流中加载和处理CSV文件的功能。

此模块提供了一个功能强大的CSV文档加载器,它可以:

  • 加载单个或多个CSV文件

  • 支持base64编码的文件和来自存储的文件

  • 提取特定列或全部内容

  • 高效处理大型数据集

  • 处理自定义元数据管理

输入

  • CSV文件:要处理的CSV文件(需带有.csv扩展名)

  • 文本分割器(可选):用于处理提取内容的文本分割器

  • 单列提取(可选):要提取的特定列的名称

  • 附加元数据(可选):包含要添加到文档中的附加元数据的JSON对象

  • 省略元数据键(可选):以逗号分隔的元数据键列表,用于从默认元数据中省略

输出

  • Document:包含元数据和页面内容的文档对象数组

  • 文本:所有文档的pageContent拼接而成的字符串

功能

  • 支持处理多个文件

  • 单列提取能力

  • 高效处理大型数据集

  • 可定制的元数据处理

  • 存储集成支持

  • Base64和blob处理能力

Last updated