Csv File

CSV(逗号分隔值)是一种用于存储表格数据的简单文件格式,如电子表格或数据库。此模块提供了在工作流中加载和处理CSV文件的功能。
此模块提供了一个功能强大的CSV文档加载器,它可以:
加载单个或多个CSV文件
支持base64编码的文件和来自存储的文件
提取特定列或全部内容
高效处理大型数据集
处理自定义元数据管理
输入
CSV文件:要处理的CSV文件(需带有.csv扩展名)
文本分割器(可选):用于处理提取内容的文本分割器
单列提取(可选):要提取的特定列的名称
附加元数据(可选):包含要添加到文档中的附加元数据的JSON对象
省略元数据键(可选):以逗号分隔的元数据键列表,用于从默认元数据中省略
输出
Document:包含元数据和页面内容的文档对象数组
文本:所有文档的pageContent拼接而成的字符串
功能
支持处理多个文件
单列提取能力
高效处理大型数据集
可定制的元数据处理
存储集成支持
Base64和blob处理能力
Last updated