从文件创建数据集
宜搭数据集支持使用本地文件创建,通过将本文存量文件与宜搭表单互联,可快速将基于文本信息化、文件信息化的数据进行抽取加工。文件作为简单类型,无需单独创建数据源,可在数据集中直接创建文件型数据源对应的数据集。
目前已支持企业信息化中常用的 Excel .xls 与 .xlsx 类型文件 ,以及满足大数据文本处理的 CVS(Comma Separated Values) 类型文件。上传的文件字段以默认以字符串类型进行处理,同时支持字段类型调整(数值、日期等),方便以更合理的数据类型在场景中使用。
操作步骤
你可以参考以下步骤,从本地文件中创建数据集。
- 登录宜搭工作台,进入应用设置页。
- 依次单击数据工厂 > 数据集。
- 单击新建数据集 > 从文件。
- 参考以下信息,选择并上传文件。
配置项 | 说明 |
数据集名称 | 输入数据集的名称,最多支持 30 个字符。 |
文件类型 | 选择你需要上传的文件类型和 Sheet 页。 |
表头 | 选择你上传的文件中是否包含表头。 如果有表头的表格文件选择无表头,那么表格中的表头列会作为数据集的第一条数据。 |
上传的文件 | 选择需要上传的文件。 上传的表格需要符合以下规范: • 文件类型:仅支持 • 文件大小:文件大小不得超过 50M ,大文件推荐另存为 csv 文件后重新上传。 • 注意事项:Excel 内容区不含单元格、公式函数的使用,表头中不含空的单元格。 |
- 配置数据集字段别名称和字段类型,配置完成后单击下一步。
表单字段支持设置STRING、INTEGER、DOUBLE、DATE四种数据类型。
- 预览数据是否正常,若数据无误,单击确定完成创建。
使用文件数据集
本文档对您是否有帮助?