数据准备公式

1. 使用场景

数据准备是宜搭低代码平台中的一项关键功能，旨在帮助企业用户在进行数据分析和应用前对原始数据进行清洗、融合和转换。数据准备采用零代码ETL（Extraction Transformation Loading）方案处理来自宜搭内应用、企业外部数据库、文件型数据以及钉钉官方数据源（支持花名册、OA、智能人事、考勤等）的数据，通过构建数据加工流程，将零散数据整合为标准化数据集，以满足可视化分析和数据化决策的需求。

2. 数据准备介绍

3. 设置公式入口

路径：应用设置 > 数据工厂 > 数据准备>新建数据准备>选择数据集，选择关联节点、聚合节点、清洗节点，均需选择公式。

查看以下视频进行设置：

4. 逻辑处理类

CASEWHEN

用法1：CASEWHEN(<条件>,<值>,<条件>,<值>.....), 类同SQL中的case when语法

示例：CASEWHEN(<性别字段>="男","male",<性别字段>="女","female")，则该字段值为"男"的被替换为"male"，"女"替换为"female"

用法2：CASEWHEN(<条件>,<值>,<条件>,<值>.....<值>), 类同SQL中的case when语法

示例：CASEWHEN(<性别字段>="男","male","female")，则该字段值为"男"的被替换为"male"，非"男"替换为"female"

5. 文本处理类

LEN

用法：LEN([字符串字段])，函数返回为字符串的长度

示例：LEN("test")，返回值为4；LEN("测试")，返回值为2，一个中文对应1个英文字符。

LEFT

用法: LEFT(<度量字段>,< n >), 函数返回<字段>值从左边第1个字符开始,长度为n的字符串

示例: LEFT(字段1,3) 返回值为"ABC";字段1的值为"ABCDEF";

RIGHT

用法： RIGHT(<度量字段>,< n >), 函数返回<字段>值从右往左数的长度为n的字符串

示例：RIGHT(字段1,3) 返回值为"DEF";字段1的值为"ABCDEF";

MID

用法：MID(<度量字段>, < start >, < n >), 函数返回<字段>值从从左边第start个开始, 长度为n的字符串

示例：MID(字段1, 3, 3) 返回值为"CDE";字段1的值为"ABCDEF";

POS

用法：POS(<度量字段>,<字串>), 函数返回<字串>在<文本>中的位置, 如无匹配则返回0;

示例：POS(字段1,"DE") 返回值为4;字段1的值为"ABCDEF";

UPPER

用法：UPPER(<度量字段>), 将<字段>的值转换成大写;

示例：UPPER(字段1) 返回值为"ABCDEF";字段1的值为"AbcdeF";

LOWER

用法：LOWER(<度量字段>), 将<字段>的值转换成小写;

示例：LOWER(字段1) 返回值为"abcdef";字段1的值为"AbcdeF";

VAL

用法：VAL(<度量字段>), 将<字段>文本类型转换成数值类型

示例：VAL(字段1) 返回值为 123;字段1的值为"123";

LEFTTRIM

用法：LEFTTRIM(<度量字段>), 去掉<字段>左边的空格后返回

示例：LEFTTRIM(字段1) 返回值为"ABC";字段1的值为" ABC";

RIGHTTRIM

用法：RIGHTTRIM(<度量字段>), 去掉<字段>右边的空格后返回

示例：RIGTTRIM(字段1) 返回值为"ABC";字段1的值为"ABC ";

NUMBERTOSTRING

用法：NUMBERTOSTRING(<数值>), 数值类型的数据转换成字符串

示例：NUMBERTOSTRING(字段1) 返回值为"12345";字段1的值为"12345 ";

SPLITPART

用法：SPLITPART(<字符串字段>,分隔字符，子串位置), 公式会将一个字符串按照“分隔字符”将其分为N个子串(N等于分隔字符的数量+1)，子串位置从1（从左往右）开始计数，或者从-1（从右往左）开始计数

示例：SPLITPART(<字段1>,A,2) 返回值为"BCD";字段1的值为"ABCDABHABC";子串位置填写-5时，也可以取到"BCD"

CONCAT

用法：CONCAT(<字段>,<字段>,.....), 公式会将多个字段连接为一个字符串。入参必须为字符串类型的字段

示例：CONCAT(<字段1>,<字段2>) 返回值为"ABCD";字段1的值为"A"，字段2的值为"BCD"

REPLACE

用法：REPLACE([字符串], [搜索字符串], [替换字符串]), 函数返回为替换后的字符串

示例：REPLACE([字段1], [字段2], [字段3])返回值为"a12345efg";字段1的值为"abcdefg",字段2的值为""bcd",字段3的值为"12345".

6. 时间处理类

NOW

用法：NOW()，获取当前时间，会精确到秒

示例：略

DATEFORMAT

用法：DATEFORMAT(<日期字段>,<时间格式>),将日期格式化成字符串

以上两个函数的format格式目前统一为java 中格式化保持一致，支持格式类型如下：

yyyy：年
MM：月
dd：日
hh：1~12小时制(1-12)
HH：24小时制(0-23)
mm：分
ss：秒

示例1:

DATEFORMAT(<日期字段>,"yyyy-MM-dd")，若日期字段有个值为1989年8月4日，则返回值为1989-08-04，格式化时，也可以将"-"改为"/"等字符。

示例2:

DATEFORMAT(<日期字段>,"yyyy-MM-dd HH:mm:ss")，若日期字段有个值为2020年9月1日下午1点30分整，则返回值为2020-09-01 13:30:00，格式化时，也可以将连接符号"-"、“:”改为"/"、“年”、“月”、“日”等字符。

DATEADD

用法：DATEADD(<时间字段>,<偏移量>,<时间粒度>)，在<时间字段>的基础上增加<时间粒度>的<偏移量>。

时间粒度取值：

YEAR：年
MONTH：月
DAY：日
HOUR：时
MINUTE：分
SECOND：秒

偏移量是需要增加或减少的具体数字，取值为正则表示增加，取值为负则表示减少。

示例1：

假设表单中日期组件的取值为"20200901"，那么DATEADD(日期组件,10,"DAY") = 20200911。

示例2：

假设表单中日期组件的取值为"20200901"，那么DATEADD(日期控件,-1,"DAY") = 20200831。

日期展示格式默认为yyyyMMdd，如需需要修改日期的展示格式可以参考DATEFORMAT函数的示例。

DATEDIFF

用法：DATEDIFF(<时间字段1>,<时间字段2>,<时间粒度>),返回的结果为时间段字段1减去时间段字段2在时间粒度上的差值。

时间粒度可选值为：

YEAR 年
MONTH 月
DAY 日
HOUR 时
MINUTE 分
SECOND 秒

示例：DATEDIFF(日期组件1,日期组件2,"DAY")，返回值为2个日期组件相差天数

注意：参数仅支持日期组件，无法在公式输入固定日期值。

假设表单中日期控件的日期值为“2020-02-14”，假设今天为“2020-02-16”，那么使用

DATEDIFF(NOW(),填写日期,"DAY") = 2，

DATEDIFF(填写日期,NOW(),"DAY") = -2

FROMUNIXTIME

用法：将数字型的unix时间日期值unixtime转为日期值

函数声明：

datetime fromunixtime(bigint unixtime)

参数说明：

unixtime：Bigint类型，秒数，unix格式的日期时间值，若输入为string，double，decimal类型会隐式转换为bigint后参与运算。
返回值：Datetime类型的日期值，unixtime为NULL时返回NULL。

示例：

fromunixtime(123456789) = 1973-11-30 05:33:09

WEEK

用法：WEEK([日期], [起始日(可以不指定)]), 计算日期年份中的哪一周, 起始日不指定，默认一周的第一天是周一，起始日的值为：1-7 分别表示周一为第一天.... 周日为第一天

示例：WEEK([日期],)返回值为"20202";字段的值为"2020-01-08"，起始日可以不指定，默认为空。

QUARTER

用法：QUARTER([日期], [是否是财年(可以不指定)]), 计算日期年份中的哪一季度, 是否是财年：1表示按照财年统计(4月份), 0表示按照自然年

示例：QUARTER([字段1], 0)返回值为"1";字段1的值为"2020-02-02"

7. 基础统计类

ROUND

用法：ROUND(<字段>,<精度>), 四舍五入地对字段进行小数位数调整

示例：ROUND(<字段1>,<精度>) 返回值为"12.33";字段1的值为"12.33333"，精度为2

MOD

用法：MOD(<字段>,<字段>), 取模(取余)运算，返回取模值（或余数）。

说明：若要获得除法的商，可使用/ 四则运算符，比如 6/4 得到商1余2。

示例: MOD(<字段1>,<字段2>) 字段1的值为"6"，字段2的值为"4"，返回值为"2";

ParseDouble

用法：ParseDouble（<字段>），字符串或整数强转浮点数

示例：ParseDouble（＜字段＞），如果字段的值是3或“3”，则结果3.0

ParseInt

用法：Parselnt（＜字段>），字符串或浮点数强转整数

示例：Parselnt（＜字段＞），如果字段的值是3.2或“3.2”，则结果3

8. 数组类

ArrayToString

用法：ArrayToString(<数组字段>,[分隔符可选])，将数组转换为字符串

示例：ArrayToString(<字段1>,<字段2>) 返回值为"产品部-技术部-业务部";字段1的值为"[产品部，技术部，业务部]"，字段2的值为"-"；若字段2的值为空，则返回"产品部,技术部,业务部"

StringToArray

用法：StringToArray(<数组字段>,[分隔符可选])，将字符串解析为数组

示例：StringToArray(<字段1段>,<字段2>) 返回值为"[产品部,技术部,业务部]";字段1的值为"产品部-技术部-业务部"，字段2的值为"-"

ArrayLength

用法：ArrayLength(<数组字段>)，返回数组长度

示例：ArrayLength(<多选等数组字段>)返回值为"3";字段的值为"部门"，其选项为"产品部,技术部,业务部"

ArrayCat

用法：ArrayCat(<数组字段1>,<数组字段2>,...)，返回多数组拼接格式

示例：ArrayCat(<多选等数组字段1>,<多选等数组字段2>,...)返回值为"产品部,技术部,业务部,产品人员,技术人员,业务人员";字段1的值为"产品部,技术部,业务部"，字段2的值为"产品人员,技术人员,业务人员"

9. 常见问题

此文档对您是否有帮助？

1. 使用场景​

2. 数据准备介绍​

3. 设置公式入口​

4. 逻辑处理类​

CASEWHEN​

5. 文本处理类​

LEN​

LEFT​

RIGHT​

MID​

POS​

UPPER​

LOWER​

VAL​

LEFTTRIM​

RIGHTTRIM​

NUMBERTOSTRING​

SPLITPART​

CONCAT​

REPLACE​

6. 时间处理类​

NOW​

DATEFORMAT​

DATEADD​

DATEDIFF​

FROMUNIXTIME​

WEEK​

QUARTER​

7. 基础统计类​

ROUND​

MOD​

ParseDouble​

ParseInt​

8. 数组类​

ArrayToString​

StringToArray​

ArrayLength​

ArrayCat​

9. 常见问题​