让决策更智能
新一代智能数据分析平台

最佳实践

观远产品部发表于:2021年03月20日 22:09:07更新于:2021年03月20日 23:14:42

001605604b3adc7e2204fa60121b6ca

1. 数据量大小的控制

输入数据集的大小影响ETL的运行速度,运用函数DATEDIFF(终止日期字段,起始日期字段)来计算出间隔日期,如图,可以通过“筛选数据行”来控制显示最近31天的数据。

2. 数据集的关联与融合

在实际的业务场景中,部分数据可能来自数据库,部分数据可能来自文件数据,可以通过关联数据进行数据信息的汇总。比如在此ETL中用到多次数据关联,把销售信息进行整合,也把门店信息添加到处理好的销售信息上,以及把销售预测的信息关联到处理好的单店销售信息上。由此得到数据细信息的整合和不同维度的数据分析。

3. 一些常用的函数

比如month(日期字段)可以返回日期字段对应的月份。比如sum()字段可以按照指定的维度来分组,例如,sum([实收金额])over(partition by [所属区域],[消费日期]) 可以计算得到所在区域每日的消费金额。


    您需要登录后才可以回复