让决策更智能
新一代智能数据分析平台

数据集修改模型结构方法

观小远发表于:2021年04月01日 16:58:05

背景:抽取数据集或者抽取数据集创建完成后,有时候需要增删字段或者修改字段名称、类型。

错误方法❌:点击数据集概览页面“更新”按钮,在弹出框里把旧的 SQL 替换成新的 SQL,更新方式改为”覆盖旧数据“。原因:这个更新入口仅适合数据模型结构不变,仅查询条件发生变化的数据更新。在这里修改数据集结构不生效且会引发更新失败报错。

正确方法✔️:

1.  进入数据集详情页面,点击“模型结构“标签页。


00160658913cae26eb979d1dc7a62f8

2.  点击“编辑“ 进入 SQL 查询编辑界面,修改 SQL 查询语句,然后点击”预览“确保 SQL 语句能正常查询。

001606589b5377610ca096074c2e823

3.   预览后点击页面右下角“确定“按钮。字段发生变动的话会弹出字段关联确认窗口,需要手动点击下拉菜单为标黄提示的原字段和新字段名字进行匹配,继续点击”确定“;

00160658913a2e60db68e731ade3a8600160658913ae3ea5259c2237e419d8

4.   有新增字段的话会继续提示重命名,点击”确定“ (这里重命名设不设置都可,因为后续数据结构里可以修改);

00160658913a0b70be98dafbc0813e0


5.   之前设置有去重主键的话这一步可以重新勾选去重主键,然后继续点击”确定“。完成后会触发自动更新,旧数据会被覆盖。

00160658913ca342d52165bcb28f2d7


6.   数据更新完成,查看概览页面会发现已经是新的数据模型结构。如果设置有增量更新,需要在数据集更新完成后,到“数据更新“标签页及时修改增量更新使用的 SQL 查询语句并保存。数据结构要跟模型结构里的 SQL 语句主体结构保持一致,仅查询条件不同,否则后续增量更新触发会因为数据结构不一致而导致更新失败。

001606589143af3256244a1e5d805e9


7.   修改字段类型、名字:数据集概览—数据结构界面,可以手动修改字段的显示名称和类型。这个页面也可以看到所有新建字段以及使用的公式。注意字段重命名后,新建字段引用的还是旧字段,需要到数据明细里手动替换成新的字段名。

001606589141a5445e4011ac17a4140

 

不推荐方法:抽取数据集,在数据模型里修改 SQL 语句时,使用大量 as 进行字段重命名,使用函数进行新建字段或计算,多重子查询嵌套。原因:数据更新速度慢;容易出错,后续修改麻烦,不利于维护。

推荐方法:SQL 语句尽量简单,只抽取原表数据,修改类型、重命名可以在新建数据集最后一步或者创建后概览标签页“数据结构“里修改,新建字段建议在概览页面或者 ETL 里添加。



    您需要登录后才可以回复