总结平常工作中几种校验数据的思路
1、对比其他渠道数据结果
查询需求:从Hive端查询20190909当天的订单量(简单例子),需要校验SQL结果是否正确
校验方法:Hive的上游数据源为Mysql,Mysql端会有一些产出数据可供校验
如上数据流程下,如果在展现订单数据量的情况下,Hive执行查询结果需要验证,可以从Mysql渠道的数据结果进行对比来校验。
举的例子比较简单,但是属于校验数据结果的一个思路和方法。
2、分量累加比较总量
表结构:
订单ID 订单日期 订单渠道
1 20190808 A
2 20190808 A
3 20190808 B
4 20190808 B
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
查询需求:查询每天,每个渠道的订单量
校验方法:可对每天,每个渠道的订单量进行累加,看看是否与当天总订单量相同
3、分步验证结果(A left join B left join C的情况)
有订单表,商品表,用户表
查询需求:查询电子产品,用户年龄小于18岁的订单明细
校验方法:遇到这类查询场景,首先用订单表 Join 商品表,确定符合电子产品的订单明细以及数据量,这归结为第一步校验;
在第一步校验基础上再关联用户表,筛选用户年龄小于18岁的条件,进行第二部校验。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。