温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何校验SQL查询结果是否准确

发布时间:2020-08-19 17:38:05 来源:网络 阅读:741 作者:巧克力黒 栏目:大数据

总结平常工作中几种校验数据的思路

1、对比其他渠道数据结果

如何校验SQL查询结果是否准确
查询需求:从Hive端查询20190909当天的订单量(简单例子),需要校验SQL结果是否正确
校验方法:Hive的上游数据源为Mysql,Mysql端会有一些产出数据可供校验
如上数据流程下,如果在展现订单数据量的情况下,Hive执行查询结果需要验证,可以从Mysql渠道的数据结果进行对比来校验。
举的例子比较简单,但是属于校验数据结果的一个思路和方法。

2、分量累加比较总量
表结构:
订单ID 订单日期 订单渠道
1 20190808 A
2 20190808 A
3 20190808 B
4 20190808 B
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C
5 20190807 C

查询需求:查询每天,每个渠道的订单量
校验方法:可对每天,每个渠道的订单量进行累加,看看是否与当天总订单量相同

3、分步验证结果(A left join B left join C的情况)
有订单表,商品表,用户表
查询需求:查询电子产品,用户年龄小于18岁的订单明细
校验方法:遇到这类查询场景,首先用订单表 Join 商品表,确定符合电子产品的订单明细以及数据量,这归结为第一步校验;
在第一步校验基础上再关联用户表,筛选用户年龄小于18岁的条件,进行第二部校验。

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI