Count(Distinct) 怎样去重统计
1、 创建一张大表

2、加载数据

3、设置5个reduce个数

4、执行去重id查询

5、采用GROUP by去重id

6、虽然会多用一个Job来完成,但在数据量大的情况下,这个绝对是值得的。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:136
阅读量:30
阅读量:117
阅读量:154
阅读量:148