order by
会对输入做全局排序
,因此只有1个reducer(多个reducer无法保证全局有序),会导致当输入规模较大时,需要较长的计算时间。
sort by
不是全局排序,其在数据进入 reducer 前完成排序。
因此,如果用 sort by 进行排序,并且设置 mapred.reduce.tasks>1
, 则 sort by 只保证每个 reducer 的输出有序,不保证全局有序
。文章来源:https://www.toymoban.com/news/detail-599974.html
我们下期见,拜拜!文章来源地址https://www.toymoban.com/news/detail-599974.html
到了这里,关于Hive 中 sort by 和 order by 的区别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!