如何处理大数据中的重复数据?(Hadoop如何对文本文件实现全局排序)