1.简述
TCP全称为Transmission Control Protocol,每一个IT人士对TCP都有一定了解。TCP协议属于底层协议,对于大部分研发人员来说,这是透明的,无需关心TCP的实现与细节。不过如果想做深入的性能优化,TCP是绕不过去的一…
一、启动压缩
set hive.exec.compress.output=true;
set mapreduce.output.fileoutputformat.compress=true; 二、 输入合并
当有大量小文件时,启动合并,减少map数。
对应参数:
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;--默认开启…