Hive 表创建后如何修改序列化方式?(文本转 ORC,字段分隔符为 \t)
可以修改 Hive 表的序列化方式,包括从默认的文本格式修改为 ORC 格式,并且可以修改字段分隔符为 '\t'。
具体操作如下:
- 修改表的序列化方式为 ORC 格式:
ALTER TABLE table_name SET FILEFORMAT ORC;
- 修改表的字段分隔符为 '\t':
ALTER TABLE table_name SET SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' WITH SERDEPROPERTIES ('serialization.format'='\t');
其中,table_name 为需要修改的表名。修改后,数据将以 ORC 格式存储,字段分隔符将改为 '\t'。
原文地址: https://www.cveoy.top/t/topic/mhoO 著作权归作者所有。请勿转载和采集!