Hive表创建后修改序列化方式:文本格式转ORC格式及字段分隔符更改
可以修改表的序列化方式,举例说明如下:
假设已经创建了一个名为'test'的表,使用默认的文本格式,并且字段分隔符为逗号(,):
CREATE TABLE test (
id INT,
name STRING,
age INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
现在需要将该表的序列化方式修改为ORC格式,并且字段分隔符修改为制表符(\t):
ALTER TABLE test SET SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'
WITH SERDEPROPERTIES (
'serialization.format' = '\t'
);
执行以上操作后,'test'表的序列化方式就变成了ORC格式,并且字段分隔符为制表符。需要注意的是,修改序列化方式可能会影响到表数据的读取和写入,应该谨慎操作。
原文地址: https://www.cveoy.top/t/topic/mhnu 著作权归作者所有。请勿转载和采集!