①在 Linux 终端执行命令initnetwork或者双击桌面上名称为初始化网络 的图标初始化实训平台网络。②在 Linux 终 端 执 行 命 令 wget -P courseHivedata httpdatasrctipdmnet81Hunanmodule22-2student_datacsv下载student_datacsv 到 Linux 本地courseHivedata 目录。③启动
① 正常启动Hadoop集群、MySQL以及Hive服务。 首先在Linux终端执行命令"$HADOOP_HOME/sbin/start-all.sh"启动Hadoop集群,再开启MySQL和Hive服务,点击Hive图标启动Hive。
② 在Hive中创建对应字段名及字段类型的表(以“,”分隔),命名为student_data。
创建表的代码如下:
CREATE TABLE student_data (
id INT,
name STRING,
gender STRING,
age INT,
class INT,
score INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
③ 将Linux本地路径/course/Hive/data/下的student_data.csv数据导入到student_data表,并查看导入数据后的数据表的前10行数据。
导入数据的代码如下:
LOAD DATA INPATH '/course/Hive/data/student_data.csv' INTO TABLE student_data;
查询数据的代码如下:
SELECT * FROM student_data LIMIT 10;
查询数据的结果截图如下:
④ 查询成绩大于等于90的数据,统计三个班各有多少学生。
查询数据的代码如下:
SELECT * FROM student_data WHERE score >= 90;
统计三个班各有多少学生的代码如下:
SELECT class, COUNT(*) AS student_count FROM student_data GROUP BY class;
查询数据的结果截图如下:
统计三个班各有多少学生的结果截图如下:
⑤ 计算学生的平均年龄命名为avg_age,并计算平均成绩命名为avg_score。
计算学生的平均年龄和平均成绩的代码如下:
SELECT AVG(age) AS avg_age, AVG(score) AS avg_score FROM student_data;
计算结果截图如下:
⑥ 统计学生中男、女各多少人,并求出相应的平均分数。
统计学生中男、女各多少人的代码如下:
SELECT gender, COUNT(*) AS count FROM student_data GROUP BY gender;
求出相应的平均分数的代码如下:
SELECT gender, AVG(score) AS avg_score FROM student_data GROUP BY gender;
统计结果截图如下
原文地址: https://www.cveoy.top/t/topic/hJ6m 著作权归作者所有。请勿转载和采集!