① 正常启动Hadoop集群、MySQL以及Hive服务。 首先在Linux终端执行命令"$HADOOP_HOME/sbin/start-all.sh"启动Hadoop集群,再开启MySQL和Hive服务,点击Hive图标启动Hive。

② 在Hive中创建对应字段名及字段类型的表(以“,”分隔),命名为student_data。

创建表的代码如下:

CREATE TABLE student_data (
  id INT,
  name STRING,
  gender STRING,
  age INT,
  class INT,
  score INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

③ 将Linux本地路径/course/Hive/data/下的student_data.csv数据导入到student_data表,并查看导入数据后的数据表的前10行数据。

导入数据的代码如下:

LOAD DATA INPATH '/course/Hive/data/student_data.csv' INTO TABLE student_data;

查询数据的代码如下:

SELECT * FROM student_data LIMIT 10;

查询数据的结果截图如下:

④ 查询成绩大于等于90的数据,统计三个班各有多少学生。

查询数据的代码如下:

SELECT * FROM student_data WHERE score >= 90;

统计三个班各有多少学生的代码如下:

SELECT class, COUNT(*) AS student_count FROM student_data GROUP BY class;

查询数据的结果截图如下:

统计三个班各有多少学生的结果截图如下:

⑤ 计算学生的平均年龄命名为avg_age,并计算平均成绩命名为avg_score。

计算学生的平均年龄和平均成绩的代码如下:

SELECT AVG(age) AS avg_age, AVG(score) AS avg_score FROM student_data;

计算结果截图如下:

⑥ 统计学生中男、女各多少人,并求出相应的平均分数。

统计学生中男、女各多少人的代码如下:

SELECT gender, COUNT(*) AS count FROM student_data GROUP BY gender;

求出相应的平均分数的代码如下:

SELECT gender, AVG(score) AS avg_score FROM student_data GROUP BY gender;

统计结果截图如下

①在 Linux 终端执行命令initnetwork或者双击桌面上名称为初始化网络 的图标初始化实训平台网络。②在 Linux 终 端 执 行 命 令 wget -P courseHivedata httpdatasrctipdmnet81Hunanmodule22-2student_datacsv下载student_datacsv 到 Linux 本地courseHivedata 目录。③启动

原文地址: https://www.cveoy.top/t/topic/hJ6m 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录