①在 Linux 终端执行命令initnetwork或者双击桌面上名称为初始化网络 的图标初始化实训平台网络。②在 Linux 终 端 执 行 命 令 wget -P courseHivedata httpdatasrctipdmnet81Hunanmodule22-2student_datacsv下载student_datacsv 到 Linux 本地courseHivedata 目录。③启动

① 正常启动Hadoop集群、MySQL以及Hive服务。首先在Linux终端执行命令"$HADOOP_HOME/sbin/start-all.sh"启动Hadoop集群，再开启MySQL和Hive服务，点击Hive图标启动Hive。

② 在Hive中创建对应字段名及字段类型的表（以“，”分隔），命名为student_data。

创建表的代码如下：

CREATE TABLE student_data (
  id INT,
  name STRING,
  gender STRING,
  age INT,
  class INT,
  score INT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

③ 将Linux本地路径/course/Hive/data/下的student_data.csv数据导入到student_data表，并查看导入数据后的数据表的前10行数据。

导入数据的代码如下：

LOAD DATA INPATH '/course/Hive/data/student_data.csv' INTO TABLE student_data;

查询数据的代码如下：

SELECT * FROM student_data LIMIT 10;

查询数据的结果截图如下：

④ 查询成绩大于等于90的数据，统计三个班各有多少学生。

查询数据的代码如下：

SELECT * FROM student_data WHERE score >= 90;

统计三个班各有多少学生的代码如下：

SELECT class, COUNT(*) AS student_count FROM student_data GROUP BY class;

查询数据的结果截图如下：

统计三个班各有多少学生的结果截图如下：

⑤ 计算学生的平均年龄命名为avg_age，并计算平均成绩命名为avg_score。

计算学生的平均年龄和平均成绩的代码如下：

SELECT AVG(age) AS avg_age, AVG(score) AS avg_score FROM student_data;

计算结果截图如下：

⑥ 统计学生中男、女各多少人，并求出相应的平均分数。

统计学生中男、女各多少人的代码如下：

SELECT gender, COUNT(*) AS count FROM student_data GROUP BY gender;

求出相应的平均分数的代码如下：

SELECT gender, AVG(score) AS avg_score FROM student_data GROUP BY gender;

统计结果截图如下

①在 Linux 终端执行命令initnetwork或者双击桌面上名称为初始化网络的图标初始化实训平台网络。②在 Linux 终端执行命令 wget -P courseHivedata httpdatasrctipdmnet81Hunanmodule22-2student_datacsv下载student_datacsv 到 Linux 本地courseHivedata 目录。③启动