R语言数据可视化实践:mtcars数据集分析
使用R语言探索mtcars数据集
本教程将使用R语言的ggplot2包,对mtcars数据集进行可视化分析。mtcars数据集包含了32辆汽车的性能数据,例如每加仑行驶里程(mpg)、发动机排量(cyl)和重量(wt)。
1. 加载必要的库和设置工作目录{r}# 加载ggplot2库library(ggplot2)
设置工作目录(根据实际情况修改)setwd('C:/Path/To/Folder')
2. 可视化mpg与cyl的关系
本部分将创建包含箱线图、QQ图和直方图的图表,以展示不同汽缸数量(cyl)下每加仑行驶里程(mpg)的分布情况。{r}# 创建图表mpg_plots <- ggplot(mtcars, aes(x = factor(cyl), y = mpg, fill = factor(cyl))) + geom_boxplot() + geom_qq() + geom_histogram(aes(y = ..density..), alpha = 0.5, fill = 'lightblue', color = 'black') + geom_density(color = 'red') + labs(x = '汽缸数量', y = '每加仑行驶里程') + ggtitle('不同汽缸数量下每加仑行驶里程的分布') + scale_fill_discrete(name = '汽缸类型') + theme(legend.position = 'bottom')
保存图表ggsave('mpg_plots.png', plot = mpg_plots, width = 8, height = 6, dpi = 300)
3. 可视化mpg与wt的关系
本部分将创建一个散点图,展示每加仑行驶里程(mpg)与汽车重量(wt)之间的关系,并使用abline()添加一条直线来概括这种关系。{r}# 创建图表mpg_vs_wt <- ggplot(mtcars, aes(x = wt, y = mpg)) + geom_point() + geom_smooth(method = 'lm', se = FALSE, color = 'blue', linetype = 'solid') + labs(x = '汽车重量', y = '每加仑行驶里程') + ggtitle('每加仑行驶里程与汽车重量的关系') + theme(legend.position = 'bottom')
保存图表ggsave('mpg_vs_wt.png', plot = mpg_vs_wt, width = 8, height = 6, dpi = 300)
4. 可视化mpg与wt的关系(添加平滑曲线)
本部分将重复步骤3,并在散点图中添加两种平滑曲线,分别使用不同的线型和颜色。{r}# 创建图表mpg_vs_wt_smoothers <- ggplot(mtcars, aes(x = wt, y = mpg)) + geom_point() + geom_smooth(method = 'lm', se = FALSE, color = 'blue', linetype = 'solid') + geom_smooth(method = 'gam', se = FALSE, color = 'green', linetype = 'dotted') + geom_smooth(method = 'loess', se = FALSE, color = 'red', linetype = 'dashed') + labs(x = '汽车重量', y = '每加仑行驶里程') + ggtitle('每加仑行驶里程与汽车重量的关系(含平滑曲线)') + scale_linetype_manual(values = c('solid', 'dotted', 'dashed')) + scale_color_manual(values = c('blue', 'green', 'red')) + theme(legend.position = 'bottom')
保存图表ggsave('mpg_vs_wt_smoothers.png', plot = mpg_vs_wt_smoothers, width = 8, height = 6, dpi = 300)
注意: 以上代码假设你已经安装了ggplot2包。请根据实际情况修改工作目录,以便将图表保存到指定位置。
原文地址: https://www.cveoy.top/t/topic/paVR 著作权归作者所有。请勿转载和采集!