R 散点图

散点图

你从绘图章节中了解到,plot() 函数用于绘制数字之间的关系图。

“散点图”是一种用于显示两个数值变量之间关系的图形,并为每个观测值绘制一个点。

它需要两个长度相同的向量,一个用于 x 轴(水平轴),一个用于 y 轴(垂直轴):

实例

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y)

亲自试一试

结果:

上面的观察示例应该显示了 12 辆车经过的结果。

对于第一次看到图表的人来说,这可能不太清楚,所以让我们添加一个标题和不同的标签来更好地描述散点图:

实例

x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)

plot(x, y, main="车辆观察", xlab="车龄", ylab="车速")

亲自试一试

结果:

回顾一下,上面示例中的观察结果是 12 辆车经过的结果。

x 轴显示了汽车的年龄。

y 轴显示了汽车经过时的速度。

观察结果之间有什么关系吗?

看起来车越新,开得越快,但这可能是一个巧合,毕竟我们只记录了 12 辆车。

比较图表

在上面的示例中,车速和车龄之间似乎存在关系,但是如果我们再绘制另一天的观测值会怎样呢?散点图会告诉我们其他信息吗?

要比较另一个图表,请使用 points() 函数:

实例

在同一个图形上绘制两个图表:

# 第一天,12 辆车的车龄和速度:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)

# 第二天,15 辆车的车龄和速度:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)

plot(x1, y1, main="车辆观察", xlab="车龄", ylab="车速", col="red", cex=2)
points(x2, y2, col="blue", cex=2)

亲自试一试

结果:

注意:为了能够看到比较的差异,你必须为图表分配不同的颜色(通过使用 col 参数)。红色代表第一天的值,而蓝色代表第二天的值。请注意,我们还添加了 cex 参数以增加点的大小。

观察结论:通过比较这两个图表,我认为可以肯定地说,它们都给出了相同的结论:车越新,开得越快。