r语言group_by函数的用法是什么

r语言

小亿

458

2023-12-21 08:05:18

栏目: 编程语言

group_by函数是dplyr包中的一个函数，用于按照指定的变量对数据进行分组。它通常与其他函数（如summarise、mutate和filter）一起使用，用于对每个组进行汇总、变换或筛选操作。

group_by的基本用法是：group_by(df, variable)，其中df是要进行分组的数据框或数据表，variable是要分组的变量名。分组后，可以对每个组进行各种操作，如计算每组的平均值、总和、计数等。

以下是一个示例：

library(dplyr)

# 创建一个示例数据框
df <- data.frame(
  group = c("A", "A", "B", "B", "B"),
  value = c(1, 2, 3, 4, 5)
)

# 按照group变量进行分组
df_grouped <- group_by(df, group)

# 对每个组计算平均值
df_avg <- summarise(df_grouped, avg_value = mean(value))

# 输出结果
print(df_avg)

输出结果为：

# A tibble: 2 x 2
  group avg_value
  <chr>     <dbl>
1 A           1.5
2 B           4.0

上述示例中，首先使用group_by函数按照group变量进行分组，然后使用summarise函数计算每个组的平均值。最后得到一个新的数据框df_avg，包含了每个组的平均值。

r语言group_by函数的用法是什么

最新问答

相关标签