Pandas中如何进行数据分组与聚合
在Pandas中,可以使用groupby()函数进行数据分组,然后使用聚合函数对每个组进行计算。以下是一些常用的聚合函数:
sum():求和mean():求平均值count():计数max():求最大值min():求最小值std():求标准差var():求方差
以下是一个简单的示例:
import pandas as pd
# 创建一个示例数据集
data = {'Category': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'A'],
'Values': [10, 20, 30, 40, 50, 60, 70, 80]}
df = pd.DataFrame(data)
# 使用groupby()函数进行数据分组
grouped = df.groupby('Category')
# 对每个组进行聚合计算
result = grouped.agg({'Values': ['sum', 'mean', 'count', 'max', 'min']})
print(result)
输出结果:
Values
sum mean count max min
Category
A 280 35 5 80 10
B 120 24 3 60 20
在这个示例中,我们首先创建了一个包含Category和Values两列的数据集。然后,我们使用groupby()函数按照Category列进行分组。接下来,我们使用agg()函数对每个组进行聚合计算,包括求和、求平均值、计数、求最大值和最小值。最后,我们打印出聚合结果。