[問題] Dataframe 相同欄位名稱取均值方法

作者: corel (可羅)   2018-10-15 00:09:23
大家好
請問如果有Dataframe格式如下
Data1 Data2
a 1
a 2
a 3
b 3
b 3
b 3
c 1
c 1
c 1
希望可以依 Data1 名稱計算 Data2的平均值
產生
Data1 Data2
1 2
2 3
3 1
小弟的做法為
d = pd.DataFrame()
sub["data1"] = A['data1']
sub["dada2"] = B['data2']
d2 = d.groupby('data1')
result = d2.mean()
不過print(result)發現好像會變成
3 * 1 columns
請問如果想要
3 * 2 columns
該如何寫?
謝謝
作者: Czero (悠閒)   2018-10-15 06:50:00
d.groupby(data1).apply(lambda x:x.mean()).reset_index(drop=True)阿 應該是x.data2.mean()
作者: corel (可羅)   2018-10-15 13:25:00
感謝

Links booklink

Contact Us: admin [ a t ] ucptt.com