博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
pandas汇总和计算描述统计
阅读量:5943 次
发布时间:2019-06-19

本文共 589 字,大约阅读时间需要 1 分钟。

pandas 对象拥有一组常用的数学和统计方法。 他们大部分都属于简约和汇总统计, 用于从Series中提取单个值(如sum或mean)

或从DataFrame的行或列中提取一个Series。跟对应的Numpy数组方法对比, 他们都是基于没有缺失数据的假设而构建的。

看例子:

 

sum方法

调用DataFrame的sum方法将会返回一个含有列小计的Series:

 

 行求和

传入axis=1 将会按行进行求和运算:

 

自动排除NA值

 除非整个切片(这里指的是行或列)都是NA。通过skipna选项可以禁用该功能:

 

 

 

 

 

间接统计(比如累加, 最大id等)

 

 

 一次性产生多个汇总统计:describe

 

 

方法

 

 

 

d1.count() #非空元素计算d1.min() #最小值d1.max() #最大值d1.idxmin() #最小值的位置,类似于R中的which.min函数d1.idxmax() #最大值的位置,类似于R中的which.max函数d1.quantile(0.1) #10%分位数d1.sum() #求和d1.mean() #均值d1.median() #中位数d1.mode() #众数d1.var() #方差d1.std() #标准差d1.mad() #平均绝对偏差d1.skew() #偏度d1.kurt() #峰度d1.describe() #一次性输出多个描述性统计指标

 

转载地址:http://cbwxx.baihongyu.com/

你可能感兴趣的文章
【javascript】字符串对象常用 api
查看>>
对PostgreSQL中 index only scan 的初步理解
查看>>
poj 2337 Catenyms
查看>>
PypeR
查看>>
新浪微博布局学习——活用RelativeLayout
查看>>
第46周星期二
查看>>
Tomcat虚拟子目录
查看>>
REVIT参数化有什么意义
查看>>
将python3.1+pyqt4打包成exe
查看>>
解释器中对 标号 的使用
查看>>
分享:FireBreath 1.7.0 RC1 发布
查看>>
<<Information Store and Management>>读书笔记 之五
查看>>
2012年50个顶级的photoshop教程:(一)图形绘画类
查看>>
数据库和c#类型映射
查看>>
(转)swc与swf的区别
查看>>
javascript-Array类型 二
查看>>
Jie Bao 牛人cv
查看>>
海量数据处理的 Top K算法(问题) 小顶堆实现
查看>>
HTC 通过 WifiConfiguration 修改 SSID
查看>>
substring
查看>>