PythonPandas数据分析项目教程_时间序列透视表应用
技术百科
冷漠man
发布时间:2026-01-01
浏览: 次 时间序列透视表需先将时间列转为datetime类型,再用pd.Grouper按频率(如'M'、'Q')分组或dt访问器提取年/季等字段,最后用pivot_table聚合;缺失周期需resample或date_range补全。
时间序列透视表在Pandas中不是独立功能,而是通过pd.pivot_table()结合时间列(如日期)的预处理(如dt.year、dt.month、pd.Grouper)实现的。关键在于把时间维度“结构化”为可分组的类别或规则频率,再按需聚合。
用pd.Grouper按时间频率自动分组
这是最简洁、最推荐的方式,尤其适合原始数据含DatetimeIndex或已转为datetime类型的列。
- 先确保时间列为
datetime类型:df['date'] = pd.to_datetime(df['date']) - 设为索引后使用
pd.Grouper:df.set_index('date').pivot_table(values='sales', index=pd.Grouper(freq='M'), columns='region', aggfunc='sum')——按月汇总各地区销售额 - 支持常用频率:
'D'(日)、'W'(周)、'M'(月末)、'MS'(月初)、'Q'(季度)、'A'(年度)
用dt访问器提取年/月/日等离散字段
适合需要组合多个时间层级(如“2025年华东Q1”),或时间列不便设索引时。
- 添加新列:
df['year'] = df['date'].dt.year,df['quarter'] = df['date'].dt.quarter - 直接用于
pivot_table:pd.pivot_table(df, values='revenue', index='year', columns=['region', 'quarter'], aggfunc='mean') - 注意:
dt.quarter返回1–4整数,可配合map转为'Q1'/'Q2'等标签提升可读性
处理非规则时间点与缺失周期
原始数据可能跳过某些日期(如节假日无记录),默认透视表不会补全空周期,需手动对齐。
- 用
resample()先重采样再聚合(适用于时间索引):df.set_index('date').resample('MS').sum().reset_index(),再做透视 - 或用
pd.date_range()生成完整时间序列,reindex()补零:full_idx = pd.date_range(start='2025-01-01', end='2025-12-31', freq='MS'),再groupby后reindex(full_idx, fill_value=0) - 透视表本身不插值,补全逻辑应在
pivot_table调用前完成
多级
时间索引与动态列名
当需同时观察年份和月份、或按工作日/周末分类时,可构建复合时间维度。
- 新增列组合:
df['year_month'] = df['date'].dt.to_period('M')(生成Period类型,天然支持排序和对齐) - 或用
cut()划分时间区间:df['period'] = pd.cut(df['date'].astype('int64'), bins=[start_ts, mid_ts, end_ts], labels=['H1', 'H2']) - 列名可动态生成:
columns=pd.Grouper(key='date', freq='2W'),让每两周自动成一列
# 这是
# 数据分析
# 多个
# python
# 适用于
# 设为
# 再用
# map
# 访问器
# date
# 或用
# pandas
# 原始数据
# 月末
# 应在
# 两周
相关栏目:
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
AI推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
SEO优化<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
技术百科<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
谷歌推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
百度推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
网络营销<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
案例网站<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
精选文章<?muma echo $count; ?>
】
相关推荐
- 如何使用Golang反射将map转换为struct
- C++中的constexpr和const有什么区别
- Win11怎么设置快速访问_Windows11文件
- Win11怎么设置鼠标宏_Win11鼠标按键自定义
- Dapper的Execute方法的返回值是什么意思
- Win11怎么连接投影仪_Win11多显示器投屏设
- php能跑在stm32上吗_php在stm32微控
- 如何在 Go 中调用动态链接库(.so)中的函数
- LINUX的SELinux是什么_详解LINUX强
- 如何使用Golang写入二进制文件_Golang
- php怎么下载安装并配置环境变量_命令行调用PHP
- php485返回数据不完整怎么办_php485数据
- PHP 中如何在函数内持久修改引用变量所指向的目标
- Windows音频驱动无声音原因解析_声卡驱动错误
- 如何将文本文件中的竖排字符串转换为横排字符串
- Win11怎么更改输入法顺序_Win11调整语言首
- 如何在 Python 中将 ISO 8601 时间
- 如何在Golang中使用container/hea
- Windows资源管理器总是卡顿或重启怎么办?(修
- 如何使用正则表达式批量替换重复的“-”模式为固定字
- Windows10怎么查看硬件信息_Windows
- Mac系统更新下载慢或失败怎么办_解决macOS升
- mac怎么查看wifi密码_MAC查看已连接WiF
- Win11怎样安装企业微信_Win11安装企业微信
- Win11怎么关闭开机声音_Win11系统启动提示
- PowerShell怎么创建复杂的XML结构
- c# Task.Yield 的作用是什么 它和Ta
- Win11开机Logo怎么换_Win11自定义启动
- Linux怎么禁止Root用户远程登录_Linux
- Python字符串操作教程_切片拼接与格式化详解
- 如何在Golang中配置代码格式化工具_使用gof
- Win11怎么检查TPM2.0模块_Windows
- Windows 11怎么设置默认解压软件_Wind
- Go 中的 := 运算符:类型推导机制与使用边界详
- Windows10系统怎么查看防火墙状态_Win1
- 如何使用Golang实现微服务状态监控_Golan
- 如何在包含多值的列中精准搜索指定演员?
- php嵌入式需要什么环境_搭建php+linux嵌
- c++如何实现一个高性能的环形队列(Ring Bu
- Win11怎么压缩文件 Win11自带压缩解压功能
- Python数据抓取合法性_合规说明【指导】
- Win11怎么查看局域网电脑_Windows 11
- 如何使用Golang实现容器自动化运维_Golan
- 如何在Golang中处理模块冲突_解决依赖版本不兼
- php和redis连接超时怎么办_phpredis
- 手机php文件怎么变成mp4_安卓苹果打开php转
- Windows 10怎么录屏_Windows 10
- Windows11如何设置专注助手_Windows
- LINUX下如何配置VLAN虚拟局域网_在LINU
- php与c语言在嵌入式中有何区别_对比两者在硬件控

时间索引与动态列名
QQ客服