pandas read_excel 如何只读取特定 sheet 且跳过前几行
技术百科
冰川箭仙
发布时间:2026-01-25
浏览: 次 read_excel 中 sheet_name 与 skiprows 组合使用最常用可靠:先定位目标 sheet,再从其第 0 行起跳过指定行数;sheet_name 支持字符串、整数或列表,单表推荐字符串;skiprows 支持整数或可调用对象。
read_excel 指定 sheet_name 和 skiprows 参数组合使用
直接用 sheet_name 选表、skiprows 跳行是最常用也最可靠的方式。pandas 会先定位到目标 sheet,再从该 sheet 的第 0 行开始计数跳过指定行数。
-
sheet_name可以是字符串(sheet 名)、整数(索引,如0表示第一个 sheet)或列表(读多个);单 sheet 场景推荐用字符串,避免因 Excel 重排 sheet 顺序导致出错 -
skiprows接受整数(跳过前 N 行)或可调用对象(例如lambda x: x ),但整数最直观;注意它跳的是“数据区的前 N 行”,不是 Excel 界面里带合并单元格的标题行——如果前几行有空行或格式混乱,skiprows可能失效 - 若需跳过含标题的前 3 行,且第 4 行才是列名,应设
skiprows=3,再配合header=0(默认值),否则列名会被当成数据
当跳过的行里有合并单元格或空行时怎么办
Excel 常见的“多层标题”或“单位说明行”会导致 skiprows 数不准。这时不能只靠硬跳,得结合 header 定位真实列名行。
- 先用
pd.read_excel("file.xlsx", sheet_name="Sheet1", nrows=5)快速预览前几行,人工确认列名实际在哪一行(比如在第 5 行,索引为 4) - 设
skiprows=4+header=0,或更稳妥地直接用header=4(表示把第 5 行作为列名),此时skiprows可省略 - 如果合并单元格导致某列名跨两行(如 A1:A2 合并写“销售额”),pandas 默认会读成
NaN或空字符串,需后续用df.columns = [...]手动修复
读取后发现列名错位或数据偏移
典型现象是第一列全是 NaN,或数据整体右移一列——大概率是 Excel 中存在隐藏的空首列(比如 A 列全空),pandas 把它当成了索引列。
- 加参数
index_col=None显式禁用自动索引推断,强制所有列为普通列 - 用
usecols限定读取范围,例如usecols="B:E"或usecols=[1,2,3,4](从 0 开始计数),跳过可疑的空列 - 检查原始 Exc
el:打开文件 → 选中列标(如 A 列)→ 右键“取消隐藏”,确认是否有不可见列干扰
性能与兼容性提醒
如果文件极大或 sheet 很多,sheet_name 设为具体名称比 None(读全部)快得多;但引擎选择会影响 skiprows 行为。
- 默认引擎
openpyxl支持 .xlsx,skiprows稳定;老式 .xls 文件必须用xlrd(v2.0.1+ 仅支持 xls),且不支持skiprows,只能改用header - 若用
engine="calamine"(新锐高性能引擎),skiprows仍可用,但某些复杂格式(如条件格式、图表)会被忽略——仅读数据时推荐 - 不要在
skiprows里传负数或超出行数的值,会静默失败或报ValueError: skiprows must be an integer
真正麻烦的是那些手动合并、手写注释、动态插入空行的业务 Excel——它们让自动化读取变成模式识别问题,这时候与其调参,不如先让人清理源文件。
# 自动化
# 的是
# 让人
# 第一个
# 成了
# excel
# 跳过
# 最常用
# 单元格
# 对象
# 字符串
# 行数
# Lambda
# pandas
# Integer
# 或可
# 几行
相关栏目:
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
AI推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
SEO优化<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
技术百科<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
谷歌推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
百度推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
网络营销<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
案例网站<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
精选文章<?muma echo $count; ?>
】
相关推荐
- Win10电脑怎么设置网络名称_Windows10
- Win10文件历史记录怎么用 Win10开启自动备
- 如何使用Golang写入二进制文件_Golang
- Windows10系统怎么查看运行时间_Win10
- Win11怎么压缩文件 Win11自带压缩解压功能
- 如何在Golang中捕获HTTP服务器错误_Gol
- mac怎么右键_MAC鼠标右键设置与触控板手势技巧
- Win10怎样设置多显示器_Win10多显示器扩展
- Windows10电脑怎么设置防火墙出站规则_Wi
- Win11如何卸载OneDrive_Win11卸载
- Windows驱动无法加载错误解决方法_驱动签名验
- php打包exe后无法写入文件_权限问题解决方法【
- Win11屏幕亮度突然变暗怎么解决_自动变暗问题处
- Win11怎么设置DNS服务器_Windows11
- Win11怎么设置应用分屏_Windows11贴靠
- 如何处理“XML格式不正确”错误 常见XML we
- 如何开启Windows的远程服务器管理工具(RSA
- c++中如何使用auto关键字_c++11类型推导
- Mac如何备份到iCloud_Mac桌面与文稿文件
- Windows Defender扫描失败怎么办_安
- php怎么下载安装并配置环境变量_命令行调用PHP
- Win11怎么设置组合键快捷方式_Windows1
- PHP的FastAdmin架构适合二次开发吗_特点
- Python网页解析流程_html结构说明【指导】
- Win10怎么卸载鲁大师_Win10彻底卸载鲁大师
- php怎么连接数据库_MySQL数据库连接的基础代
- Win10怎么更改用户名 Win10修改账户名称操
- Win11怎么设置夜间模式_Windows11显示
- Win11怎么设置触控板手势_Windows11三
- Win11怎么更改默认打开方式_Win11关联文件
- Win11怎么设置默认图片查看器_Windows1
- Win11如何连接Xbox手柄 Win11蓝牙连接
- 如何在Golang中捕获结构体方法错误_Golan
- c++怎么使用std::filesystem遍历文
- c++如何实现一个高性能的环形队列(Ring Bu
- Windows10如何更改桌面图标间距_Win10
- Windows11怎么用“记事本”自动换行与编码
- 如何使用Golang sync.Map实现并发安全
- php本地部署后session无法保存_sessi
- Windows 11如何开启文件夹加密(EFS)_
- Golang如何实现基本的用户注册_Golang用
- Windows10如何查看保存的WiFi密码_Wi
- Win11如何添加/删除输入法 Win11切换中英
- Python文件和流处理指南_高效读写大体积数据文
- c++如何判断文件是否存在_c++ filesys
- php接口返回数据乱码怎么办_php接口调试编码问
- Windows10怎样设置家长控制_Windows
- 如何在Mac上搭建Golang开发环境_使用Hom
- Windows10如何更改鼠标灵敏度_Win10鼠
- Win11相机打不开提示错误怎么修_相机权限开启与


QQ客服