如何在包含多值的列中精准搜索指定演员?
技术百科
心靈之曲
发布时间:2026-01-01
浏览: 次 使用pandas的`str.contains()`方法配合`na=false`参数,可安全高效地在含缺失值(nan)的多值字符串列(如电影演员列表)中检索特定演员名。
在处理类似IMDb电影数据集时,cast列通常以字符串形式存储多个演员姓名(例如"Leonardo DiCaprio, Kate Winslet, Billy Zane"),此时直接使用.str.co
ntains()进行模糊匹配是常见做法。但若该列存在缺失值(NaN),默认调用会抛出错误:Cannot mask with non-boolean array containing NA / NaN values——这是因为str.contains()在遇到NaN时返回NaN而非True/False,导致布尔索引失效。
正确写法如下:
# ✅ 安全检索:显式指定 na=False,将 NaN 视为不匹配
actor_movies = bd[bd['cast'].str.contains('Leonardo DiCaprio', na=False)]? 提示:na=False表示当遇到空值(NaN)时,对应行的匹配结果强制为False,从而保证返回纯布尔数组,支持正常布尔索引。
进阶建议:
- 若需更精确匹配(避免“Leonardo”误匹配“Leonard”),可添加正则边界符:
bd['cast'].str.contains(r'\bLeonardo DiCaprio\b', na=False, regex=True)
- 若cast列实际为Python列表(如['Leonardo DiCaprio', 'Kate Winslet']),应先用explode()展开再筛选,而非字符串匹配:
bd.explode('cast')[lambda x: x['cast'] == 'Leonardo DiCaprio']
总结: 面对含NaN的多值文本列,str.contains(..., na=False)是简洁可靠的搜索方案;务必根据数据实际结构(字符串拼接 or 列表对象)选择匹配策略,避免语义误判。
相关栏目:
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
AI推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
SEO优化<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
技术百科<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
谷歌推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
百度推广<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
网络营销<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
案例网站<?muma echo $count; ?>
】
<?muma
$count = M('archives')->where(['typeid'=>$field['id']])->count();
?>
【
精选文章<?muma echo $count; ?>
】
相关推荐
- PHP接收参数值为空怎么办_判断和处理空参数方法说
- 如何处理“XML格式不正确”错误 常见XML we
- Windows10如何更改计算机工作组_Win10
- LINUX下如何配置VLAN虚拟局域网_在LINU
- php8.4如何配置ssl证书_php8.4htt
- PHP 中如何在函数内持久修改引用变量所指向的目标
- Windows电脑键盘突然失灵怎么办?(驱动与硬件
- Windows10怎么查看硬件信息_Windows
- 如何在Golang中处理云原生事件_使用Event
- Win11如何开启telnet服务 Win11启用
- c++怎么使用类型萃取type_traits_c+
- php下载安装包太大怎么下载_分卷压缩下载方法【教
- 如何在 Django 中修改用户密码后保持会话不丢
- 如何在 Django 中安全修改用户密码而不使会话
- 如何使用Golang写入二进制文件_Golang
- Win11怎么设置麦克风权限_允许应用访问Win1
- Win11怎么关闭右下角弹窗_Win11拦截系统通
- Windows系统文件被保护机制阻止怎么办_权限不
- Windows10系统服务优化指南_Win10禁用
- C++如何使用std::async进行异步编程?(
- Windows10系统怎么查看运行时间_Win10
- php中::能访问全局变量吗_全局作用域与类作用域
- Python字符串处理进阶_切片方法解析【指导】
- 如何在 Go 结构体中正确初始化 map 字段
- Python迭代器生成器进阶教程_节省内存与懒加载
- ACF 教程:正确更新嵌套在多层 Group 字段
- c++中如何对数组进行排序_c++数组排序算法汇总
- Win11怎么把图标拖到任务栏_Win11固定应用
- Win10怎么查看内存时序参数_Win10CPU-
- 如何使用Golang匿名函数_快速定义临时函数逻辑
- Windows10如何更改鼠标灵敏度_Win10鼠
- php在Linux怎么部署_LNMP环境搭建PHP
- Win11怎么关闭搜索历史_Win11清除任务栏搜
- Golang如何测试HTTP中间件_Golang
- php订单日志怎么导出excel_php导出订单日
- Mac怎么设置鼠标滚动速度_Mac鼠标设置详细参数
- Python包结构设计_大型项目组织解析【指导】
- Windows驱动无法加载错误解决方法_驱动签名验
- Windows服务持续崩溃怎样修复_系统服务保护机
- 如何在Golang中实现CI/CD流水线自动化测试
- C++ STL算法库怎么用?C++常用算法函数(s
- PythonPandas数据分析教程_数据清洗与处
- 如何使用正则表达式批量替换重复的 *- 模式为固定
- Windows10怎么备份注册表_Windows1
- 如何使用Golang安装依赖库_管理模块和第三方包
- 如何使用Golang优化模块引入路径_Golang
- Win11怎么设置开机自动连接宽带_Windows
- Win11怎么开启剪贴板历史记录_Windows1
- Windows怎样关闭Edge新标签页广告_Win
- php下载安装包怎么选_threadsafe与nt

QQ客服