博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Xpath在选择器中正确,在代码中返回的是空列表问题
阅读量:4351 次
发布时间:2019-06-07

本文共 607 字,大约阅读时间需要 2 分钟。

一、问题:

在进行爬虫的时候我们会用到xpath解析html文件,但是会有一种情况就是在xpath选择器中可以使用,但是在代码中就无法使用的情况。

 

二、原因:

1.是元素中有tbody的原因,这个元素是html生成时产生的,在使用xpath解析的时候无法解析,因此返回的列表为空值。

 

2.是因为没有写入获取的内容。比如在xpath选择其中可以使用但是在解析中没有带入//text()

 

三、解决办法:

1.因此解决办法便是删除掉tbody这个标签元素,因为它含有一个id的属性,所以不能使用这个属性。

 

2.解析中带上//text()

1         content_text = ''.join(content.xpath('*//article[@class]/p[position()>2]//text()')).replace('\n', '').replace(' ', '')2         time_ = ''.join(content.xpath('//*[@id="news-time"]//text()'))3         origin = ''.join(content.xpath('//*[@id="user-info"]/h4/a//text()'))

 

 四、参考:

 

转载于:https://www.cnblogs.com/future-dream/p/10458294.html

你可能感兴趣的文章
c++ string 结束符‘\000’
查看>>
Js 自定义日期格式的正则表达式验证
查看>>
python 全栈开发,Day89(sorted面试题,Pycharm配置支持vue语法,Vue基础语法,小清单练习)...
查看>>
CSS3 Loading(加载)动画效果
查看>>
POJ 1474 Video Surveillance
查看>>
EntityFramework CodeFirst 数据库迁移
查看>>
条件锁类
查看>>
request.getParameter()获取前台值为null
查看>>
路飞学城Python-Day186
查看>>
django Paginator分页插件
查看>>
关于APP自动化工程的一点小想法
查看>>
vc++post方式登录网站
查看>>
框架标签
查看>>
求职基础复习之冒泡排序c++版
查看>>
【TCP/IP】Ethernet II VS 802.3
查看>>
WebService学习总结(二)——WebService相关概念介绍
查看>>
webpack构建react应用三:使用webpack Loaders 模块加载器(一)
查看>>
00-Java 语言简介
查看>>
Cmake的介绍和使用 Cmake实践【转】
查看>>
Java JDBC
查看>>