00.背景

在爬取某招聘网站的时候,试图用request获得url的文本,然后用正则表达式匹配相关信息,但是!人家变成动态页面,无法再用普通的静态页面的方法去获取。

>>没有,是我错了,之前我没有用cookie登录,所以返回的是无关信息。只要登录了,把cookie写进去,就可以用requests获得实际的数据了。

01.报错问题

  File "D:/Python_Project/XXX.py", line 16, in <module>
    name = re.findall(r'"matchInfo":.*?"name":"(.*?)"', response)[i]  #工作名称
IndexError: list index out of range

02.报错原因

搜索网上,出现这种报错一般是两种原因:

1.下标超出范围

>>这种情况一般前面是可以跑上几个轮次再报错的,我用debug测试, 第一遍就跪了,所以pass

2.list是一个空列表,里面没有任何元素,所以list[0]就会出现错误

>>这个靠谱,我之后把整个文本拿出来搜索了一番也没有找到匹配项,所以列表为空。

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐