【Python爬虫】报错解决:IndexError: list index out of range
00.背景在爬取某招聘网站的时候,试图用request获得url的文本,然后用正则表达式匹配相关信息,但是!人家变成动态页面,无法再用普通的静态页面的方法去获取。01.报错问题File "D:/Python_Project/XXX.py", line 16, in <module>name = re.findall(r'"matchInfo":.*?"name":"(.*?)"', r
·
00.背景
在爬取某招聘网站的时候,试图用request获得url的文本,然后用正则表达式匹配相关信息,但是!人家变成动态页面,无法再用普通的静态页面的方法去获取。
>>没有,是我错了,之前我没有用cookie登录,所以返回的是无关信息。只要登录了,把cookie写进去,就可以用requests获得实际的数据了。
01.报错问题
File "D:/Python_Project/XXX.py", line 16, in <module>
name = re.findall(r'"matchInfo":.*?"name":"(.*?)"', response)[i] #工作名称
IndexError: list index out of range
02.报错原因
搜索网上,出现这种报错一般是两种原因:
1.下标超出范围
>>这种情况一般前面是可以跑上几个轮次再报错的,我用debug测试, 第一遍就跪了,所以pass
2.list是一个空列表,里面没有任何元素,所以list[0]就会出现错误
>>这个靠谱,我之后把整个文本拿出来搜索了一番也没有找到匹配项,所以列表为空。
更多推荐
已为社区贡献2条内容
所有评论(0)