00.背景

在爬取某招聘网站的时候,试图用request获得url的文本,然后用正则表达式匹配相关信息,但是!人家变成动态页面,无法再用普通的静态页面的方法去获取。

>>没有,是我错了,之前我没有用cookie登录,所以返回的是无关信息。只要登录了,把cookie写进去,就可以用requests获得实际的数据了。

01.报错问题

  File "D:/Python_Project/XXX.py", line 16, in <module>
    name = re.findall(r'"matchInfo":.*?"name":"(.*?)"', response)[i]  #工作名称
IndexError: list index out of range

02.报错原因

搜索网上,出现这种报错一般是两种原因:

1.下标超出范围

>>这种情况一般前面是可以跑上几个轮次再报错的,我用debug测试, 第一遍就跪了,所以pass

2.list是一个空列表,里面没有任何元素,所以list[0]就会出现错误

>>这个靠谱,我之后把整个文本拿出来搜索了一番也没有找到匹配项,所以列表为空。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐