素材巴巴 > 程序开发 >

python爬虫 模拟登陆

程序开发 2023-09-08 20:21:56

最近在学习python爬虫,前几天接触到模拟登陆这一块,其实之前就有接触过,但时间有点久远就遗忘了。在看了汪海的[Python]网络爬虫(十):一个爬虫的诞生全过程(以山东大学绩点运算为例)这篇文章后,尝试模拟登录自己学校的网站获取信息,但在登录这一块就卡壳了。

说明一下学校登录界面的情况。当需要进入个人信息的时候,比如图书馆、选课等,都会进入到一个专门的统一身份认证的界面,如图1所示。

图1

图1 统一身份认证界面

可以从图中看出,这儿的登录需要验证码,这就需要确保在模拟登陆时候获取的验证码一定和获取当前页面的验证码一致。 另外,这个验证码是动态生成的,所以没有办法在请求页面之后将获取到的页面内容进行解析获取验证码的网址。

图2给出的登录时所捕获到的数据。(Firefox + httpfox插件,目前感觉比chrome自带的审查元素要好用点)

图2

图2 登录时所捕获的数据

可以从图2看出,在登录提交表单(提交用户名、密码等信息&


标签:

素材巴巴 Copyright © 2013-2021 http://www.sucaibaba.com/. Some Rights Reserved. 备案号:备案中。