之前写过在python中使用weibo API的方法,见这里,但是因为weibo API有频率限制,不够目前需求使用,所以通过爬虫模拟登录weibo进行直接抓取还是很有必要的,第一步要做的事情就是模拟登录过程。
weibo的登录方法一直在变,不知道现在的方法还能使用多久。
目前登录使用的是RSA加密的方式,总体来看步骤分为三步:
- 访问预登录地址,获取servertime、nonce和RSA公钥
- 访问认证地址,发送编码后的用户名和RSA加密过的密码,获得跳转地址
- 访问获得的地址,获取到登录cookie,登录完成