s*****w 发帖数: 1527 | 1 如果打开browser的debug, 可以看到点击“下载”这个button时,url如下
http://www.mydata.com/data/filedownload.aspx?e=MyArgu1&k=kfhk22wykq
但当我把这个url放在urllib.urlretrieve(url, myDownloadFile)时,文件却是空的
,为何? |
a*****e 发帖数: 1700 | 2 browser 里面有 cookie,referer 什么的
【在 s*****w 的大作中提到】 : 如果打开browser的debug, 可以看到点击“下载”这个button时,url如下 : http://www.mydata.com/data/filedownload.aspx?e=MyArgu1&k=kfhk22wykq : 但当我把这个url放在urllib.urlretrieve(url, myDownloadFile)时,文件却是空的 : ,为何?
|
s*****w 发帖数: 1527 | 3 请问有具体点的思路吗?用python做,我对这方面不懂,谢谢!
【在 a*****e 的大作中提到】 : browser 里面有 cookie,referer 什么的
|
a*****e 发帖数: 1700 | 4 抱歉,我没用过 python 写 scraper,所以没法再具体了。
还是建议你补充一下 http 基础知识,知道一个 http request/response 循环都发生
了什么,才能够去模拟 browser 的行为
【在 s*****w 的大作中提到】 : 请问有具体点的思路吗?用python做,我对这方面不懂,谢谢!
|
s*****w 发帖数: 1527 | 5 喔,我就是做web full stack的,谢谢了。
【在 a*****e 的大作中提到】 : 抱歉,我没用过 python 写 scraper,所以没法再具体了。 : 还是建议你补充一下 http 基础知识,知道一个 http request/response 循环都发生 : 了什么,才能够去模拟 browser 的行为
|