由买买提看人间百态

topics

全部话题 - 话题: lxml
(共0页)
o****g
发帖数: 174
1
用的是这个wheel, 要先加载一个package scrapy.
https://github.com/LKI/wescraper
有如下错误:好像是没有得到cookie? 为什么?
[scrapy.utils.log] INFO: Scrapy 1.5.0 started (bot: scrapybot)
2018-01-23 17:51:22 [scrapy.utils.log] INFO: Versions: lxml 4.1.1.0, libxml2
2.9.7, cssselect 1.0.3, parsel 1.3.1, w3lib 1.18.0, Twisted 17.9.0, Python
2.7.13 |Anaconda 4.4.0 (64-bit)| (default, Dec 20 2016, 23:09:15) - [GCC 4.4
.7 20120313 (Red Hat 4.4.7-1)], pyOpenSSL 17.0.0 (OpenSSL 1.0.2l 25 May
2017), cryptography 1.8.1, Platform Linux-... 阅读全帖
h****o
发帖数: 28
2
这个我会。我做的查询一个网站的pagerank的历史值http://www.ueseo.org/pagerank-history/?url=http%3A%2F%2Fueseo.net就是这样的方法。定期帮助用户查询page rank,然后保存到一个数据库里。 python抓取数据库很方便,我用的是beautifulsoup, 也可以用pyquery, lxml等等。
http://www.ueseo.org/pagerank-history/?url=http%3A%2F%2Fueseo.n
h*******s
发帖数: 8454
3
来自主题: Programming版 - 如何从html文件里提出中文
可以用python
用lxml来处理dom
我上个月写过一个网站文章下载合并的script,就用它来着
h*******s
发帖数: 8454
4
来自主题: Programming版 - 如何从html文件里提出中文
可以用python
用lxml来处理dom
我上个月写过一个网站文章下载合并的script,就用它来着
L***n
发帖数: 6727
5
来自主题: Programming版 - 如何从html文件里提出中文
我做了个搞mitbbs和文学城的,嘿嘿,可以交流一下,我觉得可以写个框架,不同网站
用针对性的script来解决。我也是用python lxml
d********g
发帖数: 10550
6
来自主题: Programming版 - 请问哪里有python的code example
随便搞搞,bs4或者lxml啥的都行吧
d********g
发帖数: 10550
7
来自主题: Programming版 - 请问哪里有python的code example
随便搞搞,bs4或者lxml啥的都行吧
p**o
发帖数: 3409
8
来自主题: Programming版 - 那位大侠介绍一下python的webcrawler吧
用requests或者urllib2裸写,用BeautifulSoup或者lxml或者正则来parse
或者用scrapy这样的framework
新手建议从裸写开始
d******e
发帖数: 2265
9
来自主题: Programming版 - 如何快速处理大量网上xml文件?

java不一定快10倍甚至更慢也可能。因为python掉的是lxml。
go里面有soup库吗?没有的话,这个速度也要打折扣。
z****1
发帖数: 3840
10
来自主题: Programming版 - 这个简单的post.py怎么不work
谢谢回复!
我看见这个key了 但是既然能成功提交form 只是漏掉一个value 我就想这个key应该
是没用到的
试了加上这个key 果然还是一样 买上了一注 没选项 白交给赌场了。。
看到你成功买到一注player 是怎么买到的啊?
新code在下面
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
import time
from bs4 import BeautifulSoup as bs
userid = ''
passwd = ''
lott_id = '139461'
piece = '2'
def maipan(lott_id, piece, csrf_key, cookies):
url = 'http://www.mitbbs.com/mitbbs_lottery.php?board=NBA&num=' + lott_id
form = {
'ITEM' : '1',
'piece' : piece,
... 阅读全帖
(共0页)