由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请教一个初级问题
... ?
相关主题
parsing file in node: js or python ?有啥好轮子可以抓取网页里的不规则信息?
后台python wsgi, 前端html, css, javascript如何下载网络页面,不包含,
python/javascript有没有一些lib可以比较好的parse pdf文件?python 问题
请教一个parser的问题请教html中的href
请教个网页数据抓取的程序设计请问Python初学者怎么学
telnet下如何verify进入哪个页面?请问哪里有python的code example
大家iphone编程,在哪儿用web service fetch股票历史信息,lott (转载)python urlopen(), how to go back to the beginning after readlines()
从网页周期性抓取信息然后自动发邮件,应该怎么做?王垠对google的看法 (转载)
相关话题的讨论汇总
话题: python话题: javascript话题: c++话题: 初级话题: html
进入Programming版参与讨论
1 (共1页)
s*******d
发帖数: 1027
1
如果我想从一个网页抓取数据, 然后最好能导入excel,或者写成txt文件也行,应该
用什么语言编? Javascript么?
我只用过C/C++,也算不上精通。 多谢
w***y
发帖数: 78
2
perl or python
c********g
发帖数: 449
3
Java, c++ 等待。BUT NOT javascript.
o*****8
发帖数: 192
4
python got some nice open source libraries on html parsing like http://www.crummy.com/software/BeautifulSoup/ .
It is kind of cool..
s*******d
发帖数: 1027
5
Thanks everyone!
b******n
发帖数: 592
6
Python is good. HTML fetching is a pain because they don't normally follow
the rule. Tags can be missing in many cases. But if you want to fetch from
quality website, beautifulsoup is great. I developped the same program for
my previous company. It works great.
Another thing is try to limit your access to the website. Too many threads
may get your ip banned.

【在 o*****8 的大作中提到】
: python got some nice open source libraries on html parsing like http://www.crummy.com/software/BeautifulSoup/ .
: It is kind of cool..

1 (共1页)
进入Programming版参与讨论
... ?
相关主题
王垠对google的看法 (转载)请教个网页数据抓取的程序设计
python 3.6下面也没有好的parse android apk information的lib?telnet下如何verify进入哪个页面?
求教Code大家iphone编程,在哪儿用web service fetch股票历史信息,lott (转载)
how to count the times a function is used从网页周期性抓取信息然后自动发邮件,应该怎么做?
parsing file in node: js or python ?有啥好轮子可以抓取网页里的不规则信息?
后台python wsgi, 前端html, css, javascript如何下载网络页面,不包含,
python/javascript有没有一些lib可以比较好的parse pdf文件?python 问题
请教一个parser的问题请教html中的href
相关话题的讨论汇总
话题: python话题: javascript话题: c++话题: 初级话题: html