由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Computation版 - Python- scraping "Computation" 版
相关主题
Computational Chemistry PhD找软件工程的工作有戏吗?Where to buy computer for numerical computation?
包子请帮忙,关于python请问chicago附近有好的scientific computation program吗?
Parallel computing in Matlab有人知道MS in Scientific Computing好吗?
又一个菜鸟问题请教有关Theory of Computation
Should change "computation" to "matlab computation"目前项目主要找Human-Robot Interaction(HRI),Affective Computing,Computer Vision,NPL的 技术方向。
Should I use C or matlab?大家还是bilingual吧
谁能推荐有关算法(computation algorithm)的书籍?Anybody use PETSc?
选什么系比较合适?有人用 NumPy 来计算吗
相关话题的讨论汇总
话题: python话题: scraping话题: links
进入Computation版参与讨论
1 (共1页)
S******y
发帖数: 1123
1
我有一个Python script 用来抓“Computation”版 的帖子。
S***w
发帖数: 1014
l********a
发帖数: 1154
3
可以抓任意版面,任意多层(下页)
修改main函数的url和layer即可
#! usr/bin/env python
from urllib import urlopen
from urllib import urlopen
from BeautifulSoup import BeautifulSoup
import re
def fetchPage(page,urlBase):

# get current page

soup = BeautifulSoup(page)
# get all title and links
dicList = {}
for header in soup('strong'):
links = header('a','news1')
if not links: continue
dicList[links[0].string] = links[0]['href']
# display results
for key,value in di
1 (共1页)
进入Computation版参与讨论
相关主题
有人用 NumPy 来计算吗Should change "computation" to "matlab computation"
关于Python的矩阵包Should I use C or matlab?
Octave还是SciLab谁能推荐有关算法(computation algorithm)的书籍?
跪求,用python上传一个文件到服务器的例子选什么系比较合适?
Computational Chemistry PhD找软件工程的工作有戏吗?Where to buy computer for numerical computation?
包子请帮忙,关于python请问chicago附近有好的scientific computation program吗?
Parallel computing in Matlab有人知道MS in Scientific Computing好吗?
又一个菜鸟问题请教有关Theory of Computation
相关话题的讨论汇总
话题: python话题: scraping话题: links