由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 问一个用R抓网上数据,抓下来的和网页不一致
相关主题
问个用php抓网页的问题对scala很失望 (转载)
用python urlopen 抓mitbbs页面的问题Linux loading dynamic library problem
socket re-connection problem在线问一个qsub的问题。
a question of perlpython urlopen(), how to go back to the beginning after readlines()
python gc questionLinux下incrementally地读一个正在被写的file
版上有人用Lisp么?python读入数据的问题
[合集] JAVA文本文件读写问题 (转载)有谁懂这个: example(data.table) ; dt.tbl> DT[X, on=.(y<=foo)]
Questions about C++ Linux Command Line Parsing大过节的,不要吵啦,推荐本函数编程的入门书吧?
相关话题的讨论汇总
话题: 抓下来话题: 网页话题: 一致
进入Programming版参与讨论
1 (共1页)
p*******t
发帖数: 501
1
新手尝试用R抓网上数据,但是发现抓下来的和网页不一致。用最简单的readLines的话
是可以一致的,但是如果用geturl,抓下来的source code和原始网站的source code就
不一样。这是为什么?
我在尝试抓这个网页。
http://bbs.9game.cn/forum-1534-1.html
谢谢!
c******f
发帖数: 243
2
不熟悉R
encoding可能不一样吧
f***8
发帖数: 571
3
抓网页用Hadley的httr和rvest包吧

【在 p*******t 的大作中提到】
: 新手尝试用R抓网上数据,但是发现抓下来的和网页不一致。用最简单的readLines的话
: 是可以一致的,但是如果用geturl,抓下来的source code和原始网站的source code就
: 不一样。这是为什么?
: 我在尝试抓这个网页。
: http://bbs.9game.cn/forum-1534-1.html
: 谢谢!

1 (共1页)
进入Programming版参与讨论
相关主题
大过节的,不要吵啦,推荐本函数编程的入门书吧?python gc question
FP的大神,帮忙看看8行代码是如何打印出x_n的?版上有人用Lisp么?
xgboost预测结果不一致怎么回事?[合集] JAVA文本文件读写问题 (转载)
请问怎么把网页的宽屏显示改为普通的Questions about C++ Linux Command Line Parsing
问个用php抓网页的问题对scala很失望 (转载)
用python urlopen 抓mitbbs页面的问题Linux loading dynamic library problem
socket re-connection problem在线问一个qsub的问题。
a question of perlpython urlopen(), how to go back to the beginning after readlines()
相关话题的讨论汇总
话题: 抓下来话题: 网页话题: 一致