V**5 发帖数: 515 | 1 【 以下文字转载自 LosAngeles 讨论区 】
发信人: roselle (蔷薇), 信区: LosAngeles
标 题: 优秀程序员请进
发信站: BBS 未名空间站 (Tue Jun 25 03:13:01 2013, 美东)
请问有没有专门在网上抓取数据的程序尼? 每个subpage的格式都是一样的 但是手动
的每页都要手动点开 然后收集信息 感觉很麻烦 虽然数据量也不算大 对懒人来说还是
有点。。。
如果有程序可以的话 可以报个价先 |
t*******t 发帖数: 1656 | 2 crawler4j
【在 V**5 的大作中提到】 : 【 以下文字转载自 LosAngeles 讨论区 】 : 发信人: roselle (蔷薇), 信区: LosAngeles : 标 题: 优秀程序员请进 : 发信站: BBS 未名空间站 (Tue Jun 25 03:13:01 2013, 美东) : 请问有没有专门在网上抓取数据的程序尼? 每个subpage的格式都是一样的 但是手动 : 的每页都要手动点开 然后收集信息 感觉很麻烦 虽然数据量也不算大 对懒人来说还是 : 有点。。。 : 如果有程序可以的话 可以报个价先
|
t*******t 发帖数: 1656 | 3 根据格式麻烦程度,会有工作量的区别。一般情形一天可以搞定。
$200/hour. 你可能需要 $1500-$2000 的预算.
【在 V**5 的大作中提到】 : 【 以下文字转载自 LosAngeles 讨论区 】 : 发信人: roselle (蔷薇), 信区: LosAngeles : 标 题: 优秀程序员请进 : 发信站: BBS 未名空间站 (Tue Jun 25 03:13:01 2013, 美东) : 请问有没有专门在网上抓取数据的程序尼? 每个subpage的格式都是一样的 但是手动 : 的每页都要手动点开 然后收集信息 感觉很麻烦 虽然数据量也不算大 对懒人来说还是 : 有点。。。 : 如果有程序可以的话 可以报个价先
|
z******a 发帖数: 5381 | 4 太狠了。我老感觉100/hr 看情况5-8小时够了。
中国人自己直接不要太狠了好伐
【在 t*******t 的大作中提到】 : 根据格式麻烦程度,会有工作量的区别。一般情形一天可以搞定。 : $200/hour. 你可能需要 $1500-$2000 的预算.
|
t*******t 发帖数: 1656 | 5 business is business。
优秀程序员 -- 在公司的 长工 hourly rate 大概是$80 左右。
楼主要的是短工,1099 的 contractor rate. $200 不算啥。
你雇过律师没有? 同样是 professional, 程序员为什么自降身价?
我只是提供个参考价,对这个生意不感兴趣。
【在 z******a 的大作中提到】 : 太狠了。我老感觉100/hr 看情况5-8小时够了。 : 中国人自己直接不要太狠了好伐
|
r*******e 发帖数: 7583 | 6 100只能找到普通程序员,优秀的得翻倍
【在 z******a 的大作中提到】 : 太狠了。我老感觉100/hr 看情况5-8小时够了。 : 中国人自己直接不要太狠了好伐
|
k**l 发帖数: 2966 | 7 这个活用不着优秀的
【在 r*******e 的大作中提到】 : 100只能找到普通程序员,优秀的得翻倍
|
V**5 发帖数: 515 | 8 当然要奉承一下,不然说"普通程序员"的话不太尊重了。 其实说"好心,有兴趣的
程序员请帮忙"更合适,不过中文太罗嗦了。
其实我猜想这样的网上公众数据库的提取模式一定广泛使用,不过都是IP,要保密。所
以大家各自为政,重新发现车轮。
【在 k**l 的大作中提到】 : 这个活用不着优秀的
|
c***r 发帖数: 184 | |
V**5 发帖数: 515 | 10 多谢。
【在 c***r 的大作中提到】 : http://scrapy.org/
|