B*********5 发帖数: 4 | 1 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用
的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页
我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不
要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。
第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到
excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。
请有经验的大牛分享一下。 谢过! |
d*****n 发帖数: 754 | 2 scrapy . 如果是table, pandas 的read_html就行了。
【在 B*********5 的大作中提到】 : 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用 : 的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页 : 我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不 : 要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。 : 第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到 : excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。 : 请有经验的大牛分享一下。 谢过!
|
B*********5 发帖数: 4 | 3 非常感谢!明天又有新东西学习了。
【在 d*****n 的大作中提到】 : scrapy . 如果是table, pandas 的read_html就行了。
|
B*********5 发帖数: 4 | 4 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用
的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页
我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不
要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。
第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到
excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。
请有经验的大牛分享一下。 谢过! |
d*****n 发帖数: 754 | 5 scrapy . 如果是table, pandas 的read_html就行了。
【在 B*********5 的大作中提到】 : 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用 : 的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页 : 我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不 : 要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。 : 第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到 : excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。 : 请有经验的大牛分享一下。 谢过!
|
B*********5 发帖数: 4 | 6 非常感谢!明天又有新东西学习了。
【在 d*****n 的大作中提到】 : scrapy . 如果是table, pandas 的read_html就行了。
|
s*******f 发帖数: 757 | |