w********e 发帖数: 128 | 1 想写个自动存取网页信息的小程序遇到瓶颈.
有些网页是用javascript产生的output,抓网页时只能抓到调用javascript的那句话.
抓不到在ie输出的那些text output,请问有什么办法吗?
多谢啦,有解决办法的话包子都发啦,虽然没多少. | h**k 发帖数: 662 | 2 问题你的程序是啥样的。。。
抓网页办法太多了。IE object, WebBroswer, HttpRequest, XMLHTTP...
【在 w********e 的大作中提到】 : 想写个自动存取网页信息的小程序遇到瓶颈. : 有些网页是用javascript产生的output,抓网页时只能抓到调用javascript的那句话. : 抓不到在ie输出的那些text output,请问有什么办法吗? : 多谢啦,有解决办法的话包子都发啦,虽然没多少.
| g*****g 发帖数: 34805 | 3 Use HtmlUnit, it has javascript engine builds in and can
render it.
【在 w********e 的大作中提到】 : 想写个自动存取网页信息的小程序遇到瓶颈. : 有些网页是用javascript产生的output,抓网页时只能抓到调用javascript的那句话. : 抓不到在ie输出的那些text output,请问有什么办法吗? : 多谢啦,有解决办法的话包子都发啦,虽然没多少.
| w********e 发帖数: 128 | 4 嗯,譬如网页上有下面一段code
这段调用的那个function不能直接访问,是动态生成文本形式的form.
我是想写一个类似crawlers哪方面的东西(e.g. webeater),就是每隔一段时间自动去抓
取网页更新的内容.
问题就出在这种网页用webeater抓下来只有函数的调用,抓不到实际生成的文本.
【在 h**k 的大作中提到】 : 问题你的程序是啥样的。。。 : 抓网页办法太多了。IE object, WebBroswer, HttpRequest, XMLHTTP...
| w********e 发帖数: 128 | 5 好像有用哎, 先去研究一下,谢谢大牛!!!
【在 g*****g 的大作中提到】 : Use HtmlUnit, it has javascript engine builds in and can : render it.
| w********e 发帖数: 128 | 6 包子已发过,请查阅!
【在 g*****g 的大作中提到】 : Use HtmlUnit, it has javascript engine builds in and can : render it.
| c**t 发帖数: 2744 | 7 how does it handle digital certificate?
【在 g*****g 的大作中提到】 : Use HtmlUnit, it has javascript engine builds in and can : render it.
| g*****g 发帖数: 34805 | 8 客气。
【在 w********e 的大作中提到】 : 包子已发过,请查阅!
| g*****g 发帖数: 34805 | 9 hmm, that I didn't try. But you can always import the certificate
to your java store, and with a little bit more coding, it should be
fine.
【在 c**t 的大作中提到】 : how does it handle digital certificate?
|
|