t***n 发帖数: 183 | 1 正在做关于用CGI 产生的 dynamic 的 web page 的 research,
想有一些 关于这种 WEB PAGE 的 ACCESS 中 某些 FRAGMENT 的
popularity 及 ACCESS PATTERN 的 统计数字, 最好能有实际的
access log 来作我的算法的输入。
想来想去, 这个BBS 的 log 应该是很合适的, 他的www
的界面是customized,
但同时对文件的ACCESS 肯定有 HOT SPOT。 不知道能不能够 用这个
BBS 的
ACCESS LOG 压。
前几天给LOOK 发了一个mail, 也没有回音, 是不是他已经不太管这
个BBS 的事拉,
有哪位大侠能帮我这个忙压。 作为回报,
我想我也许能为这个bbs的开发升级做
点什么。 另外, 要有了PAPER, 可以refer 一下这个BBS。 | m******m 发帖数: 219 | 2 you should send to 3K..
【在 t***n 的大作中提到】 : 正在做关于用CGI 产生的 dynamic 的 web page 的 research, : 想有一些 关于这种 WEB PAGE 的 ACCESS 中 某些 FRAGMENT 的 : popularity 及 ACCESS PATTERN 的 统计数字, 最好能有实际的 : access log 来作我的算法的输入。 : 想来想去, 这个BBS 的 log 应该是很合适的, 他的www : 的界面是customized, : 但同时对文件的ACCESS 肯定有 HOT SPOT。 不知道能不能够 用这个 : BBS 的 : ACCESS LOG 压。 : 前几天给LOOK 发了一个mail, 也没有回音, 是不是他已经不太管这
| l**k 发帖数: 419 | 3 我没有收到你的信呀.
但是我不能把log给你, 那里面涉及到太多的用户隐私了.
【在 t***n 的大作中提到】 : 正在做关于用CGI 产生的 dynamic 的 web page 的 research, : 想有一些 关于这种 WEB PAGE 的 ACCESS 中 某些 FRAGMENT 的 : popularity 及 ACCESS PATTERN 的 统计数字, 最好能有实际的 : access log 来作我的算法的输入。 : 想来想去, 这个BBS 的 log 应该是很合适的, 他的www : 的界面是customized, : 但同时对文件的ACCESS 肯定有 HOT SPOT。 不知道能不能够 用这个 : BBS 的 : ACCESS LOG 压。 : 前几天给LOOK 发了一个mail, 也没有回音, 是不是他已经不太管这
| t***n 发帖数: 183 | 4 关于Privacy, 用户信息可以隐藏掉的
其实就是用类似加密的手段 把 用户名 等与用户有关的信息 map 到
不同的 CODE 上,
这样能区别REQUEST 是来自不同的用户, 但并不知道是来自哪一个
用户。
需要隐藏的还包括COOKIE, 有的 还隐藏IP, URL 地址
网上有很多这样的 TRACE/LOG archive, 都是这样做的,
不过那些不符合我的要求, 没有足够多的DYNAMIC PAGE, 而且也不
能区分哪些PAGE
公用同一个fragment, 取个例子, 这个BBS不同的用户看同一篇文章
,
页面虽然不同, 但文章的内容部份是相同的。
这样的一个程序应该不难写, 网上有现成的, 可能会要改改
下面的连接是一个的网站, 上面有一些 TRACE/log archive, 一般
会说明
哪些用户信息是隐藏了, 还有一些用于这一目的的现成的工具。
http://ita.ee.lbl.gov/html/whats-new.html,
其实access log 和 trace 同样可以得到类似的信息, 但我想LOG
方便一些。
我希望保留的信息有, 能区分不同的用 |
|