x******n 发帖数: 9057 | 1 准备1-2周之内把它搞出来。
之所以不确定是1周还是2周是因为我要把数据移到不同的地方,需要重新上传和重建索
引,因为数据量比较大(1350万贴so far),不确定这个过程需要多久。 |
kx 发帖数: 16384 | 2 re
【在 x******n 的大作中提到】 : 准备1-2周之内把它搞出来。 : 之所以不确定是1周还是2周是因为我要把数据移到不同的地方,需要重新上传和重建索 : 引,因为数据量比较大(1350万贴so far),不确定这个过程需要多久。
|
m*********g 发帖数: 11102 | 3 先把萧红狼的马甲全找出来
【在 x******n 的大作中提到】 : 准备1-2周之内把它搞出来。 : 之所以不确定是1周还是2周是因为我要把数据移到不同的地方,需要重新上传和重建索 : 引,因为数据量比较大(1350万贴so far),不确定这个过程需要多久。
|
A*******s 发帖数: 8645 | 4 这么久,大部分估计都饿死了
【在 m*********g 的大作中提到】 : 先把萧红狼的马甲全找出来
|
x******n 发帖数: 9057 | 5 倒计时3天
【在 x******n 的大作中提到】 : 准备1-2周之内把它搞出来。 : 之所以不确定是1周还是2周是因为我要把数据移到不同的地方,需要重新上传和重建索 : 引,因为数据量比较大(1350万贴so far),不确定这个过程需要多久。
|
kx 发帖数: 16384 | 6 re
建索
【在 x******n 的大作中提到】 : 倒计时3天
|
r****y 发帖数: 26819 | 7 haha,中秋节前完工?
【在 x******n 的大作中提到】 : 倒计时3天
|
x******n 发帖数: 9057 | 8 恩,转移数据和配置服务器花了我小50刀呢。。
【在 r****y 的大作中提到】 : haha,中秋节前完工?
|
|
x******n 发帖数: 9057 | 9 额,跳票了,还要1,2天
【在 x******n 的大作中提到】 : 倒计时3天
|
m*********g 发帖数: 11102 | 10 政客!
【在 x******n 的大作中提到】 : 额,跳票了,还要1,2天
|
|
|
x******n 发帖数: 9057 | 11 政客的话就不是一两天,要等到下个任期了
【在 m*********g 的大作中提到】 : 政客!
|
d*****9 发帖数: 3459 | 12 买提不是semi终身制么?
【在 x******n 的大作中提到】 : 政客的话就不是一两天,要等到下个任期了
|
A*******s 发帖数: 8645 | 13 yeah
【在 x******n 的大作中提到】 : 政客的话就不是一两天,要等到下个任期了
|
x******n 发帖数: 9057 | 14 完工。
http://www.weiming.info
多提意见,恩。
【在 x******n 的大作中提到】 : 额,跳票了,还要1,2天
|
m*********g 发帖数: 11102 | 15 这马甲追踪应该加入一些能排除穿梭站点影响的算法
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
x******n 发帖数: 9057 | 16 有的,你发现有问题?
【在 m*********g 的大作中提到】 : 这马甲追踪应该加入一些能排除穿梭站点影响的算法
|
m*********g 发帖数: 11102 | 17 我那些马甲除了mylx都非常不靠谱
【在 x******n 的大作中提到】 : 有的,你发现有问题?
|
x******n 发帖数: 9057 | 18 你私下告诉我几个,我来查查是什么原因
【在 m*********g 的大作中提到】 : 我那些马甲除了mylx都非常不靠谱
|
x******n 发帖数: 9057 | 19 不过十有八九是你其他的马甲都藏的太深了。
【在 x******n 的大作中提到】 : 你私下告诉我几个,我来查查是什么原因
|
m*********g 发帖数: 11102 | 20 估计是其他马甲发帖太少, 都被删了。
比如evol, 你是不是找不到几个帖子?
【在 x******n 的大作中提到】 : 你私下告诉我几个,我来查查是什么原因
|
|
|
x******n 发帖数: 9057 | 21 数据库里有82个,我来查查看
【在 m*********g 的大作中提到】 : 估计是其他马甲发帖太少, 都被删了。 : 比如evol, 你是不是找不到几个帖子?
|
m*********g 发帖数: 11102 | 22 我还就是实在想不通为啥Judelaw会排在我的疑似马甲第一? 比真正马甲mylx还靠前。
。。
【在 x******n 的大作中提到】 : 数据库里有82个,我来查查看
|
x******n 发帖数: 9057 | 23 查mylx并考虑版面,evol排第二。
我回头研究一下这个案例,看看算法需不需要改进。
【在 m*********g 的大作中提到】 : 我还就是实在想不通为啥Judelaw会排在我的疑似马甲第一? 比真正马甲mylx还靠前。 : 。。
|
m*********g 发帖数: 11102 | 24 奇怪。 那为啥evol在muyeliuxing的疑似(考虑版面)里面排那么远?
前。
【在 x******n 的大作中提到】 : 查mylx并考虑版面,evol排第二。 : 我回头研究一下这个案例,看看算法需不需要改进。
|
m*********g 发帖数: 11102 | 25 我感觉muyeliuxing那些疑似马甲里面, 几乎都是天天谈的穿梭IP在起作用
前。
【在 x******n 的大作中提到】 : 查mylx并考虑版面,evol排第二。 : 我回头研究一下这个案例,看看算法需不需要改进。
|
x******n 发帖数: 9057 | 26 因为id发贴太多的话,交互面很大,产生了很多噪音,发贴太少的话则数据不足。
所以一个发帖量中等的id结果是最准的。
【在 m*********g 的大作中提到】 : 奇怪。 那为啥evol在muyeliuxing的疑似(考虑版面)里面排那么远? : : 前。
|
x******n 发帖数: 9057 | 27 天天谈的穿梭ip是多少?我check一下,不过应该没问题的,用这个ip的用户越多,这个
ip起的作用就越小。
【在 m*********g 的大作中提到】 : 我感觉muyeliuxing那些疑似马甲里面, 几乎都是天天谈的穿梭IP在起作用 : : 前。
|
m*********g 发帖数: 11102 | 28 小红狼的马甲抓得很准
估计是因为每个马甲都使用了同样两个IP的缘故
【在 x******n 的大作中提到】 : 因为id发贴太多的话,交互面很大,产生了很多噪音,发贴太少的话则数据不足。 : 所以一个发帖量中等的id结果是最准的。
|
b*****l 发帖数: 9499 | 29 赞美啊。查一个:
xiaoxiaoyu - 马甲追踪
考虑用户发帖版面信息
排名 疑似马甲 IP相似分 发贴版面相似分 总分
1 ashi 0.0827800944015 0.134279214341 0.10501138648
2 ppdepp 0.0806836904196 0.0439422365595 0.0877745340414
3 ibs 0.0653557729835 0.0 0.0653557729835
4 nj047829 0.0653557729835 0.0 0.0653557729835
5 yom 0.0602302500156 0.0 0.0602302500156
6 feifei50 0.0590556074154 0.0 0.0590556074154
7 feifei1116 0.0590556074154 0.0 0.0590556074154
8
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
m*********g 发帖数: 11102 | 30 哈哈。 我明白了
因为天天谈的ip变了好几次, 所以这些用户都使用过的同样的3个(以上)IP。。。
这个
【在 x******n 的大作中提到】 : 天天谈的穿梭ip是多少?我check一下,不过应该没问题的,用这个ip的用户越多,这个 : ip起的作用就越小。
|
|
|
x******n 发帖数: 9057 | 31 。。。太狠了,积少成多了那就
【在 m*********g 的大作中提到】 : 哈哈。 我明白了 : 因为天天谈的ip变了好几次, 所以这些用户都使用过的同样的3个(以上)IP。。。 : : 这个
|
m*********g 发帖数: 11102 | 32 所以天天谈这些IP要在普遍算法外特别消除影响
【在 x******n 的大作中提到】 : 。。。太狠了,积少成多了那就
|
x******n 发帖数: 9057 | 33 恩,要不这样,id数超过某个阈值的ip完全不考虑,我本来试过这个,后来又去掉了。
你收集一下都有哪几个ip吧,我看看阈值应该设在哪。
【在 m*********g 的大作中提到】 : 所以天天谈这些IP要在普遍算法外特别消除影响
|
m*********g 发帖数: 11102 | 34 我也忘了ttt有过哪些IP。 回头找找看。 不过你查查ttt现在的IP多少ID在用, 根据
这个来考虑阈值
【在 x******n 的大作中提到】 : 恩,要不这样,id数超过某个阈值的ip完全不考虑,我本来试过这个,后来又去掉了。 : 你收集一下都有哪几个ip吧,我看看阈值应该设在哪。
|
m*********g 发帖数: 11102 | 35 ttt现在的ip是208.94
了。
【在 m*********g 的大作中提到】 : 我也忘了ttt有过哪些IP。 回头找找看。 不过你查查ttt现在的IP多少ID在用, 根据 : 这个来考虑阈值
|
m*****a 发帖数: 629 | 36 抵赖是没有意义的
恩
【在 m*********g 的大作中提到】 : 我还就是实在想不通为啥Judelaw会排在我的疑似马甲第一? 比真正马甲mylx还靠前。 : 。。
|
m*****a 发帖数: 629 | 37 太不准了,竟然没有鸭子,哈哈哈
【在 b*****l 的大作中提到】 : 赞美啊。查一个: : xiaoxiaoyu - 马甲追踪 : 考虑用户发帖版面信息 : 排名 疑似马甲 IP相似分 发贴版面相似分 总分 : 1 ashi 0.0827800944015 0.134279214341 0.10501138648 : 2 ppdepp 0.0806836904196 0.0439422365595 0.0877745340414 : 3 ibs 0.0653557729835 0.0 0.0653557729835 : 4 nj047829 0.0653557729835 0.0 0.0653557729835 : 5 yom 0.0602302500156 0.0 0.0602302500156 : 6 feifei50 0.0590556074154 0.0 0.0590556074154
|
m*****a 发帖数: 629 | 38 现在有人给你捐美刀么?
【在 x******n 的大作中提到】 : 恩,要不这样,id数超过某个阈值的ip完全不考虑,我本来试过这个,后来又去掉了。 : 你收集一下都有哪几个ip吧,我看看阈值应该设在哪。
|
x******n 发帖数: 9057 | 39 木,其实我更多是觉得,摆个这个上去比较酷
【在 m*****a 的大作中提到】 : 现在有人给你捐美刀么?
|
r****y 发帖数: 26819 | 40 太不政客了,居然就完工了
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
|
|
r****y 发帖数: 26819 | 41 你还是xxy的马甲。
【在 m*********g 的大作中提到】 : 我那些马甲除了mylx都非常不靠谱
|
r****y 发帖数: 26819 | 42 鸭子快来辩解一下
【在 m*****a 的大作中提到】 : 太不准了,竟然没有鸭子,哈哈哈
|
x******n 发帖数: 9057 | 43 研究了下,天天谈的ip太多了,全去掉再查你就没有结果了。
看来还是得保留,现在起码还能找出mylx不是。
你上站基本都从那边走的吧。
【在 m*********g 的大作中提到】 : 所以天天谈这些IP要在普遍算法外特别消除影响
|
r****y 发帖数: 26819 | 44 发现统计版面的图片很容易超出边界
我的版面太杂了,需要更大空间显示结果
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
x******n 发帖数: 9057 | 45 大部分情况应该还好,我已经限制显示40项了,如果分布不均衡都在一边的话确实还是
有可能超过。
google这个函数做的太sb了,应该自动扩展图形显示全部图例啊,指定更大的画布也不
行,丫的ratio是固定的,要扩展就整个放大。
【在 r****y 的大作中提到】 : 发现统计版面的图片很容易超出边界 : 我的版面太杂了,需要更大空间显示结果
|
r****y 发帖数: 26819 | 46 这种图用Flex做更好,还可以互动
【在 x******n 的大作中提到】 : 大部分情况应该还好,我已经限制显示40项了,如果分布不均衡都在一边的话确实还是 : 有可能超过。 : google这个函数做的太sb了,应该自动扩展图形显示全部图例啊,指定更大的画布也不 : 行,丫的ratio是固定的,要扩展就整个放大。
|
x******n 发帖数: 9057 | 47 没玩过,有google chart这样的restful的服务么
【在 r****y 的大作中提到】 : 这种图用Flex做更好,还可以互动
|
r****y 发帖数: 26819 | 48 不清楚。我也没用过实际的。
【在 x******n 的大作中提到】 : 没玩过,有google chart这样的restful的服务么
|
m*********g 发帖数: 11102 | 49 不用排除, 但可以降低影响比重
【在 x******n 的大作中提到】 : 研究了下,天天谈的ip太多了,全去掉再查你就没有结果了。 : 看来还是得保留,现在起码还能找出mylx不是。 : 你上站基本都从那边走的吧。
|
x******n 发帖数: 9057 | |
|
|
e*****n 发帖数: 3129 | 51 好像大小写有影响
比如查Rodney
疑似马甲第一是rodney
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
r****y 发帖数: 26819 | 52 是啊,id和版名都应该不区分大小写。
【在 e*****n 的大作中提到】 : 好像大小写有影响 : 比如查Rodney : 疑似马甲第一是rodney
|
x******n 发帖数: 9057 | 53 fixed,谢谢report
【在 e*****n 的大作中提到】 : 好像大小写有影响 : 比如查Rodney : 疑似马甲第一是rodney
|
x******n 发帖数: 9057 | 54 id是不区分,数据库里一律用小写
版名设计的时候没考虑到这个,数据库里没有转成小写,所以没办法了。
【在 r****y 的大作中提到】 : 是啊,id和版名都应该不区分大小写。
|
r****y 发帖数: 26819 | 55 query的匹配方式可以改
【在 x******n 的大作中提到】 : id是不区分,数据库里一律用小写 : 版名设计的时候没考虑到这个,数据库里没有转成小写,所以没办法了。
|
x******n 发帖数: 9057 | 56 不支持,用的不是mysql
【在 r****y 的大作中提到】 : query的匹配方式可以改
|
r****y 发帖数: 26819 | 57 UCASE(board_name) Like UCASE("thoughts")怎么样?
【在 x******n 的大作中提到】 : 不支持,用的不是mysql
|
x******n 发帖数: 9057 | 58 Cloud里用的非关系数据库,不支持这些,因为不scale
【在 r****y 的大作中提到】 : UCASE(board_name) Like UCASE("thoughts")怎么样?
|
r****y 发帖数: 26819 | 59 那就在客户端html做文章,把版名输入改成dropdownlist选择,或者改成自动补充完整
【在 x******n 的大作中提到】 : Cloud里用的非关系数据库,不支持这些,因为不scale
|
x******n 发帖数: 9057 | 60 ...输入正确的大小写真这么难么,我去的版都记得大小写。。
【在 r****y 的大作中提到】 : 那就在客户端html做文章,把版名输入改成dropdownlist选择,或者改成自动补充完整
|
|
|
r****y 发帖数: 26819 | 61 我很懒。。。
【在 x******n 的大作中提到】 : ...输入正确的大小写真这么难么,我去的版都记得大小写。。
|
l*r 发帖数: 79569 | 62 有点难
autocomplete应该很容易做啊
【在 x******n 的大作中提到】 : ...输入正确的大小写真这么难么,我去的版都记得大小写。。
|
l*r 发帖数: 79569 | 63 赞美,我手一抖,差点捐了
【在 x******n 的大作中提到】 : 木,其实我更多是觉得,摆个这个上去比较酷
|
l*r 发帖数: 79569 | 64 这个站会不会影响老刑的流量?好多马甲不敢来了
或者都从ttt走了,河伯该乐了吧? |
A*******e 发帖数: 12486 | 65 可以加个功能,点击选择按不同种类的分值排序
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
x******n 发帖数: 9057 | 66 等我有空的时候考虑考虑。。
【在 l*r 的大作中提到】 : 有点难 : autocomplete应该很容易做啊
|
x******n 发帖数: 9057 | 67 意义不大,因为要按ip排序的话不考虑版面信息就好。
全局的按照版面信息排序其实不支持(要支持的话得特别为这个建索引),这里的实现
其实只是在ip最相似的N个ID里面排,所以光按这个排意义也不大。
【在 A*******e 的大作中提到】 : 可以加个功能,点击选择按不同种类的分值排序
|
A*******e 发帖数: 12486 | 68 你这个网站是不是得不停地从买提读取信息?
【在 x******n 的大作中提到】 : 意义不大,因为要按ip排序的话不考虑版面信息就好。 : 全局的按照版面信息排序其实不支持(要支持的话得特别为这个建索引),这里的实现 : 其实只是在ip最相似的N个ID里面排,所以光按这个排意义也不大。
|
x******n 发帖数: 9057 | 69 每天夜深人静的时候下载一次新帖
【在 A*******e 的大作中提到】 : 你这个网站是不是得不停地从买提读取信息?
|
A*******e 发帖数: 12486 | 70 每天流量多少?
【在 x******n 的大作中提到】 : 每天夜深人静的时候下载一次新帖
|
|
|
x******n 发帖数: 9057 | 71 你说买提的新帖量?好像是3万左右。
现在还是赶进度,过几天赶上了我再看看。
【在 A*******e 的大作中提到】 : 每天流量多少?
|
A*******e 发帖数: 12486 | 72 我说的是按MB算你下载的据量
【在 x******n 的大作中提到】 : 你说买提的新帖量?好像是3万左右。 : 现在还是赶进度,过几天赶上了我再看看。
|
x******n 发帖数: 9057 | 73 几十M
【在 A*******e 的大作中提到】 : 我说的是按MB算你下载的据量
|
A*******e 发帖数: 12486 | 74 连文章内容都下载了?
【在 x******n 的大作中提到】 : 几十M
|
x******n 发帖数: 9057 | 75 当然了
【在 A*******e 的大作中提到】 : 连文章内容都下载了?
|
A*******e 发帖数: 12486 | 76 那你的那些分析利用文章内容了么?
【在 x******n 的大作中提到】 : 当然了
|
x******n 发帖数: 9057 | 77 没有,你给个思路?
【在 A*******e 的大作中提到】 : 那你的那些分析利用文章内容了么?
|
A*******e 发帖数: 12486 | 78 没有的话,不是浪费流量了么?
你可以加个参数,文章字节大小
【在 x******n 的大作中提到】 : 没有,你给个思路?
|
x******n 发帖数: 9057 | 79 目的不光是分析,也在存档文章,这些帖子过期删除太可惜了,虽然大部分是垃圾。
【在 A*******e 的大作中提到】 : 没有的话,不是浪费流量了么? : 你可以加个参数,文章字节大小
|
A*******e 发帖数: 12486 | 80 垃圾删除有啥可惜的
【在 x******n 的大作中提到】 : 目的不光是分析,也在存档文章,这些帖子过期删除太可惜了,虽然大部分是垃圾。
|
|
|
x******n 发帖数: 9057 | 81 这个有点像geocities,虽然大家都说那上面的网站大部分是垃圾,但是还是有人去做存
档的。
反正现在存储比垃圾还便宜。
【在 A*******e 的大作中提到】 : 垃圾删除有啥可惜的
|
x******n 发帖数: 9057 | 82 现在支持使用不正确的大小写了。
【在 r****y 的大作中提到】 : 我很懒。。。
|
kx 发帖数: 16384 | 83 一般夜深人静的时候都是买提最炖的时候吧
【在 x******n 的大作中提到】 : 每天夜深人静的时候下载一次新帖
|
x******n 发帖数: 9057 | 84 那是你试验的时候夜还不够深
【在 kx 的大作中提到】 : 一般夜深人静的时候都是买提最炖的时候吧
|
r****y 发帖数: 26819 | 85 统计数据有点问题
比如9-10月围棋版
排名 ID 帖数
1 mountainview 20
2 oxgbix 8
3 sarkozy 8
4 powershadow 6
5 jysteel 5
6 angryfist 5
7 goodbug 5
8 crazyman 3
9 woodfox 3
10 angelmac 3
11 typical 3
12 lczlcz 2
13 mastercup 2
14 digua 2
15 south 1
16 forchildren 1
17 hairi 1
18 nonantum 1
19 ecross 1
20 michelin 1
21 bitleo 1
22 eric
【在 x******n 的大作中提到】 : 那是你试验的时候夜还不够深
|
kx 发帖数: 16384 | 86 你到他那个帖子存档里去找找看啊
【在 r****y 的大作中提到】 : 统计数据有点问题 : 比如9-10月围棋版 : 排名 ID 帖数 : 1 mountainview 20 : 2 oxgbix 8 : 3 sarkozy 8 : 4 powershadow 6 : 5 jysteel 5 : 6 angryfist 5 : 7 goodbug 5
|
r****y 发帖数: 26819 | 87 不是说,每天半夜时分都存档吗?
【在 kx 的大作中提到】 : 你到他那个帖子存档里去找找看啊
|
m*********g 发帖数: 11102 | 88 存档和统计是两回事
【在 r****y 的大作中提到】 : 不是说,每天半夜时分都存档吗?
|
x******n 发帖数: 9057 | 89 确实有,因为前段时间迁移数据,10天左右没有更新,现在还在追赶,先下的大版,小
版还要往后排,估计1,2天之内可以跟上。
本来我打算在本版先测试几天,没想到这么快就火了。。
【在 r****y 的大作中提到】 : 统计数据有点问题 : 比如9-10月围棋版 : 排名 ID 帖数 : 1 mountainview 20 : 2 oxgbix 8 : 3 sarkozy 8 : 4 powershadow 6 : 5 jysteel 5 : 6 angryfist 5 : 7 goodbug 5
|
x******n 发帖数: 9057 | 90 这个倒是即时的,纯粹是这次因为一下落下了10几天的进度,所以需要几天时间来赶。
【在 m*********g 的大作中提到】 : 存档和统计是两回事
|
|
|
m*********g 发帖数: 11102 | 91 我给你做了一个版的广告。 其他有多少版面是你自己做的广告?
【在 x******n 的大作中提到】 : 确实有,因为前段时间迁移数据,10天左右没有更新,现在还在追赶,先下的大版,小 : 版还要往后排,估计1,2天之内可以跟上。 : 本来我打算在本版先测试几天,没想到这么快就火了。。
|
r****y 发帖数: 26819 | 92 赶紧放点页面广告
【在 x******n 的大作中提到】 : 确实有,因为前段时间迁移数据,10天左右没有更新,现在还在追赶,先下的大版,小 : 版还要往后排,估计1,2天之内可以跟上。 : 本来我打算在本版先测试几天,没想到这么快就火了。。
|
m*********g 发帖数: 11102 | 93 一天点击率多少?
【在 x******n 的大作中提到】 : 确实有,因为前段时间迁移数据,10天左右没有更新,现在还在追赶,先下的大版,小 : 版还要往后排,估计1,2天之内可以跟上。 : 本来我打算在本版先测试几天,没想到这么快就火了。。
|
x******n 发帖数: 9057 | 94 我一个也没做
【在 m*********g 的大作中提到】 : 我给你做了一个版的广告。 其他有多少版面是你自己做的广告?
|
x******n 发帖数: 9057 | 95 昨天300访问5000Page View
【在 m*********g 的大作中提到】 : 一天点击率多少?
|
m*********g 发帖数: 11102 | 96 pageview是什么意思
【在 x******n 的大作中提到】 : 昨天300访问5000Page View
|
x******n 发帖数: 9057 | 97 意思就是有300个人访问,总共点击了5000个页面
【在 m*********g 的大作中提到】 : pageview是什么意思
|
kx 发帖数: 16384 | 98 记录访问的ip了没有
哈哈
【在 x******n 的大作中提到】 : 意思就是有300个人访问,总共点击了5000个页面
|
A*******e 发帖数: 12486 | 99 当然
【在 kx 的大作中提到】 : 记录访问的ip了没有 : 哈哈
|
x******n 发帖数: 9057 | 100 木有。。
【在 kx 的大作中提到】 : 记录访问的ip了没有 : 哈哈
|
|
|
d*****9 发帖数: 3459 | 101 webhosting co有记录。存下来就好了。
【在 x******n 的大作中提到】 : 木有。。
|
x******n 发帖数: 9057 | 102 这倒是。。
【在 d*****9 的大作中提到】 : webhosting co有记录。存下来就好了。
|
kx 发帖数: 16384 | 103 给你想了一个用途
各版可以根据你的统计数据来发放灌水奖金
嘿嘿
【在 x******n 的大作中提到】 : 这倒是。。
|
l*r 发帖数: 79569 | 104 我打算贿赂一下楼主。。。
【在 kx 的大作中提到】 : 给你想了一个用途 : 各版可以根据你的统计数据来发放灌水奖金 : 嘿嘿
|
b*****l 发帖数: 9499 | 105 访问记录可以用来进一步确认马甲。穿梭的很多,用代理的应该不多吧。
【在 x******n 的大作中提到】 : 这倒是。。
|
x******n 发帖数: 9057 | 106 但是我是做学术研究,用这种做法近似作弊。。
【在 b*****l 的大作中提到】 : 访问记录可以用来进一步确认马甲。穿梭的很多,用代理的应该不多吧。
|
b*****l 发帖数: 9499 | 107 nnd,你们业界比我们学界还矫情。。。
【在 x******n 的大作中提到】 : 但是我是做学术研究,用这种做法近似作弊。。
|
x******n 发帖数: 9057 | 108 hahaha,其实我是想偷懒
【在 b*****l 的大作中提到】 : nnd,你们业界比我们学界还矫情。。。
|
i**l 发帖数: 4224 | 109 提个建议 能不能搞一个版面忠诚度排名
以在某特定版本发帖数量/全站总发帖数量 将所有id从高往低排
【在 x******n 的大作中提到】 : 准备1-2周之内把它搞出来。 : 之所以不确定是1周还是2周是因为我要把数据移到不同的地方,需要重新上传和重建索 : 引,因为数据量比较大(1350万贴so far),不确定这个过程需要多久。
|
x******n 发帖数: 9057 | 110 可能最高的都是偶尔发一两贴的,所以还需要更精细的算法。
【在 i**l 的大作中提到】 : 提个建议 能不能搞一个版面忠诚度排名 : 以在某特定版本发帖数量/全站总发帖数量 将所有id从高往低排
|
|
|
kx 发帖数: 16384 | 111 要多精细的算法啊
设个最低发贴数不就得了
你们啊
太技术,sometimes那义务
【在 x******n 的大作中提到】 : 可能最高的都是偶尔发一两贴的,所以还需要更精细的算法。
|
x******n 发帖数: 9057 | 112 设多少?
【在 kx 的大作中提到】 : 要多精细的算法啊 : 设个最低发贴数不就得了 : 你们啊 : 太技术,sometimes那义务
|
kx 发帖数: 16384 | 113 那还不是随便你
你按照排下来的具体情况调整好了
或者发贴数排名前百分之多少的才参加排名
【在 x******n 的大作中提到】 : 设多少?
|
x******n 发帖数: 9057 | 114 按帖数算有的版发贴多,有的版少,不好定统一标准
按发帖百分比算有的版灌水的人多,有的版少,不好定统一标准
【在 kx 的大作中提到】 : 那还不是随便你 : 你按照排下来的具体情况调整好了 : 或者发贴数排名前百分之多少的才参加排名
|
kx 发帖数: 16384 | 115 你跟我原来一个毛病
太追求精确
这样很多事做起来就麻烦了
【在 x******n 的大作中提到】 : 按帖数算有的版发贴多,有的版少,不好定统一标准 : 按发帖百分比算有的版灌水的人多,有的版少,不好定统一标准
|
x******n 发帖数: 9057 | 116 你说说容易,真做起来就得考虑细节了。
【在 kx 的大作中提到】 : 你跟我原来一个毛病 : 太追求精确 : 这样很多事做起来就麻烦了
|
x******n 发帖数: 9057 | 117 这样吧,在水枪排名后面加一栏 忠诚度(排名) 仅供参考,如何?这样实现也容易,不
用添加新的辅助表/索引,而且我估计大家感兴趣的也就是灌水最多的几个名id的数据。
【在 i**l 的大作中提到】 : 提个建议 能不能搞一个版面忠诚度排名 : 以在某特定版本发帖数量/全站总发帖数量 将所有id从高往低排
|
l**i 发帖数: 8245 | 118 嗯 不错 谢谢~~
据。
【在 x******n 的大作中提到】 : 这样吧,在水枪排名后面加一栏 忠诚度(排名) 仅供参考,如何?这样实现也容易,不 : 用添加新的辅助表/索引,而且我估计大家感兴趣的也就是灌水最多的几个名id的数据。
|
l*****9 发帖数: 2009 | 119 哈哈,这个太强了,不过,发现自己的马甲没有被搜出来,心满意足地离开 |
g*******1 发帖数: 8758 | 120 在别的版看到有人提这个,心想这不是毛人的项目吗,一考古果然是
【在 x******n 的大作中提到】 : 完工。 : http://www.weiming.info : 多提意见,恩。
|
|
|
kx 发帖数: 16384 | 121 你的反射弧还真够长的
这都过去多少年了
【在 g*******1 的大作中提到】 : 在别的版看到有人提这个,心想这不是毛人的项目吗,一考古果然是
|
m*********g 发帖数: 11102 | 122 股市反射弧
【在 kx 的大作中提到】 : 你的反射弧还真够长的 : 这都过去多少年了
|