由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
StartUp版 - 问个特种搜索引擎的问题
相关主题
诚问: 本地机器上的java based文件搜索如何卖钱?So how to install Lucene?
http://blekko.com/需要做一个大型SNS网站,请报价
问一个专业领域的搜索引擎构建问题网站的推广(欢迎补充)
想搭一个搜索引擎,哪种open source的crawler最好? (转载)请大家帮忙想个名字,有包子
SEO 就那么有用吗?域名里有个dash '-'有什么不好吗?
百度为何能打败中国其他的搜索引擎公司?看到一个visitor居然用iphone5 OS
诚恳、严肃寻报价-购物网站大家都是怎么做网站推广和SEO的呢?
Nutch vs Lucene诚请seo marketing的高手来帮忙
相关话题的讨论汇总
话题: 搜索话题: google话题: 搜索引擎话题: 论坛话题: business
进入StartUp版参与讨论
1 (共1页)
b******y
发帖数: 9224
1
如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
,一般是想搜索哪些论坛呢?
g*******a
发帖数: 31586
2
GOOGLE不是有嵌入了吗 一些论坛就在用GOOGLE自身来搜他自个论坛的东西呀?
b******y
发帖数: 9224
3
Google的搜索太烂,没有按照日期排序。如果不注重日期,也就无所谓了。但我的搜索
可以搜出来最新的帖子。有兴趣的话,我可以做个demo给大家看.
g*******a
发帖数: 31586
4

是吗 您要发财咯

【在 b******y 的大作中提到】
: Google的搜索太烂,没有按照日期排序。如果不注重日期,也就无所谓了。但我的搜索
: 可以搜出来最新的帖子。有兴趣的话,我可以做个demo给大家看.

b******y
发帖数: 9224
5

怎么讲?没想怎么赚钱,给点高见?多谢

【在 g*******a 的大作中提到】
:
: 是吗 您要发财咯

C***x
发帖数: 468
6
Stocks, forex, and investing.

【在 b******y 的大作中提到】
: 如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
: ,一般是想搜索哪些论坛呢?

a***a
发帖数: 552
7
真的假的? 你不是做市场营销的高手吗? 没有从这上面闻到钱味? 鼻子太不敏感
了些。
另外你那个如何做 Google 收索排名第一的帖子, 题目很吸引人,实际上骗人的吧?
因为今天碰巧有需要, 收索了 好几个关键词, 像美国华人, 美国华人生活, 美国
生活, 美国资讯 等等很多关键字, 都是你那个网站的主题或者相关内容, 但是
google 的结果, 你的宝贝不要说第一名, 连第一页上贵网站连毛都没有啊!
建议老兄回家好好做好自己的本业再出来卖。 要不然让人觉得就是骗人
华而不实

【在 b******y 的大作中提到】
:
: 怎么讲?没想怎么赚钱,给点高见?多谢

b******y
发帖数: 9224
8
你真逗。我啥时候说过我是市场营销高手了??
b******y
发帖数: 9224
9

多谢! stock, investing sounds interesting, will check them out.

【在 C***x 的大作中提到】
: Stocks, forex, and investing.
b******y
发帖数: 9224
10


没做过seo的,请别妄加评论。我的网站有不少关键字都排在Google首页,甚至是第一
名,您没看见,就不要不懂装懂的去评论。
剑知网的流量,有很多是从搜索引擎来的,如果排名不好的话,有可能搜索引擎还给送
流量吗? 这里就给大家看看我的traffic stats:
http://www.jiansnet.com/about/advertise_with_us.html
话说有些人就是这样,自己都不知道怎么做SEO, 也没有啥成功的business呢,还经常
点评人家的不是。您如果那么大牛的话,您做个网站出来我们看看?您能够坚持6年做
个网站,我给您包子。
说句不好听的,您这就是小人之心度君子之腹. Google排名的文章,是我回馈创业同仁
写的,不是用来赚钱的, 我特意没做Seo. 而且我是将来准备放在member area的。您是
不是别乱猜测,好不好?
另外,感谢您,让我得到个文章的灵感。我可以在我的网站写一篇文章,谈谈如何对待
Internet trolls,flame和Internet bully的办法。这样大家碰到这种情况,也知道如
何处理,谢谢了先。
创业,我不愿意去没事挑事的教训人家,但我不得不说的是,不要没成功先坏了人品。
这样的无端诽谤人家,您好意思吗?大家都是明眼人,您如果继续这么做,故意贬低创
业同仁,将来的结果就是没有人会和您这样的人合作。请您珍惜您的人品,好吗? 无论
对您的business和career都有很大的好处的。

【在 a***a 的大作中提到】
: 真的假的? 你不是做市场营销的高手吗? 没有从这上面闻到钱味? 鼻子太不敏感
: 了些。
: 另外你那个如何做 Google 收索排名第一的帖子, 题目很吸引人,实际上骗人的吧?
: 因为今天碰巧有需要, 收索了 好几个关键词, 像美国华人, 美国华人生活, 美国
: 生活, 美国资讯 等等很多关键字, 都是你那个网站的主题或者相关内容, 但是
: google 的结果, 你的宝贝不要说第一名, 连第一页上贵网站连毛都没有啊!
: 建议老兄回家好好做好自己的本业再出来卖。 要不然让人觉得就是骗人
: 华而不实

相关主题
百度为何能打败中国其他的搜索引擎公司?So how to install Lucene?
诚恳、严肃寻报价-购物网站需要做一个大型SNS网站,请报价
Nutch vs Lucene网站的推广(欢迎补充)
进入StartUp版参与讨论
a*****4
发帖数: 342
11
别理那个脑子给驴踢过的二货。

【在 b******y 的大作中提到】
:
: ?
: 没做过seo的,请别妄加评论。我的网站有不少关键字都排在Google首页,甚至是第一
: 名,您没看见,就不要不懂装懂的去评论。
: 剑知网的流量,有很多是从搜索引擎来的,如果排名不好的话,有可能搜索引擎还给送
: 流量吗? 这里就给大家看看我的traffic stats:
: http://www.jiansnet.com/about/advertise_with_us.html
: 话说有些人就是这样,自己都不知道怎么做SEO, 也没有啥成功的business呢,还经常
: 点评人家的不是。您如果那么大牛的话,您做个网站出来我们看看?您能够坚持6年做
: 个网站,我给您包子。

b******y
发帖数: 9224
12

Thank you!

【在 a*****4 的大作中提到】
: 别理那个脑子给驴踢过的二货。
g*******a
发帖数: 31586
13
接到活就有钱了呀
肯定会有需要的人

【在 b******y 的大作中提到】
:
: Thank you!

b******y
发帖数: 9224
14

多谢鼓励。你别说,没有大家的鼓励和"某些人"的奚落,我还也许就放弃做网站了。所
以我倒是要好好谢谢那些动不动就拍砖头的人。对于这些持negative观点的人,我想说
的是,我这站点做定了。你不愿意看,没关系,有的是人愿意看的。
世界上虽然有那种出于各种心理嘲笑别人,贬低别人的人,但世界上从来不缺好人,而
且我觉得,这个世界上好人还是多得多。
既然经常被人砸,那么好吧,我就贡献一下我创业的感想. 中心思想就是,远离那些
naysayer, 坚持你的道路,enjoy你的journey.
***
不管是美国人还是中国人,很多人都喜欢和别人比。比谁挣的钱多,比谁有地位,比学
历,比老子,比小孩。。。最后就会失去focus. 生活觉得累,总有不如意。 下面就写
写如何保持良好心态的方法。
1. 专注做自己喜欢做的事情(keeping a focus on one's passion)
如果专注做自己喜欢的事情,就不会觉得郁闷。另外,也不会这山望着那山高。我的一
个好方法就是,每天都有个清单(list), 每天必须先完成这个list上面需要做的事情。
这样就可以keep自己的focus. 不至于说看到人家做了什么,自己就会浮躁。
2. 听音乐(listen to the music)
听一些自己喜欢的音乐,可以缓解压力。我喜欢听的音乐很多,有古典钢琴曲,有rock
n roll music, 也有抒情曲.
3. 做冥想(meditation)
平常可以静坐一下,啥事情都不想的做meditation.
4. 走路锻炼身体(just keep walking)
每天如果走1万米下来,身体会很fit. 人也有精神。可以培养乐观情绪。(我走路有3年
多,每天2-5 miles, 感觉极佳)
5. 避免做自己不喜欢做的事情
这个看似显而易见,而且很容易做到。但实际操作当中,却是非常难。人不是生活在真
空中的,周围都是亲朋好友的,所以,难免受到别人的影响。人家的一个评论,一句话
,都可能使我们对所做的事情三思。
比如说,有人开始的时候卖自己写的ebook卖的很好。可后来听人家说,应该卖书(
printed version). 于是就盲从了朋友的劝说,找了Lulu.com(自助印刷出版)去印刷。
结果,第一批书印出来后,发现少图片。跟Lulu.com理论,2个星期后,Lulu再次将印
刷的书送来了。结果又发现图片是有了,但是是黑白的, sigh. 再次和Lulu交涉后,对
方才将正确印刷好的书准备好。但这个时候,距离用户下订单已经有1个多月了。导致
很多用户等不及而退款等等。
所以,自己不熟悉的领域,冒然进入后,就会有很多的frustration, 就不会happy. 这
个在business或者career上都一样。
6. 远离带负面情绪的人
这也包括理念和自己不同的人。俗话说,物以类聚人以群分。你不可能让世界上每个人
都喜欢你。所以,最最重要的一点就是要多接触有相同理想的人;而避免接触泼冷水,
总是带负面情绪的人。环境对人的影响很大的,仔细选择环境,选择和什么样的人结交
朋友,对个人的身心健康是非常有影响的。要想保持心情愉快,就要远离说你坏话或者
对你说No的人.
7. 少看媒体的各种非打即杀的新闻
很多新闻媒体为了吸引眼球,总是大量的投放各种耸人听闻的新闻。当然,很多新闻确
实是属实的,但看过多的负面新闻,会让人觉得社会阴暗,平凡人总是受欺负。而其实
,世界上好人是很多的,只不过是媒体没有报道罢了。
8. 无债一身轻
运营一个良好的business, 需要减少cost, 增加盈利。而个人生活也一样。债务缠身的
结果就是人会非常焦虑。当年华夏硅谷创始人陈春先被讨债的追得到处躲避,最后创业
未成,却早早离开了人世。如果过于奢侈,花销大大超出预算,最终人的心态会失衡,
对身心很不利。所以,一定要避免债务,所谓无债一身轻.
***
以上转载自美国剑知实用网, 特别贡献给各位做business的朋友
http://www.jiansnet.com/topic/26180/How-To-Keep-A-Positive-Mind

【在 g*******a 的大作中提到】
: 接到活就有钱了呀
: 肯定会有需要的人

g*******a
发帖数: 31586
15
呵呵 做什么
都会有人说的
b******y
发帖数: 9224
16

没错。对待这种人,我原先也就忍了。但问题是,架不住总是一而再,再而三的有这种
风凉话。所以,我考虑如果再碰到这种情况,要到站方去举报PA了.

【在 g*******a 的大作中提到】
: 呵呵 做什么
: 都会有人说的

c******2
发帖数: 4019
17

和日常生活相关的,WSN最爱知道二手车出了问题,怎么修,太多了,我会用,你做吧

【在 b******y 的大作中提到】
: 如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
: ,一般是想搜索哪些论坛呢?

b******y
发帖数: 9224
18

多谢鼓励,这次我就是不挣钱,也要做出来。攒rp了.

【在 c******2 的大作中提到】
:
: 和日常生活相关的,WSN最爱知道二手车出了问题,怎么修,太多了,我会用,你做吧

d****i
发帖数: 4809
19
赞态度和大度!

【在 b******y 的大作中提到】
:
: 多谢鼓励,这次我就是不挣钱,也要做出来。攒rp了.

d****i
发帖数: 4809
20
网上林子大了什么鸟都有,这个bbs也不例外,just ignore it.

【在 b******y 的大作中提到】
:
: 多谢鼓励,这次我就是不挣钱,也要做出来。攒rp了.

相关主题
请大家帮忙想个名字,有包子大家都是怎么做网站推广和SEO的呢?
域名里有个dash '-'有什么不好吗?诚请seo marketing的高手来帮忙
看到一个visitor居然用iphone5 OS广告公司创业
进入StartUp版参与讨论
b******y
发帖数: 9224
21
特种搜索的demo做出来啦,感兴趣看的同学请站内联系。
b******y
发帖数: 9224
22
如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
,一般是想搜索哪些论坛呢?
g*******a
发帖数: 31586
23
GOOGLE不是有嵌入了吗 一些论坛就在用GOOGLE自身来搜他自个论坛的东西呀?
b******y
发帖数: 9224
24
Google的搜索太烂,没有按照日期排序。如果不注重日期,也就无所谓了。但我的搜索
可以搜出来最新的帖子。有兴趣的话,我可以做个demo给大家看.
g*******a
发帖数: 31586
25

是吗 您要发财咯

【在 b******y 的大作中提到】
: Google的搜索太烂,没有按照日期排序。如果不注重日期,也就无所谓了。但我的搜索
: 可以搜出来最新的帖子。有兴趣的话,我可以做个demo给大家看.

b******y
发帖数: 9224
26

怎么讲?没想怎么赚钱,给点高见?多谢

【在 g*******a 的大作中提到】
:
: 是吗 您要发财咯

C***x
发帖数: 468
27
Stocks, forex, and investing.

【在 b******y 的大作中提到】
: 如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
: ,一般是想搜索哪些论坛呢?

a***a
发帖数: 552
28
真的假的? 你不是做市场营销的高手吗? 没有从这上面闻到钱味? 鼻子太不敏感
了些。
另外你那个如何做 Google 收索排名第一的帖子, 题目很吸引人,实际上骗人的吧?
因为今天碰巧有需要, 收索了 好几个关键词, 像美国华人, 美国华人生活, 美国
生活, 美国资讯 等等很多关键字, 都是你那个网站的主题或者相关内容, 但是
google 的结果, 你的宝贝不要说第一名, 连第一页上贵网站连毛都没有啊!
建议老兄回家好好做好自己的本业再出来卖。 要不然让人觉得就是骗人
华而不实

【在 b******y 的大作中提到】
:
: 怎么讲?没想怎么赚钱,给点高见?多谢

b******y
发帖数: 9224
29
你真逗。我啥时候说过我是市场营销高手了??
b******y
发帖数: 9224
30

多谢! stock, investing sounds interesting, will check them out.

【在 C***x 的大作中提到】
: Stocks, forex, and investing.
相关主题
如何做个让国内SEO 好的网站?http://blekko.com/
百度成为无线搜索老大问一个专业领域的搜索引擎构建问题
诚问: 本地机器上的java based文件搜索如何卖钱?想搭一个搜索引擎,哪种open source的crawler最好? (转载)
进入StartUp版参与讨论
b******y
发帖数: 9224
31


没做过seo的,请别妄加评论。我的网站有不少关键字都排在Google首页,甚至是第一
名,您没看见,就不要不懂装懂的去评论。
剑知网的流量,有很多是从搜索引擎来的,如果排名不好的话,有可能搜索引擎还给送
流量吗? 这里就给大家看看我的traffic stats:
http://www.jiansnet.com/about/advertise_with_us.html
话说有些人就是这样,自己都不知道怎么做SEO, 也没有啥成功的business呢,还经常
点评人家的不是。您如果那么大牛的话,您做个网站出来我们看看?您能够坚持6年做
个网站,我给您包子。
说句不好听的,您这就是小人之心度君子之腹. Google排名的文章,是我回馈创业同仁
写的,不是用来赚钱的, 我特意没做Seo. 而且我是将来准备放在member area的。您是
不是别乱猜测,好不好?
另外,感谢您,让我得到个文章的灵感。我可以在我的网站写一篇文章,谈谈如何对待
Internet trolls,flame和Internet bully的办法。这样大家碰到这种情况,也知道如
何处理,谢谢了先。
创业,我不愿意去没事挑事的教训人家,但我不得不说的是,不要没成功先坏了人品。
这样的无端诽谤人家,您好意思吗?大家都是明眼人,您如果继续这么做,故意贬低创
业同仁,将来的结果就是没有人会和您这样的人合作。请您珍惜您的人品,好吗? 无论
对您的business和career都有很大的好处的。

【在 a***a 的大作中提到】
: 真的假的? 你不是做市场营销的高手吗? 没有从这上面闻到钱味? 鼻子太不敏感
: 了些。
: 另外你那个如何做 Google 收索排名第一的帖子, 题目很吸引人,实际上骗人的吧?
: 因为今天碰巧有需要, 收索了 好几个关键词, 像美国华人, 美国华人生活, 美国
: 生活, 美国资讯 等等很多关键字, 都是你那个网站的主题或者相关内容, 但是
: google 的结果, 你的宝贝不要说第一名, 连第一页上贵网站连毛都没有啊!
: 建议老兄回家好好做好自己的本业再出来卖。 要不然让人觉得就是骗人
: 华而不实

a*****4
发帖数: 342
32
别理那个脑子给驴踢过的二货。

【在 b******y 的大作中提到】
:
: ?
: 没做过seo的,请别妄加评论。我的网站有不少关键字都排在Google首页,甚至是第一
: 名,您没看见,就不要不懂装懂的去评论。
: 剑知网的流量,有很多是从搜索引擎来的,如果排名不好的话,有可能搜索引擎还给送
: 流量吗? 这里就给大家看看我的traffic stats:
: http://www.jiansnet.com/about/advertise_with_us.html
: 话说有些人就是这样,自己都不知道怎么做SEO, 也没有啥成功的business呢,还经常
: 点评人家的不是。您如果那么大牛的话,您做个网站出来我们看看?您能够坚持6年做
: 个网站,我给您包子。

b******y
发帖数: 9224
33

Thank you!

【在 a*****4 的大作中提到】
: 别理那个脑子给驴踢过的二货。
g*******a
发帖数: 31586
34
接到活就有钱了呀
肯定会有需要的人

【在 b******y 的大作中提到】
:
: Thank you!

b******y
发帖数: 9224
35

多谢鼓励。你别说,没有大家的鼓励和"某些人"的奚落,我还也许就放弃做网站了。所
以我倒是要好好谢谢那些动不动就拍砖头的人。对于这些持negative观点的人,我想说
的是,我这站点做定了。你不愿意看,没关系,有的是人愿意看的。
世界上虽然有那种出于各种心理嘲笑别人,贬低别人的人,但世界上从来不缺好人,而
且我觉得,这个世界上好人还是多得多。
既然经常被人砸,那么好吧,我就贡献一下我创业的感想. 中心思想就是,远离那些
naysayer, 坚持你的道路,enjoy你的journey.
***
不管是美国人还是中国人,很多人都喜欢和别人比。比谁挣的钱多,比谁有地位,比学
历,比老子,比小孩。。。最后就会失去focus. 生活觉得累,总有不如意。 下面就写
写如何保持良好心态的方法。
1. 专注做自己喜欢做的事情(keeping a focus on one's passion)
如果专注做自己喜欢的事情,就不会觉得郁闷。另外,也不会这山望着那山高。我的一
个好方法就是,每天都有个清单(list), 每天必须先完成这个list上面需要做的事情。
这样就可以keep自己的focus. 不至于说看到人家做了什么,自己就会浮躁。
2. 听音乐(listen to the music)
听一些自己喜欢的音乐,可以缓解压力。我喜欢听的音乐很多,有古典钢琴曲,有rock
n roll music, 也有抒情曲.
3. 做冥想(meditation)
平常可以静坐一下,啥事情都不想的做meditation.
4. 走路锻炼身体(just keep walking)
每天如果走1万米下来,身体会很fit. 人也有精神。可以培养乐观情绪。(我走路有3年
多,每天2-5 miles, 感觉极佳)
5. 避免做自己不喜欢做的事情
这个看似显而易见,而且很容易做到。但实际操作当中,却是非常难。人不是生活在真
空中的,周围都是亲朋好友的,所以,难免受到别人的影响。人家的一个评论,一句话
,都可能使我们对所做的事情三思。
比如说,有人开始的时候卖自己写的ebook卖的很好。可后来听人家说,应该卖书(
printed version). 于是就盲从了朋友的劝说,找了Lulu.com(自助印刷出版)去印刷。
结果,第一批书印出来后,发现少图片。跟Lulu.com理论,2个星期后,Lulu再次将印
刷的书送来了。结果又发现图片是有了,但是是黑白的, sigh. 再次和Lulu交涉后,对
方才将正确印刷好的书准备好。但这个时候,距离用户下订单已经有1个多月了。导致
很多用户等不及而退款等等。
所以,自己不熟悉的领域,冒然进入后,就会有很多的frustration, 就不会happy. 这
个在business或者career上都一样。
6. 远离带负面情绪的人
这也包括理念和自己不同的人。俗话说,物以类聚人以群分。你不可能让世界上每个人
都喜欢你。所以,最最重要的一点就是要多接触有相同理想的人;而避免接触泼冷水,
总是带负面情绪的人。环境对人的影响很大的,仔细选择环境,选择和什么样的人结交
朋友,对个人的身心健康是非常有影响的。要想保持心情愉快,就要远离说你坏话或者
对你说No的人.
7. 少看媒体的各种非打即杀的新闻
很多新闻媒体为了吸引眼球,总是大量的投放各种耸人听闻的新闻。当然,很多新闻确
实是属实的,但看过多的负面新闻,会让人觉得社会阴暗,平凡人总是受欺负。而其实
,世界上好人是很多的,只不过是媒体没有报道罢了。
8. 无债一身轻
运营一个良好的business, 需要减少cost, 增加盈利。而个人生活也一样。债务缠身的
结果就是人会非常焦虑。当年华夏硅谷创始人陈春先被讨债的追得到处躲避,最后创业
未成,却早早离开了人世。如果过于奢侈,花销大大超出预算,最终人的心态会失衡,
对身心很不利。所以,一定要避免债务,所谓无债一身轻.
***
以上转载自美国剑知实用网, 特别贡献给各位做business的朋友
http://www.jiansnet.com/topic/26180/How-To-Keep-A-Positive-Mind

【在 g*******a 的大作中提到】
: 接到活就有钱了呀
: 肯定会有需要的人

g*******a
发帖数: 31586
36
呵呵 做什么
都会有人说的
b******y
发帖数: 9224
37

没错。对待这种人,我原先也就忍了。但问题是,架不住总是一而再,再而三的有这种
风凉话。所以,我考虑如果再碰到这种情况,要到站方去举报PA了.

【在 g*******a 的大作中提到】
: 呵呵 做什么
: 都会有人说的

c******2
发帖数: 4019
38

和日常生活相关的,WSN最爱知道二手车出了问题,怎么修,太多了,我会用,你做吧

【在 b******y 的大作中提到】
: 如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
: ,一般是想搜索哪些论坛呢?

b******y
发帖数: 9224
39

多谢鼓励,这次我就是不挣钱,也要做出来。攒rp了.

【在 c******2 的大作中提到】
:
: 和日常生活相关的,WSN最爱知道二手车出了问题,怎么修,太多了,我会用,你做吧

d****i
发帖数: 4809
40
赞态度和大度!

【在 b******y 的大作中提到】
:
: 多谢鼓励,这次我就是不挣钱,也要做出来。攒rp了.

相关主题
想搭一个搜索引擎,哪种open source的crawler最好? (转载)诚恳、严肃寻报价-购物网站
SEO 就那么有用吗?Nutch vs Lucene
百度为何能打败中国其他的搜索引擎公司?So how to install Lucene?
进入StartUp版参与讨论
d****i
发帖数: 4809
41
网上林子大了什么鸟都有,这个bbs也不例外,just ignore it.

【在 b******y 的大作中提到】
:
: 多谢鼓励,这次我就是不挣钱,也要做出来。攒rp了.

b******y
发帖数: 9224
42
特种搜索的demo做出来啦,感兴趣看的同学请站内联系。
b******y
发帖数: 9224
43
旅游搜索也上线了,感兴趣的童鞋请看:
http://www.jiansnet.com/search?q=%E6%97%85%E6%B8%B8&type=travel
还有很多需要精研的地方,会进一步改进。欢迎提建议,意见。
b******y
发帖数: 9224
44
移民搜索也已经上线了,这个是个sample search result:
http://www.jiansnet.com/search?q=green+card&type=immigration
至此,基本上特种搜索告一段落了。下面准备精耕细作,进一步优化搜索的算法以便提
供更好的用户体验。
b******y
发帖数: 9224
45

车版也可以搜索了,这个是二手车的讨论:
http://www.jiansnet.com/search?q=%E4%BA%8C%E6%89%8B%E8%BD%A6&ty

【在 c******2 的大作中提到】
:
: 和日常生活相关的,WSN最爱知道二手车出了问题,怎么修,太多了,我会用,你做吧

s*****x
发帖数: 119
46
对于搜索引擎,如果关键词比如:绿卡,Green card,Greencard都不能在系统内理解
为同一搜索的话,类似sql的关键词搜索的话,用户体验还是无法达到产生黏度的标准
,和论坛本身的关键词搜索没什么差别。

【在 b******y 的大作中提到】
: 移民搜索也已经上线了,这个是个sample search result:
: http://www.jiansnet.com/search?q=green+card&type=immigration
: 至此,基本上特种搜索告一段落了。下面准备精耕细作,进一步优化搜索的算法以便提
: 供更好的用户体验。

b******y
发帖数: 9224
47

你的问题问的很好。我研究搜索引擎技术多年了,这些都是一些常见的用户问题了。
首先,我要说的是,技术是永无止境的(其实,business也一样). 特别是搜索技术来说
,不可能100%做到类似人工查询那样的。
技术和市场、business,需要找个平衡点。如果我有风险投资,是一个玩儿法,没有风
险投资,又是一个玩儿法。所以,有些技术问题,并不是不能解决的,但我们需要在现
有的人力物力的情况下做。
具体到你说的这个吧。bbs自己的sql搜索,是有很大局限性的。下面列举一下:
1) sql query, 用户不能自如的搜索。这个用户体验来说,剑知网的搜索引擎就要好的
多。
2) bbs的搜索,你最多只能输入2个单词做boolean search,而不能够输入多个单词。
比如,你如何搜索这个: "海龟 回国 绿卡"?
而这个,我们可以搜索出来, 请看结果:
http://www.jiansnet.com/search?q=%E6%B5%B7%E9%BE%9F+%E5%9B%9E%E
3) bbs的搜索结果是按照帖子来的,而我们的搜索是按照网页来的。用户看的时候,一
目了然,很简洁。
4) bbs的搜索结果没有高亮显示,而剑知网的搜索结果是高亮匹配的显示关键字的。
5) bbs的搜索,用户需要输入关键字,日期啥的。还不够累的。我们的搜索结果,基本
是按照日期排序的。省事而且省时间。
6) 最后,这个是最最重要的一点了。我们的目标不是搜索一个论坛。是要给用户查找
相关信息的。比如说,我们也有可能包括文学城论坛的。甚至其他一些相关论坛的信息
或者网站的信息。

【在 s*****x 的大作中提到】
: 对于搜索引擎,如果关键词比如:绿卡,Green card,Greencard都不能在系统内理解
: 为同一搜索的话,类似sql的关键词搜索的话,用户体验还是无法达到产生黏度的标准
: ,和论坛本身的关键词搜索没什么差别。

s*****x
发帖数: 119
48
其实,你说的这些BBS搜索所短缺的技术,比如关键词高亮,2个关键词限制,排序,只
要BBS想,他们很快就能改过来,他们现在只是懒得弄,或者不想增加服务器负载,不
见得弄不了。还要提防他们会阻止你的服务器爬去内容,这也是个风险,
对于没有资金没有大规模开发能力,确实是个问题,有时候可以用Lucene这些开源的现
成引擎来提高效率。
论坛搜索引擎这个东西在05年那时候,360的前身,也就是还叫qihoo的时候,风头正劲
,这也是为什么360到现在还叫奇虎360的原因,qihoo试图在做中文论坛搜索引擎,做
中文论坛推荐引擎,之后不了了之,还是因为用户的需求并不是那么的大,体验做的也
不好,后来都被百度压死。360转型免费杀毒解决用户安全刚需,才有了今天。
其实qihoo的模式并没死,今年风起云涌的个性化推荐引擎和网站层出不穷,比如国内
的头条网,今日头条,都是类似的网站内容推荐系统,当然背后的算法需要投入心思,
但还是拼个用户体验,建议参考一下。
其实business就是很残酷的一个东西,你无法让用户因为理解,而来使用你的产品,他
们只会用脚投票。很钦佩你在创业中的持续努力,上面只是作为用户的简单意见和看法。

【在 b******y 的大作中提到】
:
: 你的问题问的很好。我研究搜索引擎技术多年了,这些都是一些常见的用户问题了。
: 首先,我要说的是,技术是永无止境的(其实,business也一样). 特别是搜索技术来说
: ,不可能100%做到类似人工查询那样的。
: 技术和市场、business,需要找个平衡点。如果我有风险投资,是一个玩儿法,没有风
: 险投资,又是一个玩儿法。所以,有些技术问题,并不是不能解决的,但我们需要在现
: 有的人力物力的情况下做。
: 具体到你说的这个吧。bbs自己的sql搜索,是有很大局限性的。下面列举一下:
: 1) sql query, 用户不能自如的搜索。这个用户体验来说,剑知网的搜索引擎就要好的
: 多。

b******y
发帖数: 9224
49

你说的我都特别关注过。qihoo是齐向东做的,后来被周鸿祎注资,成了周董。奇虎当
时是做的不错了,还有啥经验口袋之类的功能。号称智能机器人,来解答问题等。
但我研究也分析过了,他们有很大的问题。就是没有独特到足以替代百度或者谷歌的地
方。
个性化搜索,推荐引擎,这些说的花里胡哨的,但我看来,其实说句不好听的,都是扯
淡。(pardon my French ;-)) 还有啥今日头条,等等,那些都是锦上添花的东东。
奇虎的问题是,business的foundation就错了。所以,如果根基有问题的话,其他一切
一切的努力,都是白搭了。这个,周鸿祎自己也分析过。感兴趣的可以网上去看看他写
的文章。
有的时候,是费力不讨好的。这个是技术人员经常犯的通病。这个,我也写过一篇文章:
JC的计算机程序员创业实践经验谈
http://www.jiansnet.com/topic/25718/JC-Tech-Startup-Experience-
你说的是确实是,business是很残酷的。所以才有马云说的,"今天很残酷,明天更残
酷,后天会很美好,但绝大多数人都死在明天晚上了". 让我们共勉马总的语录吧,哈
哈。
Anyway, 我个人是爱好搜索技术的,也花了很多时间精力实践。我的出发点是,我不知
道未来会怎样,但我知道的是,只要做自己喜欢做的事情,也就是,follow your
passion, 总会成功的。版上有很多人不信这个,没关系,每个人做business的出发点
不同,理念也不同,都可以保持了。但我就已经看见我成功的那一天了 ;-)

【在 s*****x 的大作中提到】
: 其实,你说的这些BBS搜索所短缺的技术,比如关键词高亮,2个关键词限制,排序,只
: 要BBS想,他们很快就能改过来,他们现在只是懒得弄,或者不想增加服务器负载,不
: 见得弄不了。还要提防他们会阻止你的服务器爬去内容,这也是个风险,
: 对于没有资金没有大规模开发能力,确实是个问题,有时候可以用Lucene这些开源的现
: 成引擎来提高效率。
: 论坛搜索引擎这个东西在05年那时候,360的前身,也就是还叫qihoo的时候,风头正劲
: ,这也是为什么360到现在还叫奇虎360的原因,qihoo试图在做中文论坛搜索引擎,做
: 中文论坛推荐引擎,之后不了了之,还是因为用户的需求并不是那么的大,体验做的也
: 不好,后来都被百度压死。360转型免费杀毒解决用户安全刚需,才有了今天。
: 其实qihoo的模式并没死,今年风起云涌的个性化推荐引擎和网站层出不穷,比如国内

z*****i
发帖数: 366
50
我觉得你做搜索的方向应该变一下。个人认为目前的搜索已经是死胡同了。B/G在做改
变,但是还是很初级。
以前的搜索模式都是一个:用户输入 --》返回搜索结果。所谓的“搜索结果”,就是
“信息”。这个年代,信息是不值钱的。为什么这么说?举个例子:你搜APPL的股价,
任何一个引擎都会告诉你。不仅是当时的,还有历史的。值钱吗?一文不值。
值钱的是什么?是“知识”。“知识”和“信息”是两回事。还是上面那个例子:你搜
APPL的股价,返回的除了价格外,如果还有走势预估(先假设这个预估是比较准确的)
,立刻这个搜索结果就值钱了。再来个例子,你搜当前某条高速的TRAFFIC,一个引擎
给你当前状态,另外一个除了这个信息,还告诉你这个路段一般什么时候比较拥挤,你
说哪个引擎值钱呢?
如果你能在这方面下下功夫,前途是很光明的。
btw, 我很不喜欢BIG DATA这种纯粹是为了圈钱而造的名词。

章:

【在 b******y 的大作中提到】
:
: 你说的我都特别关注过。qihoo是齐向东做的,后来被周鸿祎注资,成了周董。奇虎当
: 时是做的不错了,还有啥经验口袋之类的功能。号称智能机器人,来解答问题等。
: 但我研究也分析过了,他们有很大的问题。就是没有独特到足以替代百度或者谷歌的地
: 方。
: 个性化搜索,推荐引擎,这些说的花里胡哨的,但我看来,其实说句不好听的,都是扯
: 淡。(pardon my French ;-)) 还有啥今日头条,等等,那些都是锦上添花的东东。
: 奇虎的问题是,business的foundation就错了。所以,如果根基有问题的话,其他一切
: 一切的努力,都是白搭了。这个,周鸿祎自己也分析过。感兴趣的可以网上去看看他写
: 的文章。

相关主题
需要做一个大型SNS网站,请报价域名里有个dash '-'有什么不好吗?
网站的推广(欢迎补充)看到一个visitor居然用iphone5 OS
请大家帮忙想个名字,有包子大家都是怎么做网站推广和SEO的呢?
进入StartUp版参与讨论
b******y
发帖数: 9224
51

好的,多谢分析。确实是啊,Google最近已经向提供知识发展了,比如说各种的card等
,都是知识,而不是简单的网页搜索结果。其他各家也都跟进。
现在搜索引擎下一步的发展,各家都在探索。但我看基本上都是想着structured data
前进了。这样帮助搜素引擎领会内容的意义。这样下去,基本上从文本分析又回到了数
据库结构化数据上了。所谓分久必合合久必分吧。计算机领域发展就是这样子。

【在 z*****i 的大作中提到】
: 我觉得你做搜索的方向应该变一下。个人认为目前的搜索已经是死胡同了。B/G在做改
: 变,但是还是很初级。
: 以前的搜索模式都是一个:用户输入 --》返回搜索结果。所谓的“搜索结果”,就是
: “信息”。这个年代,信息是不值钱的。为什么这么说?举个例子:你搜APPL的股价,
: 任何一个引擎都会告诉你。不仅是当时的,还有历史的。值钱吗?一文不值。
: 值钱的是什么?是“知识”。“知识”和“信息”是两回事。还是上面那个例子:你搜
: APPL的股价,返回的除了价格外,如果还有走势预估(先假设这个预估是比较准确的)
: ,立刻这个搜索结果就值钱了。再来个例子,你搜当前某条高速的TRAFFIC,一个引擎
: 给你当前状态,另外一个除了这个信息,还告诉你这个路段一般什么时候比较拥挤,你
: 说哪个引擎值钱呢?

e****9
发帖数: 316
52
这个和solr/lucene比有什么特殊的地方吗?
b******y
发帖数: 9224
53

我自己编写的类似lucene的搜索library. 不同之处是,lucene 处理中文的能力远远不
行。还有就是,自己写的东西,好调整, memory, performance啥的。
基本上,这个相当于自己发明的搜索算法了。当然,功劳在于lucene了。是受了他家的
启发。
solr只不过是个wrapper而已,不是啥computer science challenging的东东。要说
challenging的,还是lucene,有点儿算法啥的。
如果继续讨论这个,版上很多人都看不懂了。不行只能去programming版去了。

【在 e****9 的大作中提到】
: 这个和solr/lucene比有什么特殊的地方吗?
e****9
发帖数: 316
54
solr是个wrapper完全同意,但是好处就是包装到http
至于中文分词,现在也有几个开源的方案.
感觉是做最底层,是会有成就感,但是已经有那么多现成的方案为什么不用哪?至少大家
都用稳定性上要很好多,而且有很多人一起推动,新feature会加的比较快。
其实主要不是要Challenge你的产品,主要是觉得产品要更外应用上靠,好的底层不一
定是好的产品。
我最近也在考虑一些类似的东西,有机会可以多交流交流。
b******y
发帖数: 9224
55

好的,可以交流。现在基本上搜索技术没啥新东西了,要么硬件更新,比如量子计算机
,要么模式更新,比如结构化文件,schema, 否则是死水一潭了。
但这不代表挣钱是死水一潭。如何把商业和技术结合起来,是我关注的一大重点。
Computer science里有很多可以用来挣钱的地方,需要进一步精研。

【在 e****9 的大作中提到】
: solr是个wrapper完全同意,但是好处就是包装到http
: 至于中文分词,现在也有几个开源的方案.
: 感觉是做最底层,是会有成就感,但是已经有那么多现成的方案为什么不用哪?至少大家
: 都用稳定性上要很好多,而且有很多人一起推动,新feature会加的比较快。
: 其实主要不是要Challenge你的产品,主要是觉得产品要更外应用上靠,好的底层不一
: 定是好的产品。
: 我最近也在考虑一些类似的东西,有机会可以多交流交流。

e****9
发帖数: 316
56
这个和solr/lucene比有什么特殊的地方吗?
b******y
发帖数: 9224
57

不是上面已经回复了吗。solr/lucene, 处理中文,那就是小学生时代。不是我鄙视他
们,是这些老外做的东西,他们不懂中文。
其次,这些东西越做越复杂。而市场并不一定需要复杂的东西。

【在 e****9 的大作中提到】
: 这个和solr/lucene比有什么特殊的地方吗?
w*****e
发帖数: 748
58
中科院计算所的分词系统已经包含在lucene里面了,这个不算是老外的东西。不过同意
你的观点,特种搜索还是有很大赚钱空间。底层技术还不可能理解语义方面的东西,而
语义方面的算法研究还是太粗浅,尤其是中文语义。不过这方面很多相关技术,比如专
门分析stackoverflow里面的问题,还有谁是哪方面的大牛等等。

【在 b******y 的大作中提到】
:
: 不是上面已经回复了吗。solr/lucene, 处理中文,那就是小学生时代。不是我鄙视他
: 们,是这些老外做的东西,他们不懂中文。
: 其次,这些东西越做越复杂。而市场并不一定需要复杂的东西。

b******y
发帖数: 9224
59

是的,最早分词就是中科院的那套c/c++程序。后来,搜狗,百度等等,都有了自己的
算法。好像天津还有个啥海量分词的公司,靠这个赚钱。
Anyway, 搜索这东西算是个feature吧,可以搞一搞,但要说花多大精力,这个我也不
敢说。因为毕竟我是做business, 不是做科学研究。看情况吧。。。

【在 w*****e 的大作中提到】
: 中科院计算所的分词系统已经包含在lucene里面了,这个不算是老外的东西。不过同意
: 你的观点,特种搜索还是有很大赚钱空间。底层技术还不可能理解语义方面的东西,而
: 语义方面的算法研究还是太粗浅,尤其是中文语义。不过这方面很多相关技术,比如专
: 门分析stackoverflow里面的问题,还有谁是哪方面的大牛等等。

S********f
发帖数: 36
60
有没有考虑过非文字(比如基于图像或视频)的搜索?
当然这个难度比较大,可以从特定的应用领域开始。

【在 b******y 的大作中提到】
:
: 是的,最早分词就是中科院的那套c/c++程序。后来,搜狗,百度等等,都有了自己的
: 算法。好像天津还有个啥海量分词的公司,靠这个赚钱。
: Anyway, 搜索这东西算是个feature吧,可以搞一搞,但要说花多大精力,这个我也不
: 敢说。因为毕竟我是做business, 不是做科学研究。看情况吧。。。

相关主题
诚请seo marketing的高手来帮忙百度成为无线搜索老大
广告公司创业诚问: 本地机器上的java based文件搜索如何卖钱?
如何做个让国内SEO 好的网站?http://blekko.com/
进入StartUp版参与讨论
b******y
发帖数: 9224
61

图像搜索是个单独的领域了,估计是提取特征值,然后看相关度。和文本的搜索有很大
不同。感觉确实难度不小。我对computer vision一点不懂,所以做不了这个了。另外
,从当前的应用看,貌似就是在特定领域里图像识别不错,比如查罪犯用的人脸识别啥
的。不熟不做,其实小公司能够把文字搜索做好,也相当不错了。都不容易。

【在 S********f 的大作中提到】
: 有没有考虑过非文字(比如基于图像或视频)的搜索?
: 当然这个难度比较大,可以从特定的应用领域开始。

g******n
发帖数: 27
62
网站做得挺有想法,流量也不错,鼓励一下!这个小方向挣点广告费可以,做不大。建
议你练练手,这个大方向有很多机会。
有几点疑问
你的主页为什么没有做基本的SEO?
流量似乎在2013年3月前后达到顶点?后来呢?
爬虫也是自己写的么?多久能把mitbbs的新帖过一遍?
现在能覆盖多少论坛?需要针对每家优化爬虫么?
l******0
发帖数: 244
63
论坛里面的数据,当然很有用,如果能做好,肯定有商业价值。看看这个公司,
boardreader.com, 它靠卖数据赚钱。
但论坛搜索有个很大的挑战,就是论坛里一个 thread 里提到的主题,比如有人在谈论
ipad, 通常只在开始第一个帖子里,甚至这个 thread 的标题里出现。随后的跟帖,
多数都围绕它展开,但是并不具体提到这个词。 后面的内容虽然很多,但关键词搜索
却搜索不到它,因为后面的讨论都没有明确提到它,因为这个主题在上下文里,是清楚
的。
所以数据量可以很大,但是从搜索的角度来看,很多数据确实无法使用的。搜索引擎评
价里的两个指标,precision and recall, recall 会很低。

【在 b******y 的大作中提到】
: 如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
: ,一般是想搜索哪些论坛呢?

b******y
发帖数: 9224
64

多谢,你的问题回答如下:
1. 主页为什么没有做基本的SEO?
这个不清楚你具体指的是什么,有些seo还没有精力做。有些觉得不一定有效。毕竟跟
着G走,还不如让G跟着你走。
2. 流量似乎在2013年3月前后达到顶点?后来呢?
流量有所下降,后来有所上升。
3. 爬虫也是自己写的么?多久能把mitbbs的新帖过一遍?
除了linux操作系统和java我不能写以外, 其他都是自己写的。至于多久,这个目前小
于一个小时。但可以达到秒杀。
4. 现在能覆盖多少论坛?需要针对每家优化爬虫么?
没有覆盖多少论坛,也就是为买提做点贡献。其他的如果想做,当然需要对每家优化,
可做的太多了。但取决于business的要求了。

【在 g******n 的大作中提到】
: 网站做得挺有想法,流量也不错,鼓励一下!这个小方向挣点广告费可以,做不大。建
: 议你练练手,这个大方向有很多机会。
: 有几点疑问
: 你的主页为什么没有做基本的SEO?
: 流量似乎在2013年3月前后达到顶点?后来呢?
: 爬虫也是自己写的么?多久能把mitbbs的新帖过一遍?
: 现在能覆盖多少论坛?需要针对每家优化爬虫么?

b******y
发帖数: 9224
65

看来你是研究informational retrieval的了,行家一看就是有木有,哈哈。
boardreader啥的,我都研究过了。至于他家的经营,我不好comment, 但我不认可他家
的模式。
论坛搜索时有挑战的,这个我已经前面说了。国内的奇虎就是个例子。感兴趣可以研究
过往的情况。这里不便一一表述。
Anyway, 我做搜索引擎,是我多年research的爱好的继续,以及对互联网的研究的继续
。有些不太涉及如何有效做business的,另外,也不一定就涉及特别的computer
science research了,所以,不要拿我这个去做任何的比较了。
可以这么说吧,我就是有这个passion, 喜欢programming. 很多事情我也不清楚了,我
相信passion会lead到一个好的结果。很多人不一定认同这个,无所谓了。

【在 l******0 的大作中提到】
: 论坛里面的数据,当然很有用,如果能做好,肯定有商业价值。看看这个公司,
: boardreader.com, 它靠卖数据赚钱。
: 但论坛搜索有个很大的挑战,就是论坛里一个 thread 里提到的主题,比如有人在谈论
: ipad, 通常只在开始第一个帖子里,甚至这个 thread 的标题里出现。随后的跟帖,
: 多数都围绕它展开,但是并不具体提到这个词。 后面的内容虽然很多,但关键词搜索
: 却搜索不到它,因为后面的讨论都没有明确提到它,因为这个主题在上下文里,是清楚
: 的。
: 所以数据量可以很大,但是从搜索的角度来看,很多数据确实无法使用的。搜索引擎评
: 价里的两个指标,precision and recall, recall 会很低。

l******0
发帖数: 244
66
搜索引擎本身,可以说真的没太多搞的空间。尤其是当 lucene 提供了大多数的基本搜
索功能和应用后。当然,跟信息检索相关的技术,如果扩展下去,比如有位同学提到的
,如何知道 green card, 绿卡是同一样东西,可搞的东西就很多,但那已经超出了搜
索引擎的范畴。
其实,如何从网络上获得并组织好数据,也是个很大的挑战。比如,上面提到的,如果
你要扩展到网络上的所有论坛,如何去爬这些论坛,就不是一件容易的事。如果做一个
股票的网站,如何把网络上所出现的,与这个股票及其公司相关的新闻,消息全部抓取
过来,也不是一件容易的事。

【在 b******y 的大作中提到】
:
: 看来你是研究informational retrieval的了,行家一看就是有木有,哈哈。
: boardreader啥的,我都研究过了。至于他家的经营,我不好comment, 但我不认可他家
: 的模式。
: 论坛搜索时有挑战的,这个我已经前面说了。国内的奇虎就是个例子。感兴趣可以研究
: 过往的情况。这里不便一一表述。
: Anyway, 我做搜索引擎,是我多年research的爱好的继续,以及对互联网的研究的继续
: 。有些不太涉及如何有效做business的,另外,也不一定就涉及特别的computer
: science research了,所以,不要拿我这个去做任何的比较了。
: 可以这么说吧,我就是有这个passion, 喜欢programming. 很多事情我也不清楚了,我

b******y
发帖数: 9224
67

是的,分析的很好。但我的出发点是这个: 我不想做啥 freaking science research
project. 我的想法很简单,就是我关注感兴趣的领域,我能走多远,就走多远。有点
另类了,不过没啥其他复杂的想法了。

【在 l******0 的大作中提到】
: 搜索引擎本身,可以说真的没太多搞的空间。尤其是当 lucene 提供了大多数的基本搜
: 索功能和应用后。当然,跟信息检索相关的技术,如果扩展下去,比如有位同学提到的
: ,如何知道 green card, 绿卡是同一样东西,可搞的东西就很多,但那已经超出了搜
: 索引擎的范畴。
: 其实,如何从网络上获得并组织好数据,也是个很大的挑战。比如,上面提到的,如果
: 你要扩展到网络上的所有论坛,如何去爬这些论坛,就不是一件容易的事。如果做一个
: 股票的网站,如何把网络上所出现的,与这个股票及其公司相关的新闻,消息全部抓取
: 过来,也不是一件容易的事。

a********c
发帖数: 462
68
没有日期排序?
搞笑

【在 b******y 的大作中提到】
: Google的搜索太烂,没有按照日期排序。如果不注重日期,也就无所谓了。但我的搜索
: 可以搜出来最新的帖子。有兴趣的话,我可以做个demo给大家看.

b******y
发帖数: 9224
69

先生,没有按照日期排序,和没有日期排序,是两码事儿。搞笑??搞清楚没?
你上google上搜索一下试试看,有时候陈年老帖的在前面。当然,你要是较真儿,那我
也没话可说了。反正喜欢用的人还是喜欢用的,不喜欢的人,你再怎么说,也没用。无
所谓了,这个我见多了,不新鲜。

【在 a********c 的大作中提到】
: 没有日期排序?
: 搞笑

b******y
发帖数: 9224
70
话说bbs就这德行,我就等着有人来砸呢,砸的越欢,哥儿越高兴
相关主题
http://blekko.com/SEO 就那么有用吗?
问一个专业领域的搜索引擎构建问题百度为何能打败中国其他的搜索引擎公司?
想搭一个搜索引擎,哪种open source的crawler最好? (转载)诚恳、严肃寻报价-购物网站
进入StartUp版参与讨论
z*****i
发帖数: 366
71
"如果做一个
股票的网站,如何把网络上所出现的,与这个股票及其公司相关的新闻,消息全部抓取
过来,也不是一件容易的事。"
竟然有这么巧的事。我今天还在考虑这个问题。对于某支股票FOO,怎么搜集所有跟他
有关的消息?这些消息不一定只是跟公司有关,跟这个行当,法律诉讼,周边环境都有
关系。

【在 l******0 的大作中提到】
: 搜索引擎本身,可以说真的没太多搞的空间。尤其是当 lucene 提供了大多数的基本搜
: 索功能和应用后。当然,跟信息检索相关的技术,如果扩展下去,比如有位同学提到的
: ,如何知道 green card, 绿卡是同一样东西,可搞的东西就很多,但那已经超出了搜
: 索引擎的范畴。
: 其实,如何从网络上获得并组织好数据,也是个很大的挑战。比如,上面提到的,如果
: 你要扩展到网络上的所有论坛,如何去爬这些论坛,就不是一件容易的事。如果做一个
: 股票的网站,如何把网络上所出现的,与这个股票及其公司相关的新闻,消息全部抓取
: 过来,也不是一件容易的事。

z*****i
发帖数: 366
72
图像搜索是走ML的路吧。GOOGLE有个演示,不过我觉得那个只是装B,不能应用的。

【在 b******y 的大作中提到】
: 话说bbs就这德行,我就等着有人来砸呢,砸的越欢,哥儿越高兴
b******y
发帖数: 9224
73

有篇文章,说今年的IT产品的失败的,把google glass也列上去了。不知道是否也是因
为表面光而内里没有啥实用的价值。

【在 z*****i 的大作中提到】
: 图像搜索是走ML的路吧。GOOGLE有个演示,不过我觉得那个只是装B,不能应用的。
z*****i
发帖数: 366
74
我觉得google glass的问题是,装备选错了。自己给自己戴一个枷锁,无意义。在可穿
戴方面,传统行业倒是有先机。

【在 b******y 的大作中提到】
:
: 有篇文章,说今年的IT产品的失败的,把google glass也列上去了。不知道是否也是因
: 为表面光而内里没有啥实用的价值。

g******n
发帖数: 27
75
不需要所有人认同,新的机会本来就不是所有人能看到的。现在很火的所谓大数据,你
做的就是前端,即数据收集+索引。
我做了家Startup,数据收集部分和你的方法类似,搜索索引也是基于lucene。不过我是
针对工业界,海量收集数据,分析数据,反馈企业用户。

【在 b******y 的大作中提到】
:
: 有篇文章,说今年的IT产品的失败的,把google glass也列上去了。不知道是否也是因
: 为表面光而内里没有啥实用的价值。

b******y
发帖数: 9224
76

不错。你说的前端和后端,我觉得其实都是后端了,对于web app来说。因为都是后台
的数据处理。真正的后端,我也做过collaborative filtering的application, 就是类似
Amazon的推荐产品的功能。这个已经在我的客户的production site上用了,效果很好
。也是用的big data processing.
不过,我目前是focus到B2C。看来你是focus到B2B了。各有不同的challenge,有机会
多交流.

【在 g******n 的大作中提到】
: 不需要所有人认同,新的机会本来就不是所有人能看到的。现在很火的所谓大数据,你
: 做的就是前端,即数据收集+索引。
: 我做了家Startup,数据收集部分和你的方法类似,搜索索引也是基于lucene。不过我是
: 针对工业界,海量收集数据,分析数据,反馈企业用户。

g******n
发帖数: 27
77
以后多交流。
对于我来说,数据不在自己手里,不像微博,mitbbs自已有数据,那么数据采集部分就
是前端,这些都是原始数据,还没有加工处理。
还有一点建议,你的网站名字起得实在不好,剑知,不俗不雅的也不容易记。做华人网
站名字要起得够俗易记,比如搜搜,一搜,一淘之类的。。。叫贱贱都比剑知强。。。
b******y
发帖数: 9224
78

多谢。网站名字嘛,这个是历史原因,个人网站发展起来的。现在是肯定不能改的,品
牌已经建立起来了。改的话,就是business的大忌。
将来是否会改?这个要看business的要求。
京东商城也不是一开始就叫jd的,google也不是开始叫google的,记得backrub吗?
奇虎搜索也改过名字了吧。
Anyway, 多研究business strategy, 建议看看三国演义。

【在 g******n 的大作中提到】
: 以后多交流。
: 对于我来说,数据不在自己手里,不像微博,mitbbs自已有数据,那么数据采集部分就
: 是前端,这些都是原始数据,还没有加工处理。
: 还有一点建议,你的网站名字起得实在不好,剑知,不俗不雅的也不容易记。做华人网
: 站名字要起得够俗易记,比如搜搜,一搜,一淘之类的。。。叫贱贱都比剑知强。。。
: 。

b******y
发帖数: 9224
79
另外国内那些个啥搜搜,一搜等等,够土的。这点上,我欣赏百度,好歹是与众不同的。
我就相信passion, 不能因为外界的影响而低级庸俗化。follow 你的passion, 最后才
能有上乘的造化。
c***d
发帖数: 996
80
Interesting.
I see you have passion in search, which is good. However I doubt your
approach will get much real "search" traffic. Google brand name and
distribution channel make it invincible in traditional web search.
Search/information retrieval has come long way. It will be ridiculous to
think google will still represent the state of art for the decade to come.
Search is also very lucrative business. I am glad at least some Chinese are
willing to try.

【在 b******y 的大作中提到】
: 如果我想做个特种搜索引擎,专门搜索某些论坛的内容的话,有人会用吗?如果会的话
: ,一般是想搜索哪些论坛呢?

1 (共1页)
进入StartUp版参与讨论
相关主题
诚请seo marketing的高手来帮忙SEO 就那么有用吗?
广告公司创业百度为何能打败中国其他的搜索引擎公司?
如何做个让国内SEO 好的网站?诚恳、严肃寻报价-购物网站
百度成为无线搜索老大Nutch vs Lucene
诚问: 本地机器上的java based文件搜索如何卖钱?So how to install Lucene?
http://blekko.com/需要做一个大型SNS网站,请报价
问一个专业领域的搜索引擎构建问题网站的推广(欢迎补充)
想搭一个搜索引擎,哪种open source的crawler最好? (转载)请大家帮忙想个名字,有包子
相关话题的讨论汇总
话题: 搜索话题: google话题: 搜索引擎话题: 论坛话题: business