请教一下我的这个问题适合用NoSQL吗？ - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 请教一下我的这个问题适合用NoSQL吗？

相关主题
● 请大牛来谈谈对Solr的看法	● 一个技术问题
● StackOverflow的架构	● 请教下本地搜索
● 怎么做个文件的 index, 比如archive 这样的	● load一个巨大的k-v table到一个view里，有搜索功能怎么设计？
● 与其无意义的争论，不如干点实事	● solr vs elastic
● 如何智能化合并数据库中属于相关objects的各种属性到一个object下？	● 搜索系统设计
● 连续变化的地理位置的query	● 有没支持million concurrent queries per second的数据系统SQL/NoSQL
● autocomplete实现方法请教	● 搜索 lucene 之类是不是不流行了？
● top 10% on StackOverflow this year!	● 鄙视芒果的被打脸了

相关话题的讨论汇总
话题: nosql话题: key话题: docs话题: doc话题: 问题

进入Programming版参与讨论

1

(共1页)

n******7 发帖数: 12463	1 没用过NoSQL，现在遇到两个问题，都需要储存、查询大量的大数据，考虑是不是可以用上NoSQL 问题大概是这样的，我有很多docs，每个doc有很多words，很多words出现频率很高， words在一个doc里面出现顺序不重要。docs本身有一些注释我希望有个database可以 1. 存储这些docs。我琢磨做成 word1 -> {doc1:count,doc2:count2} 这样的 2. 存储一个新doc时，可以update已有的key-> value 列表。如果遇到新的word，就建立新的key-> value 关联 3. 比较docs。这个比较麻烦。比如给一个doc，我想很快知道哪些docs跟它有一样的 key。如果有必要，我还想查询substring。比如有个文档有mitbbs这个词，可能我想把 mit和bbs这两个key也包括进来我本来觉得用SQL应该可以搞定，但是这两个问题里面，可能的词汇表都很大（>10^9）。问题1稍好点，文档之间很多高频词是差不多的，问题2词汇表更大，文档之间的关联更弱。这个用NoSQL有戏吗？看了一下Redis，好像就是个只有两个column的table？
x*******1 发帖数: 28835	2 有戏阿。 3个colume就行 hash_key doc_id:word range_key word attribute appear # 再建一个GSI （searching index） hash——key word range－key doc_id:word appear ＃
g*****g 发帖数: 34805	3 Elastic Search. 【在 n******7 的大作中提到】 : 没用过NoSQL，现在遇到两个问题，都需要储存、查询大量的大数据，考虑是不是可以 : 用上NoSQL : 问题大概是这样的，我有很多docs，每个doc有很多words，很多words出现频率很高， : words在一个doc里面出现顺序不重要。docs本身有一些注释 : 我希望有个database可以 : 1. 存储这些docs。我琢磨做成 word1 -> {doc1:count,doc2:count2} 这样的 : 2. 存储一个新doc时，可以update已有的key-> value 列表。如果遇到新的word，就建 : 立新的key-> value 关联 : 3. 比较docs。这个比较麻烦。比如给一个doc，我想很快知道哪些docs跟它有一样的 : key。如果有必要，我还想查询substring。比如有个文档有mitbbs这个词，可能我想把
n******7 发帖数: 12463	4 谢谢两位，我再琢磨一下 elastic search不知道是啥，得google了
B*****g 发帖数: 34098	5 和solr比有啥优势吗？【在 g*****g 的大作中提到】 : Elastic Search.

1

(共1页)

进入Programming版参与讨论

相关主题
● 鄙视芒果的被打脸了	● 如何智能化合并数据库中属于相关objects的各种属性到一个object下？
● 感觉vert.x的设计很一般呀	● 连续变化的地理位置的query
● 最牛逼的NOSQL，Mongo，Redis	● autocomplete实现方法请教
● Hazelcast: 有 Cluster 模式的 MemoryDB on JVM	● top 10% on StackOverflow this year!
● 请大牛来谈谈对Solr的看法	● 一个技术问题
● StackOverflow的架构	● 请教下本地搜索
● 怎么做个文件的 index, 比如archive 这样的	● load一个巨大的k-v table到一个view里，有搜索功能怎么设计？
● 与其无意义的争论，不如干点实事	● solr vs elastic

相关话题的讨论汇总
话题: nosql话题: key话题: docs话题: doc话题: 问题

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)