m**********r 发帖数: 122 | 1 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。 |
D***r 发帖数: 7511 | 2 what's the purpose?
Document classification? Topic extraction?
【在 m**********r 的大作中提到】 : 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请 : 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
|
l**********e 发帖数: 336 | 3 这种提取特征的东东,还是要看具体的应用问题背景
【在 m**********r 的大作中提到】 : 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请 : 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
|
m**********r 发帖数: 122 | 4 classification
【在 D***r 的大作中提到】 : what's the purpose? : Document classification? Topic extraction?
|
f*****u 发帖数: 308 | 5 我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指
Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有
的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型,
靠谱么? |
L*****k 发帖数: 327 | 6 其实BoW忽略了的信息太多了~~
【在 f*****u 的大作中提到】 : 我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指 : Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有 : 的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型, : 靠谱么?
|
m**********r 发帖数: 122 | 7 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。 |
D***r 发帖数: 7511 | 8 what's the purpose?
Document classification? Topic extraction?
【在 m**********r 的大作中提到】 : 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请 : 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
|
l**********e 发帖数: 336 | 9 这种提取特征的东东,还是要看具体的应用问题背景
【在 m**********r 的大作中提到】 : 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请 : 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
|
m**********r 发帖数: 122 | 10 classification
【在 D***r 的大作中提到】 : what's the purpose? : Document classification? Topic extraction?
|
f*****u 发帖数: 308 | 11 我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指
Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有
的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型,
靠谱么? |
L*****k 发帖数: 327 | 12 其实BoW忽略了的信息太多了~~
【在 f*****u 的大作中提到】 : 我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指 : Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有 : 的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型, : 靠谱么?
|
l*******s 发帖数: 1258 | |
d*l 发帖数: 400 | 14 Latent Dirichlet Allocation?
【在 m**********r 的大作中提到】 : 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请 : 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
|