由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - Text Mining question, Please help
相关主题
SAS Text MinerSas enterprise miner是干什么的?
Have anyone used WEKA?请问有人用过SAS Text Mining吗?
谈谈找夏天实习的经历【请教】关于Text mining
请教做 Health Insurance Claim Data Mining 的大牛如何入门的问题Text datamining 是用Perl好还是Python好?
请问SAS 里能run SVM吗?统计SAS大侠请看一下这个图。谢谢了先。
SAS for Windows 7 64-bit[合集] 关于SAS certificate 在找工作中的作用
打算考SAS ENTERPRISE MINER,不知道有啥好的教材which procedure in SAS for neural network?
该让公司买什么软件contract job in bank - $35 per hour without benefits
相关话题的讨论汇总
话题: text话题: mining话题: sas话题: caratclean
进入Statistics版参与讨论
1 (共1页)
K***a
发帖数: 72
1
In the data sample below, I’m trying to derive the fields (Clarity,
ColorAltClean, CaratClean, etc) from the Description field above it, the
description is for diamond product.
We have SAS Enterprise Miner, but don’t have text miner, is there any good
SAS tool can accomplish this task?
Description
Platinum 1.10ct Round I1 I Sds.32ct Baguettes IGI Cert 31302436
Clarity ColorAltClean CaratClean Shape CertAgent CERTNUMClean

I1 I 1.10 Round IGI 31302436
Y****a
发帖数: 243
2
这跟text mining沾不上边儿吧,顶多算data import from file
SAS里不是有fixed width读数据的方法吗,或者separate by space
实在不行,数据又不大的话,先读到excel里,用空格做分割符,然后再导入SAS
K***a
发帖数: 72
3
谢谢YueJia回复。也许只有用SAS code解决了。本来想试试能不能在text mining领域
找到更简单和更适合长期应用的方法。
d********i
发帖数: 193
4
可以考虑用regular expressions来parse data
K***a
发帖数: 72
5
谢谢端阳。还有其它办法吗?
z******n
发帖数: 397
6
正则表达式最好了,为啥还要其他方法

【在 K***a 的大作中提到】
: 谢谢端阳。还有其它办法吗?
f********1
发帖数: 228
7
不知道整体data的情况,从给的例子猜测,可能是把每个第四行的data用空格做分隔符
读出来。Linux下可以用awk command
http://superuser.com/questions/396536/how-to-keep-only-every-nt
regular expression也是很好的方法
1 (共1页)
进入Statistics版参与讨论
相关主题
contract job in bank - $35 per hour without benefits请问SAS 里能run SVM吗?
Anybody interested in buying these SAS books?SAS for Windows 7 64-bit
有没有搞marketing的正搞数据挖掘?打算考SAS ENTERPRISE MINER,不知道有啥好的教材
问个SAS enterprise的问题该让公司买什么软件
SAS Text MinerSas enterprise miner是干什么的?
Have anyone used WEKA?请问有人用过SAS Text Mining吗?
谈谈找夏天实习的经历【请教】关于Text mining
请教做 Health Insurance Claim Data Mining 的大牛如何入门的问题Text datamining 是用Perl好还是Python好?
相关话题的讨论汇总
话题: text话题: mining话题: sas话题: caratclean