V****e 发帖数: 858 | 1 我在用SSN从小到大排序然后据此在另一组data set找到相关信息。SSN都是这样排的:
000-00-0000.共400多了。
不知道为什么排到170多个后,SSN自己开始另一组排起来,从小到大的。不能和上面
170多个接起来排,比如前170个:012-00-354,112-34-578,etc.都排得很好。但到
170多后突然从013-01-355自己排起来,也是从下到大。用sort后也不能跟在012-00-
354后。导致这些后排起来的SSN在另一个data set里找不到相关数据,尽管另一个data
set有同样的SSN.
我试着把SSN变成普通number,还是不能正常排序。不知道有什么办法还是问题出在哪里。
写这么多不知写清楚没?谢谢!! |
w**p 发帖数: 4080 | |
V****e 发帖数: 858 | 3 谢谢。我试了。那170多个可以把破折号去掉,但170后的就不可以,- 还留在那儿没变
化。我现在手动。好在不多,只有两百多。好像手动以后可以正常排序了。我再试试。
【在 w**p 的大作中提到】 : 试试去掉里面的破折号。
|
m***c 发帖数: 118 | |
w**p 发帖数: 4080 | 5 同样感觉是某些数据有空格或者其他乱七八糟的字符,虽然你肉眼看不见。 |
t*****w 发帖数: 254 | 6 1. as.numeric(gsub("-", "", "social_security"))
2. sort |
V****e 发帖数: 858 | 7 谢谢,问题解决了。
【在 t*****w 的大作中提到】 : 1. as.numeric(gsub("-", "", "social_security")) : 2. sort
|