e******e 发帖数: 3472 | 1 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良
莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不
错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛
弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些,
因为使用noise dominated data是很危险的,很多时候不如不用。
这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一
些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的
规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比
如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured
data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统
计相关性、更有操作性的的理化生实验,建立更好的structure,也就是科学理论体系
。 |
w*********m 发帖数: 4740 | 2 the problem is, not many historical logs kept
【在 e******e 的大作中提到】 : 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良 : 莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不 : 错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛 : 弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些, : 因为使用noise dominated data是很危险的,很多时候不如不用。 : 这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一 : 些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的 : 规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比 : 如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured : data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统
|
e******e 发帖数: 3472 | 3 no many historical logs kept is due to the un-repeatability of so many 神医
or 神 cases,in which is just the deepest problem of Chinese traditional
medical "science"
【在 w*********m 的大作中提到】 : the problem is, not many historical logs kept
|
b*******n 发帖数: 5065 | 4
中医,类似看图炒股。
真正会看的没几个。
【在 e******e 的大作中提到】 : 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良 : 莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不 : 错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛 : 弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些, : 因为使用noise dominated data是很危险的,很多时候不如不用。 : 这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一 : 些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的 : 规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比 : 如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured : data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统
|
x****u 发帖数: 12955 | 5
Problem with discarding the "noise" is that we don't know what is noise and
what isn't. And unlike database, we can't recover from a backup copy once
the "noise" are discarded.
【在 e******e 的大作中提到】 : 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良 : 莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不 : 错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛 : 弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些, : 因为使用noise dominated data是很危险的,很多时候不如不用。 : 这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一 : 些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的 : 规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比 : 如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured : data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统
|