由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 中医就是big data中的“unstructured data”
相关主题
每家多于一套的住房是无效住房,政府无偿收回。这不就是胡一虎节目中的那个小丑
韩国科学家驳天安舰“奇谈怪论”本拉图:也说《孔庆东骂记者底气何来》
老瓦快要完工了 牛鬼蛇神打算做最后一搏我的娜塔莎让我纠结了
TG软弱源于 理科生治国两会就是群丑现眼图
毛轮和老将的亲密关系何时能结束啊王立军确实申请了政治避难
怪事!各种健康中精神健康最重要
季羡林: 党的知识分子政策不容诬蔑方市民奇谈怪论
看来宋鲁郑是自带干粮五毛的偶像了中国办顶级杂志不可取
相关话题的讨论汇总
话题: data话题: noise话题: 中医话题: problem
进入Military版参与讨论
1 (共1页)
e******e
发帖数: 3472
1
中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良
莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不
错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛
弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些,
因为使用noise dominated data是很危险的,很多时候不如不用。
这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一
些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的
规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比
如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured
data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统
计相关性、更有操作性的的理化生实验,建立更好的structure,也就是科学理论体系
w*********m
发帖数: 4740
2
the problem is, not many historical logs kept

【在 e******e 的大作中提到】
: 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良
: 莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不
: 错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛
: 弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些,
: 因为使用noise dominated data是很危险的,很多时候不如不用。
: 这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一
: 些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的
: 规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比
: 如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured
: data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统

e******e
发帖数: 3472
3
no many historical logs kept is due to the un-repeatability of so many 神医
or 神 cases,in which is just the deepest problem of Chinese traditional
medical "science"

【在 w*********m 的大作中提到】
: the problem is, not many historical logs kept
b*******n
发帖数: 5065
4

中医,类似看图炒股。
真正会看的没几个。

【在 e******e 的大作中提到】
: 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良
: 莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不
: 错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛
: 弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些,
: 因为使用noise dominated data是很危险的,很多时候不如不用。
: 这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一
: 些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的
: 规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比
: 如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured
: data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统

x****u
发帖数: 12955
5

Problem with discarding the "noise" is that we don't know what is noise and
what isn't. And unlike database, we can't recover from a backup copy once
the "noise" are discarded.

【在 e******e 的大作中提到】
: 中国传统医学知识积累了几千年,有海量的经验、偏方、疗法和各种奇谈怪论,里面良
: 莠不齐,泥沙俱下。不要期望所有的积累都有用,估计数据里面有5%是有用的信息就不
: 错了,剩下的都是noise,是要果断抛弃的部分。现在有很多中医饭就要跳出来反对抛
: 弃这些noise,也有中医黑要丢掉所有的数据。但总体来说,中医饭的危害更大一些,
: 因为使用noise dominated data是很危险的,很多时候不如不用。
: 这些data不仅noise太多,而且更大的问题是unstructured。目前的中医理论勉强用一
: 些落后的东西把这些东西分类整理,但也只是把数据存起来好检索而已,离发现真正的
: 规律还早着呢。西医出现以后,很快就把中医里面大多数有明显效果的东西吸收了,比
: 如一些特效药的配方。结果剩下一堆混乱的数据没人会分析。要把这些unstructured
: data好好利用起来,就要抛弃落后的数据结构,用更直接的数学因果关系、更明显的统

1 (共1页)
进入Military版参与讨论
相关主题
中国办顶级杂志不可取毛轮和老将的亲密关系何时能结束啊
要正确看待护照和定居权之间的关系怪事!
国内所谓左派都是不成气候,以后还得靠右派来转化成左派季羡林: 党的知识分子政策不容诬蔑
两会就是present 奇谈怪论,补办正事看来宋鲁郑是自带干粮五毛的偶像了
每家多于一套的住房是无效住房,政府无偿收回。这不就是胡一虎节目中的那个小丑
韩国科学家驳天安舰“奇谈怪论”本拉图:也说《孔庆东骂记者底气何来》
老瓦快要完工了 牛鬼蛇神打算做最后一搏我的娜塔莎让我纠结了
TG软弱源于 理科生治国两会就是群丑现眼图
相关话题的讨论汇总
话题: data话题: noise话题: 中医话题: problem