|
|
|
|
|
|
D**s 发帖数: 6361 | 1 【 以下文字转载自 Military 讨论区 】
发信人: Lishu008 (梨树请吃鸡), 信区: Military
标 题: 阿三再立新功:20%的基因论文因excel出错
发信站: BBS 未名空间站 (Thu Sep 1 07:25:19 2016, 美东)
一项新研究发现,Excel默认格式设置要为约20%的基因领域科研论文的错误背锅。
研究者们发现这些错误源自Excel会自动把基因名称纠正为日期或者数字,这些错误很
难被修正,而且因为无法永久性停用这一功能,很多科学家们在发表论文之前干脆就忘
记手动修改它们。
“Excel在在默认设置中会把基因名称转化为日期和浮点数值,”来自澳洲的研究团队
解释说。
“我们用程序扫描了主要基因组学期刊,发现约五分之一的论文所补充的Excel基因组
表单中都有基因名称转化错误。”
团队扫描了2005到2015年间发表于19份不同期刊上的3597份论文的35175张Excel表单。
通过一个可以识别基因名称错误的专门程序,他们发现有704份论文存在错误。
团队解释说:“煮个栗子,名为SEPT2和MARCH1的基因就会被Excel自动纠正为‘2-Sep
’和‘1-Mar’。此外,Excel还会自动将RIKEN标识符转化为浮点数字(比如将‘
2310009E13’变成‘2.31E+13’)…在最近发表的论文里,我们发现了更多基因符号被
转化成日期的现象(比如‘SEPT2’变成了‘2006/09/02’).”
雪上加霜的是,如果研究者想要点击“撤消”自动格式,它就会修改这个日期的格式,
而不是改回原来的基因名称。
正如《华盛顿邮报》的Christopher Ingraham解释说,如果研究者杨瑶输入“MARCH1”
,Excel会改成“1-MAR”。如果研究者点击“撤消”,它就会变成“42430”,因为这
就是Excel内部储存日期的方式。
20%的基因论文出现错误:Excel的锅
唯一想要避免这类错误的方法就是在输入前设置表单中每一列的格式。
研究者们希望这份报告可提高大家对该问题的意识,从而更多科学家会知道他们的研究
成果会因为一个简单的程序错误而打折扣。
所以最佳解决方式就是微软推出一个补丁,但是我们都知道微软是不靠谱的。所以研究
者们在格式问题上还是要保持高度警觉。
20%的基因论文出现错误:Excel的锅
该研究已经发表在Genome Biology上。 | j*********g 发帖数: 463 | | h*****6 发帖数: 90 | 3 微软是印度公司
【在 j*********g 的大作中提到】 : 这个很有意思。 : 不过为什么说是印度人搞的?
| v*******e 发帖数: 11604 | | g*********r 发帖数: 281 | 5 这个难道不是bioinfo的常识吗?谁会用excel处理数据。 | j*********g 发帖数: 463 | 6 发表的文章,补充数据都是excel表格。
[在 gentletiger (gentletiger) 的大作中提到:]
:这个难道不是bioinfo的常识吗?谁会用excel处理数据。 | n******g 发帖数: 2201 | 7 你太幼稚了,大老板只会excel
【在 g*********r 的大作中提到】 : 这个难道不是bioinfo的常识吗?谁会用excel处理数据。
|
|
|
|
|
|
|