由买买提看人间百态

topics

全部话题 - 话题: atgc
1 (共1页)
m**********2
发帖数: 6568
1
我想说的就是它这个存储方式本身就是一个高阶的信息。我认为它的意义甚至高于ATGC
......这些密码。而我们对此基本一无所知。就好比1850年的时候对ATGC......还一无
所知一样。
T*******x
发帖数: 8565
2
谢谢。一条DNA是一个双螺旋结构吧?大概有多少个ATGC?每个ATGC大概有多少个原子?
j*****r
发帖数: 81
3
来自主题: WaterWorld版 - 请理性对待中医的存在
其实很多疾病在中医眼里根本就不是疾病。不管早期病毒片断是否整合进人体基因
,只要没有引起疾病可以共存为什么要消灭掉它们?中医强调的天人合一,强调的是引
导和调和。中医就是治疗病毒疾病也不是要拿药物杀死病毒,是引导不正常的病毒排出
体外。中医治疗癌症一样是这个道理。你连中医的基本精神都没领会还谈什么治疗?
乙肝病毒携带者没有症状下和正常人没有任何区别。中医在没症状下可以不需治疗
。可是自从西医可以验血诊断病毒携带后,多少人花了冤枉钱去消灭病毒。结果是什么
?西医没有能够杀灭病毒,反而引起病毒变异,于病人是危难中劫财。
不要张口就问我要数据。客观的发表的论文你自己会查文献吧。我说百分百你也不
信不是么?西医治乙肝多少人病毒指标开始看起来下降了,过了一段时间病毒变异了,
西医拿什么治疗?你为什么闭口不谈?这也是西医赚钱的秘密。到时候给病人一句话:
你的病毒变异了,全世界也没医生可以治了。好像这变异于西医治疗没关系一样。没有
西医的抗病毒药,病毒如何这么快变异?你应该知道抗病毒药目前很多是用药物分子模
拟ATGC等片断实现DNA复制的阻断。这不光引起病毒变异,还会导致病... 阅读全帖
t******n
发帖数: 2939
4
来自主题: WaterWorld版 - [合集] 请理性对待中医的存在
☆─────────────────────────────────────☆
junlver (junlver) 于 h 提到:
你去美国书店,不可否认的一点是,医药书架上基本都会有一栏放着非传统治疗书
籍。其中有很多是介绍关于中草药的功能和使用。很多不是照搬照抄的中医古籍翻译本
,是经过加工整理的。看看美国人对中医的态度,那是相当认真的。
西医有个最大的优点就是不管什么,只要有疗效,那就是好的,就是科学的。就是
不科学,那我也要拿出科学的统计数据,让他科学化。不知反对中医的人知道
Echinacea不?这个Echinacea中文名叫紫锥菊,虽然包含china但和中国没啥关系。这
可是欧美很常见的一种花。你家邻居家可能就种了!主要功能不用我说,自己查。我想
说的是,欧美人一样用草药。知道Astragalus么?对的,是黄芪。欧美人很喜欢用这两
个药混在一起用于对抗病毒感冒。中国的烂树根和鲜花可以治感冒!欧美也有秘方治感
冒。别以为感冒只能喝水,那是医生敷衍你。虽然很多疾病可以自愈,但是谁不希望症
状尽快减轻和治愈?要不然西医也没必要研发感冒药了。
中... 阅读全帖
s*********t
发帖数: 600
5
周五所里的beer time,和隔壁实验室的一个中国postdog、一个做bioinformatics的
PhD学生闲聊。
免不了问你是研究神马的。bioinformatics的PhD学生答她做sequencing。
中国postdog说,测序有什么好做的?我们lab的sequencing一般都是在ATGC公司啊,样
品送去两工作日就出结果。
PhD学生一头雾水,只有我知道那个ATGC是我们研究所测克隆的合作公司。
我和那个学生继续谈,她说她做RNA-seq。
postdog好奇地问测序还要怎么做,不是公司都可以测吗。我只好说,你测的是质粒神
马的,和这个不大一样。
话说这postdog是做kinetichore的,也许在他领域用不到deep sequencing。
但是一个postdog,眼界如此狭窄。测序也算近年来生物学的热点技术了,他居然如此
一无所知,毫无insight。
他以后还应该继续做science吗?继续走下去,会走到什么地方?
看着那个33岁刚刚读完PhD,开始做postdog的老中,头发都有些花白了,一周7天,从早到晚,都在实验室里干。
PhD期间发表Journal... 阅读全帖
s******s
发帖数: 13035
6
来自主题: Biology版 - 一个GWAS genotype imputation的问题
我的理解是array-based的genotyping都没法直接出ATGC的genotype, 出来的都是
cluster的AA/AB/BB。这个要变成ATGC,只有用minor allele frequency去猜,但是
maf如果接近0.5,这玩意岂不是错误很多。
就算错了,做gwas估计问题不大。但是imputation的时候,一堆正确的genotype里面
有一堆相反的,用这个数据impute,岂不是错误百出?!还是我理解有问题?
想了一下,也许这些maf接近0.5的也比较集中,另外,就算相反,maf接近0.5的对
imputation提供的information也不多(比maf0.1的少的多了),是不是这个原因
大家都不care了?
t**********t
发帖数: 141
7
来自主题: Biology版 - NGS 是噱头还是?
是的, 我感觉是这样. 不是临床医生不懂, molecular pathologist大部分是md/phd,
但病理报告目前还很少是用NGS做的,
illumina是在push临床采用NGS, 但阻力重重, 我看5年内在community hospital是见不
到NGS, 在大的medical center能用上就已经很好了,
我还是觉的NGS没有什么创新性呀, 就是速度快, 可以产生很多的ATGC出来, 然后需要
很多的bioinformatician去试图interpret, 分析出来的结果有用没用是另外一回事.
纯科研来说, coding sequence目前大部分已经知道, 主要就是non-coding sequence,
当然non-coding sequence占决大多数, 但interpret non-coding sequence并不是单纯
的有越多的ATGC的数据就能怎样的
所以我总觉的NGS是不是吹过头了

发帖数: 1
8
来自主题: Biology版 - 关于biological vs technical replicate
allele: one of a number of alternative forms of the same genetic locus (from
wiki)
人是diploid,所以对于每一个人来说,每一个genetic locus上都有两个allele(XY除
外)。
allele是对于haploid genome来说的,对于人来说称作genotype更合适,例如AA Aa/aA
aa是三种genotype。楼主说的检测不同allele,我的猜测是检测携带homozygous AA/
aa genotype(而非allele)的细胞,因为细胞不可能是单倍体(除生殖细胞)。
SNP不止存在AT和GC变换,可以从ATGC中的任何一个变到ATGC中的任何另一个,有
transition和transversion的区别。
一个allele,可能存在多个snp吗?
这里概念搞错了。SNP是指一个位点上在群体里有不同的allele,比如你带AA,我带Aa
。而allele指的是A或a。
如果你的问题是,一个SNP,可能存在多个allele吗?当然可能,有tri-allelic的SNP
的... 阅读全帖
y***u
发帖数: 7039
9
金微:用常识揭穿方舟子的十大谎言
文/金微
 
方舟子既是打假斗士又是科普作家,无论是打假还是科普,他的一个重要使命是科普转
基因,他十年如一日地通过网络、报纸、书籍、电视、期刊杂志反复向国人宣扬“转基
因无害、对转基因无知而恐慌”。以下系列言论见诸于《中国青年报》等主流大报,这
也是方舟子近年科普转基因的重要平台,借助打假他赢得话语权和正义形象,再操控媒
体推销转基因,通过控制中央级媒体带动地方媒体给全社会洗脑,麻痹国民为转基因食
品上餐桌鸣锣开道。虽然一个中学生都能看得出方舟子的矛盾之处,无数的学者也一而
再再而三地揭穿这些谎言,但是,中国一些媒体却一而再再而三地采信方舟子,将方舟
子当转基因问题的发言人。我们尽量用通俗的话来说说方舟子的转基因言论集,用常识
来解读方舟子的转基因谎言。
 
1,  方舟子:对转基因的恐慌是因为无知,需要科普。
评:农业部机关幼儿园、世博会、亚运会杜绝转基因食品,欧盟对中国转基因大米采取
紧急措施严控进入,方舟子应该先去这些机构或国家好好科普,让他们先淡定不要恐慌。
 
2,  方舟子:普兹泰的小白鼠... 阅读全帖
b*******8
发帖数: 37364
10
直接用化学方法合成生命代价太大
不如DNA编码把ATGC串起来
然后让生物自己根据编码长出来
b*******8
发帖数: 37364
11
属实
要大鸡巴,只需要打开源文件,把鸡巴长度的定义改了即可,然后编译成ATGC
b*******8
发帖数: 37364
12
楼主理工科的思维你还是没看懂。RNA也不是源代码,是一种移植性较强的轻量级可执
行代码。
源代码必然是高度抽象概念性的东西,你可以根据地球环境编辑成ATGC,因为地球有氨
基酸,也可以根据别的星球的不同物质,编译成别的代码。源代码类似Java,可以适应
不同宇宙环境。
b*******8
发帖数: 37364
13
其实研究DNA也可以开脑洞反向进行。不要老盯着DNA反编译,可以正向思维,如果你设
计一个简单的生物,怎么编程?可以从研究病毒开始,研究一段简单的病毒ATGC代码,
我用什么高级语言写成并编译出来,然后积累这样的代码库,慢慢实现复杂功能,等到
能搞单细胞了,就离人不远了。这样的源代码肯定与上帝的不一样,但不要紧,物理等
自然科学里的公式本质上都是这么回事,能解释现象即可,谁也不能保证上帝就是这么
设计的。

发帖数: 1
14
就是为了塞到细胞里

ATGC
T*******x
发帖数: 8565
15
网上找了一个资料:一个DNA有30亿个基对组成长链,总共60亿个基。每个基有一个五
碳糖(15个原子),一个磷酸(4原子),和ATGC中的一个(T有15个原子),组成。所
以一共2000亿个原子。

子?
b*******8
发帖数: 37364
16
来自主题: Military版 - 给我一个鸟嘌呤
ATGC捉对抓奶背操构成DNA
J**S
发帖数: 25790
17
所以,人类用0和1编程;外星人用ATGC编程。
还是外星人聪明啊。

发帖数: 1
18
01编码的是程序逻辑模块
ATGC编码的是蛋白质模块
都是编译后的东西,这么明显连我养猪的都能看明白
C*****5
发帖数: 8812
19
来自主题: ChinaStock版 - 正式进驻本版
不要那么敏感撒。ATGC还加个u太明显了啊
w****a
发帖数: 710
20
来自主题: JobHunting版 - L一个电面题
不是只有4个字母么?ATGC。
那10个字符可能性就一百多万个啊。一个int就能搞定,也没有碰撞的担忧。
或者干脆用20个bit来存10个字符,每走一个,就往左边shift两位,然后或一下新拿到
的字符。
写了一下:
void find_repeated_sequences(const input_stream& in) {
static map table = {{'A', 0},{'T', 1},{'G', 2},{'C', 3}};

int cur_code = 0;
const int STR_SIZE = 10;

auto print_code = [](int code) {
static char inv_table[4] = {'A','T','G','C'};
for(int i = 0; i < STR_SIZE; ++i) {
cout << inv_table[code & 0x3];
code >>= 2;
... 阅读全帖
f****9
发帖数: 506
21
来自主题: JobHunting版 - L店面
1. Binary Tree Upside Down.
2. given a sequence of DNA (ATGC), print all 10-letter sequences that
appears more than once in alphabetical order.
这年头只做两题是不是没戏了,好像大家都做3题。
第一题几分钟就做完了,然后面试官问full binary tree怎么弄,我说不会,后来他说
他把题目看错了。。。
第二题折腾了40分钟,也没让写代码,最后老让我纠结一些没用的东西,比如把hash
value从int换成boolean可以省空间,你以为全世界的人都用java。。。
f****9
发帖数: 506
22
来自主题: JobHunting版 - L店面
都是老题了。
就是输入是一个DNA序列串,由ATGC构成,比如AATTGGCCCAAA...。让你看输入中所有长
度为10的子序列,如果它再之前出现过,就输出。输出要求按照字母排序。
s******d
发帖数: 9806
23
来自主题: JobHunting版 - L店面
key不要存char,存int。 value确实应该是boolean。
DNA只有四个字母,ATGC,这样一个字母用2个bit就能存,10个字母的sequence相当于
20个bit。每次左移两位去掉最老的字母,在最末尾加上新字母的两位,然后乘以
0XFFFFF(取后20位),就是新的key值啦。
y*****e
发帖数: 712
24
来自主题: JobHunting版 - L店面
这个办法好高端,完全被镇住了。。。
我想问问啊,是不是每个key放一个int的地方也就是32bit就够了?
如果一个key出现过,第二次出现的时候把value换成true?
还有就是是不是需要写个小的encoder来encode ATGC,
比如A == 00, C = 01, G = 10, T == 11之类的?
一碰到bit operation就蒙,牛人能写写读sequence到存key这个部分吗
x****u
发帖数: 81
25
来自主题: JobHunting版 - 也来攒下人品,L面经
背景:master,3年,application track
电面:
1) lowest common ancestor; merge intervals
2) find the smallest character that is strictly larger than the search
character; minimal distance between two words
onsite:
1) sum nested list; given a sequence of DNA (ATGC), find the 10-letter
sequence that has the most occurrences
2) technical communication. 介绍一个你最自豪的项目,会穿插问你一些问题
3) maximum points on a line 只做了一个题,开始互相介绍之后,因为对他做的东西
比较感兴趣,我问了他一些问题占用了好些时间。
4) design a web-based hangman game. 两个表情严肃的印度大哥,怎么也逗不笑
5) hos... 阅读全帖
t*******r
发帖数: 22634
26
来自主题: Parenting版 - 先买钢琴还先学琴
明摆着俺的基因的 ATGC 的排列不行,俺娃目前看起来也没啥音乐天分
的可能。您的天分娃的情况不属于俺考虑范围之内。。。
s******s
发帖数: 13035
27
来自主题: Postdoc版 - 毕业论文 多少页合适? (转载)
不用说这种"古人"了. 三十年前没有自动测序仪的时候, 无穷Ph.D.的论文
就是"sequencing of xxx gene", 然后两页介绍和试验方法, 后面印数页到
十数页的ATGC
t*******r
发帖数: 22634
28
来自主题: Music版 - 实在受不了俺自己的走音了
老实说,俺觉得原因是俺的染色体 ATGC 排列可能有点小小的问题。。。
属于自然灾害领域。。。不过没关系啦,这不影响俺 have fun 。。。
B******y
发帖数: 2255
29
生物相似性是指向进化论吗?
进化论的开端和证据,都源于物种之间的相似性。达尔文虽然没有细胞具体结构和
DNA等遗传物质的知识,但他猜想生物随着环境的演变,可以逐渐改变外形和功能并生
存下来。这可以不同物种都有适应他们生存的环境的特征,并且很多物种之间外形像是
逐渐变化一样,而作为证据。
今天寻找生物之间的相似性已经成为证明进化论的迫切需要,而且好像有了相似性
进化论就被证明了。
真是这样吗?如果生命是被智慧所创造的,就不可以有相似性吗?
如果Java程序员可以用JDK这样的程序库里的元素构成各种各样的程序,所编的所有
程序背后都是这同一个程序库,这些程序之间都是有这样那样的相似。那么创造的智慧
为什么不能造出很多有内在相似性的生命呢?
玻璃匠制作的玻璃瓶不是都有瓶底/瓶口/瓶壁,虽然可以有各种颜色/胖瘦/高低,
但是它们之间不可以有那么多相似性吗?Intel制造的8086/286/386/486/586/Pentium
之间不是也有很多相似性吗?他们不是创造的产物吗?
我们开的各种汽车,不是也有很多相似性吗,他们不是人类智慧所创造吗?
所以相似... 阅读全帖
c****n
发帖数: 21367
30
来自主题: TrustInJesus版 - 人類非進化而來
“随机”跟“概率相同”是两码事情啊
基因突变这个事件,造成它的因素有很多对吧,什么宇宙射线,
化学污染,电磁效应等等等等,都可以造成基因突变。
就说ATGC,放在同一个环境里,分子活跃程度,运动方向性都不一样对不对?
从一个排列变化到另一个排列,虽然是随机事件,但是也因为排列不同而概率
不同。
以上解释概率为什么不同,以下我们说说环境如何决定进化的方向
而这个概率的同与不同是有倾向性的,不是随意的。
有能量输入的时候,复杂系统会“跃迁”,从一个状态到另一个状态,
就像原子受到光子照射跃迁能级一样,而不是给多少能量就经历中间所有状态。
系统只能在“稳定态”停留,非稳定态是不存在的。
所以你看到进化结果,都是稳定的物种。看到分子团,都是有膜的。
并不是因为没膜的都出现过然后消散了,而是系统只有这么几个状态是稳定,
i.e.高概率出现的。你输入能量,就跃迁,输入能量不够,就保持原状
能量给耗散掉。
这种演化的机制,现在正是科学研究的热点,
在无机世界,有机世界,甚至人类社会里都展现出同样的规律。
如果不做这个方面研究的人,很可能就把这种“跃迁”理解为上帝“意志”,
但实话实说,你觉得这种规律... 阅读全帖
Y**L
发帖数: 385
31
俺解释下某进化信徒到山海经里去找的这个‘中间体’概念,呵呵
中间体,以整体来看,就是一个没有智能的自然界进化现存生命所经过的所有过程,由
今天每种生命的所有祖先组成。注意,是所有祖先,不是已经发现的祖先。
关键词:没有智能的自然界 进化的所有过程
由于对中间体的概念不了解,大部分人常把进化的图景和创造的图景搞混。
如果把水面比作生态总空间的话,那么创造论就是在水面上的各处创造了各个离散的点
,每个点是一种生命,各点代表不同的生命。
进化说生命是彼此靠自然作用进化出来的,就是说一个点B上的生命,是另一个点A上的
生命经自然作用移动过来的(或曰进化。
若这个过程确实发生过,那我们可以肯定一定有一条曲线从A到B,表示出这个移动的途
径。
如果进化发生过,这个途径就一定存在。
中间体就是这个途径上连接A和B的各点。
创造的生命是离散的点。
进化的生命却必然经历几乎连续的线。
达尔文理论的力量在于,假设所有生命特征都可以相当连续的细化,每个细化的小步都
是无智能的自然可以完成的,那么没有智能的系统可能通过累计完成复杂的系统/变化。
需要细化到什么程度?
必须细化到随即过程能够轻易实现的程度。
... 阅读全帖
j**i
发帖数: 89
32
┌——————————————————————————————————┐
│ 【The unknown SPAC 武林大会】 │
├——————————————————————————————————┤
│ jdai 江湖人称 ATGC ,经查证此人经验值有 233 │
├——————————————————————————————————┤
│ 点,共出赛 207 次,打赢 32 人,总累积的战斗指数达到 14 点之多 │
├——————————————————————————————————┤
│ 听说此人出生于 129.95.65.75 ,已经练武足足有 0小时31分钟 │
├——————————————————————————————————┤
│ 之久十分可怕。这次准备使出全力,以赢得本站的武术王之名,所以他早在 │
├—————————————————————————————————
i***r
发帖数: 1035
33
【 以下文字转载自 Programming 讨论区 】
发信人: iiiir (哎呀我最牛), 信区: Programming
标 题: python code performance --- normal or too slow?
发信站: BBS 未名空间站 (Tue Jan 7 11:21:52 2014, 美东)
file is 2.5GB with 18,217,166 lines
my python script took about 20-30 minutes to finish
seems slow?
Thanks!!
input file data structure (showing first two lines, wrapped):
chromo pos ref alt dc1 dc2 dc3 dtm bas din
crw itb ptw spw isw irw inw ru1 ru2
ru3 im1 ... 阅读全帖
i***r
发帖数: 1035
34
file is 2.5GB with 18,217,166 lines
my python script took about 20-30 minutes to finish
seems slow?
Thanks!!
input file data structure (showing first two lines, wrapped):
chromo pos ref alt dc1 dc2 dc3 dtm bas din
crw itb ptw spw isw irw inw ru1 ru2
ru3 im1 im2 im3 im4 xj1 xj2 qh1 qh2
ti1 ti2 glw mxa rwa ysa ysb ysc cac jaa
jac
chr01 242806 G ... 阅读全帖
a*****g
发帖数: 543
35
26个字母都是一样的, 根据构词、语法写成的句子却可千变万化。
我们只得ATGC这些字母,却远不知道DNA这么语言的语法。
d*****u
发帖数: 17243
36
同学,即使文科生也在高中学过ATGC啊
你中学是文革的时候念的吗
Z******5
发帖数: 435
37
http://wenku.baidu.com/view/0b8350f5f61fb7360b4c6541.html
http://atgc.dxy.cn/bbs/topic/7806050
这个baidu文库里有,其实很简单,不用下载,看看就明白了。
n******b
发帖数: 35
38
来自主题: Biology版 - 翻身的生物wsn
计算机的基础是硅上面的0和1,生物的基础是ATGC加上三联密码的64个映射(更基础的
算化学了吧)。计算机进化速度快,生物进化显然慢很多。但是计算机只出现了几十年
,生物已经出现几十亿年了。。。且计算机debug更严格,生物上看看那么多的junk
DNA就知道大家肚子里的错误有多少了。
所以生物难懂,计算机相对好懂。。。
y**********n
发帖数: 478
39
把我能看到的SLC25A13的突变贴出来吧(HGMD),方便对照:
Missense/nonsense 27:
Codon change Amino acid change

tGAG-TAG Glu-Term
GCA-GAA Ala-Glu
tCGA-TGA Arg-Term
cCGA-TGA Arg-Term
TCG-TAG Ser-Term
tCGA-TGA Arg-Term
GGT-GAT Gly-Asp
cGAT-AAT Asp-Asn
tCGA-TGA Arg-Term
aCGA-TGA Arg-Term
GGC-GTC Gly-Val
aGGT-AGT Gly-Ser
aCAG-TAG Gln-Term
cACA-CCA Thr-Pro
AAG-AGG Lys-Arg
tCGA-TGA Arg-Term
aTGC-CGC Cys-Arg
GGT-GAT Gly-Asp
GCT-GAT Ala-Asp
ACG-AGG Thr-Arg
ACG-A... 阅读全帖
e*********6
发帖数: 3453
40
biomarker上的研究要用deep learning来发展,从原始数据开始,越原始越好。原始数
据里的feature是非常稀疏,就好DNA序列ATGC或者一个一个像素点一样。
就像人脸识别,deep learning擅长的是从原始的pixel 上来识别,要是把眼睛鼻子嘴
巴给标出来,deep learning就没啥优势。
为什么没人做?和人有关系,就算不提在industry上的需求,就在学术界,人家能改改
model,beat了deepSea或者deepbind的表现,稳稳妥妥一篇Bioinformatics以上级别的
,为什么要开这些高风险项目?
c******n
发帖数: 16403
41
配好溶液调试好机器就行了。 如果你用的是通常的ATGC碱基的话, 如果是类似物, 就
要琢磨着微调

要懂什么吗?是不是熟悉一下buildingblock就好了?
a**a
发帖数: 1703
42
就想把ATGC 或者.的字符读到数组data里面去
t*****w
发帖数: 254
43
来自主题: Statistics版 - 请问面试 R 应该怎么准备?
When I had my job interview, they always tested my SAS skill.However I use R
all the time. To help your preparation, read my R codes to see how much you
can understand it.
%in%
?keyword
a<-matrix(0,nrow=3,ncol=3,byrow=T)
a1 <- a1/(t(a1)%*%spooled%*%a1)^.5 #standadization in discrim
a1<- a>=2; a[a1]
abline(h = -1:5, v = -2:3, col = "lightgray", lty=3)
abline(h=0, v=0, col = "gray60")
abs(r2[i])>r0
aggregate(iris[,1:4], list(iris$Species), mean)
AND: &; OR: |; NOT: !
anova(lm(data1[,3]~data1[,1... 阅读全帖
1 (共1页)