由买买提看人间百态

topics

全部话题 - 话题: 数据格式
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
y*******e
发帖数: 1295
1
做毕业论文,遇到数据转换问题,给老师发了信没回应,在英文论坛上问了也没有答案
,着急哪,哪位帮一下吧,实在是
没辙了~~~~~~~~~
从一个数据包里导出的数据格式分别是SPSS syntax能够识别的sps后缀名的格式,和
SAS能识别的sas后缀名的格式,结果
发现这两个格式都不能导入HLM,除非SPSS数据转化成sav后缀名的格式,或者SAS转化
成sas transport后缀名的格式。
。。。
SPSS那个怎么搞都弄不好,SAS则没用过更抓瞎!!
高手过来看看吧,,,,万分感谢
p********a
发帖数: 5352
2
☆─────────────────────────────────────☆
yolkwhite (吴侬软语,泡蜜罐ing) 于 (Tue Mar 9 15:22:47 2010, 美东) 提到:
做毕业论文,遇到数据转换问题,给老师发了信没回应,在英文论坛上问了也没有答案
,着急哪,哪位帮一下吧,实在是
没辙了~~~~~~~~~
从一个数据包里导出的数据格式分别是SPSS syntax能够识别的sps后缀名的格式,和
SAS能识别的sas后缀名的格式,结果
发现这两个格式都不能导入HLM,除非SPSS数据转化成sav后缀名的格式,或者SAS转化
成sas transport后缀名的格式。
。。。
SPSS那个怎么搞都弄不好,SAS则没用过更抓瞎!!
高手过来看看吧,,,,万分感谢
☆─────────────────────────────────────☆
baicaibangzi (白菜帮子) 于 (Tue Mar 9 15:52:58 2010, 美东) 提到:
hlm 是什么?

☆──────────────────────────────────
s*****e
发帖数: 21415
3
来自主题: Quant版 - Re: 关于金融数据的处理
【 以下文字转载自 Working 讨论区 】
发信人: skydive (跳跳~~莫言迁客似沙沉), 信区: Working
标 题: Re: 关于金融数据的处理
发信站: BBS 未名空间站 (Sun Sep 28 15:23:14 2008), 转信
熟练运用各种数据处理软件,应付各种数据格式,
(必要的话自己写程序开发)是一个分析人员的
基本素质阿。
当然,上面说的只是格式,如果数据本身有错,
那就不是格式能解决的了。一般有公司专门搜集、
纠错、校订各种数据。然后发布到客户的数据库里。
这样的服务一般都价格不菲。一个工作组(5-10人)
的license,一个数据项目大约是1-2万美元的量级。
如果需要十几乃至几十个个不同的数据源,开支是非
常惊人的。
政府是不会管这个闲事的,不然扼杀了多少就业机会啊!
m******2
发帖数: 564
4
我人笨?
我看是编R的那帮人存心不良!
首先对Excel这个最普遍的数据格式主程序不支持,难道让大家都自己手动把数敲进去?
csv就csv吧,没事就给自动转个factor, 生怕别人不知道你有factor这个类型
再有带逗号的数据是不是最常用的数据格式? 那么多经济数据都是带逗号的,
那你R凭什么装傻不给认?
哦,我用个gsub命令编个函数就可以了
那你怎么不事先编好? 让我溜你的命令找解决办法,好多学学R是吗?
我用过Eviews SPSS之类从来没有遇到过这种问题,从来就是Excel直接转了
R怎么了?是免费心有不甘吧?是不坑用户心里不舒服吧?
f*******s
发帖数: 440
5
C++
我的设想是一个数据类
一个存储类 下面多个数据格式子类
现在搞不清楚数据类和存储类的关系
是多重继承存储类呢?
还是call 存储类
谢谢
N******K
发帖数: 10202
6
m文件里面的东西 都是人能读懂的公式
比如写kalman filter 一页就写完了 而且跟paper上写公式 没太大区别
这要是用c或者c++ 写完了 过几天一看 就看不懂了 只能当黑盒用了
一个多维矩阵 就涵盖了 matrix image 等等具体的数据表达格式 根本不用造轮子
只有统一 才能减少无用功
E******g
发帖数: 170
7
来自主题: Programming版 - 移动数据传输格式选择问题
移动时代的数据传输格式选择难题?xml,json比较浪费流量;二进制json方案众多(bson,
bjson,ubjson,smile);二进制xml(WBXML,BiM, EBML)方案也众多;Protobuf,Thrift无法
表示通用的数据格式,扩展性较差;MessagePack 相对比较通用,但发现多平台数据互通
的时候转换有一些问题.各位是否有好的建议?
……………
帮朋友问的
……………
l***n
发帖数: 4
8
为何Microsoft ACCESS中的浮点数据export为.txt文件后,统统变为
.xx,而不再保留原有数据格式?
如何解决这一问题?
多谢。
c**********n
发帖数: 227
9
来自主题: Quant版 - 关于金融数据的处理 (转载)
【 以下文字转载自 Working 讨论区 】
发信人: countrywoman (理想之村村长), 信区: Working
标 题: 关于金融数据的处理
发信站: BBS 未名空间站 (Sun Sep 28 15:13:13 2008)
做金融分析需要参阅大量金融数据分析财务报表,我是股票基金方面的分析员,每天都
要处理大量数据,数据来源主要是datastream and Bloomberg,两个公司后者数据相对
比较干净但是数据不全,而前者提供的数据发现不少错误。跟其他单位同行交流过发现
数据的可靠性非常重要而提供数据的公司问题不少。 我当时跟单位老同事提出过一个
设想,数据经手的途径越复杂越多数据被污染的机会越多。 如果政府出资研究一套软
件系统,政府可以规定所有上市公司通过此系统制作财务报表,将数据直接提供到由财
政部监管的部门,系统软件自动生成有着统一数据格式的文件,文件兼有pdf的稳定性
和excel数据灵活操作性。对调取使用数据的企业收费。这样可以减免数据污染途径提
高数据的可靠性,对于研究和金融分析很有帮助。
同事觉得提议不错但是可执行性不高。我个人觉得这个建议应该
d******p
发帖数: 335
10
没签NDA神马的,攒人品了~
电面:
1. 给一个矩阵如下:
a b c d
e f g h
i j k l
m n o p
要求按如下方式打印:
a f k p
b g l
c h
d
e j o
i n
m
2. 设计题:
如果要给每个Pin加上一个price tag,怎么去evaluate这是否work?
(1) A/B testing -> 可以有好几种,讨论优劣性
(2) metrics to monitor -> click rate, impression, return user ratio, etc
上门:
1. 假设Pinterest的更新系统只能显示3条更新,怎么设计?更新可以是:用户评论、
加新的pin,repin等等,一共可能有一千多种。讨论各种方法的优劣性
回答:a ranking problem...
2. 给如下的数据格式:

比如有一组数据:
1, 3, 100
2, 4, 200
5, 6, 300
。。。
这些数据时间点可能有重合。在时间段2~3之间,value的和是100+200 = 30... 阅读全帖

发帖数: 1
11
【 以下文字转载自 JobHunting 讨论区 】
发信人: Glaser (), 信区: JobHunting
标 题: 无人驾驶-研发-地图数据平台架构师 = 国内岗位
发信站: BBS 未名空间站 (Wed Dec 28 21:54:32 2016, 美东)
职责:
1. 负责新一代地图数据平台的架构设计,指导研发团队高效实施。
2. 深刻理解GIS以及地图相关数据,设计合理的数据库模型,支持海量的地图数据在线
编辑、质检、融合及发布,并保证平台的高可用性、高效率以及高扩展性。
职位要求;
1. 有多年GIS相关工作经验,熟悉地图的数据格式以及生产方式,有数据作业平台相关
经验更佳。
2. 有多年的数据平台架构实战经验,至少具备1个大型数据库实施项目经验。
3. 深刻理解MySQL/PostgreSQL等数据库原理,能结合地图数据的特殊需求设计合理的
数据方案。
4. 具备强大的自我驱动力与自学能力,乐于迎接挑战、知难而上。
5. 具备较宽的行业视野,能及时吸收和引进行业经验。"

发帖数: 1
12
职责:
1. 负责新一代地图数据平台的架构设计,指导研发团队高效实施。
2. 深刻理解GIS以及地图相关数据,设计合理的数据库模型,支持海量的地图数据在线
编辑、质检、融合及发布,并保证平台的高可用性、高效率以及高扩展性。
职位要求;
1. 有多年GIS相关工作经验,熟悉地图的数据格式以及生产方式,有数据作业平台相关
经验更佳。
2. 有多年的数据平台架构实战经验,至少具备1个大型数据库实施项目经验。
3. 深刻理解MySQL/PostgreSQL等数据库原理,能结合地图数据的特殊需求设计合理的
数据方案。
4. 具备强大的自我驱动力与自学能力,乐于迎接挑战、知难而上。
5. 具备较宽的行业视野,能及时吸收和引进行业经验。"
c*****n
发帖数: 5
13
来自主题: JobMarket版 - 找人输入数据(可在家工作)
找人输入数据(可在家工作)
网站需要大量的美国职业中介信息
我们需要大约5万条数据
您输入的数据将根据各个州出现在右面菜单“coming soon...”中
您必须先查看网站上现有的数据格式,www.us-canada-jobagency.com,然后估算你需
要的工作时间
您只需要有一台计算机,微软OFFICE EXCEL软件和互联网
请将您的简历和期望薪水发EMAIL至a***[email protected]
h******b
发帖数: 6055
14
etlshop.com
我们的团队对各种ETL服务非常熟悉. 各种数据格式转换, 从各种地方获取数据, 在
数据库整合然后做出各种动态网页和报表, 只要你能写出要求我们就能做。 e-
commerce, 金融,都有接触。
最近几年也就是组了个服务器, 跑跑cron job, 在自己的小圈子里小打小闹挣点外快
。 后来觉得这样不是办法, 下定决心整合一个平台, 以做产品的态度来搞这个。
现在的网站只不过是个广告而已, 后台还只是起步不久。 我们不收任何upfront的钱
, 只要你要求的提供的接口是可以卖给更多用户的, 我们承担一切开发费用。
给我们介绍客户可以获取20% life time佣金。 Life time就是说只要你拉进来的客户
还付我们钱, 你就拿两毛。 我们会给你提供一个网页清楚看到你的客户每月花多少
钱。 如果以业绩证明自己是sales/marketing的大牛。 一年以后可以谈股份。
暂时不需要技术人员, 我们这个阶段还只是追求糙快猛, 小庙请不起大神。
求交流j**[email protected]
h******b
发帖数: 6055
15
etlshop.com
我们的团队对各种ETL服务非常熟悉. 各种数据格式转换, 从各种地方获取数据, 在
数据库整合然后做出各种动态网页和报表, 只要你能写出要求我们就能做。 e-
commerce, 金融,都有接触。
最近几年也就是组了个服务器, 跑跑cron job, 在自己的小圈子里小打小闹挣点外快
。 后来觉得这样不是办法, 下定决心整合一个平台, 以做产品的态度来搞这个。
现在的网站只不过是个广告而已, 后台还只是起步不久。 我们不收任何upfront的钱
, 只要你要求的提供的接口是可以卖给更多用户的, 我们承担一切开发费用。
给我们介绍客户可以获取20% life time佣金。 Life time就是说只要你拉进来的客户
还付我们钱, 你就拿两毛。 我们会给你提供一个网页清楚看到你的客户每月花多少
钱。 如果以业绩证明自己是sales/marketing的大牛。 一年以后可以谈股份。
暂时不需要技术人员, 我们这个阶段还只是追求糙快猛, 小庙请不起大神。
求交流j**[email protected]
s*****y
发帖数: 11
16
如果我在几个不同的机器上spawn 几个 AKKA actor, 各自有各自的数据【格式一样】
,然后我想把这些数据merge到一个spark RDD里面统一进行处理, 怎么样的方式最好呢
t*d
发帖数: 1290
17
来自主题: Biology版 - cluster不能识别我的芯片数据
这些免费软件就是这样。分析数据半分钟,研究数据格式一天。
f**********w
发帖数: 93
18
请问哪里可以下载以前的股票交易数据呢?最好能历史长一点的(10年?),不要求实
时性很强的,就是想自己做点数据分析,另外哪里有介绍不同的交易所用的数据格式的
?谢谢
l*******s
发帖数: 197
19
来自主题: Statistics版 - 请教个SAS数据输入问题
数据格式如下.
共五列,前面四个是数子,分别属于不同的分类,后面一列所属门类
375 447 547 548 a
286 286 403 422 b
349 382 473 497 c
429 410 488 547 a
我想做成Stack数据,想一次输入,结果很难实现。请教高手如何写代码?
下面的代码只能把数字录入,后面的字母则不行;
data test;
do type ='x', 'y', 'z','m','n';
input value @@;
output;
end;
input cat $;
datalines;
f**z
发帖数: 154
20
来自主题: Statistics版 - 请教一个SAS数据格式的问题
问题是这样的。比如有这么一个程序。
data abc;
informat x 6.2;
x=12345;
input y 6.2;
put x= y=;
datalines;
12345
;
run;
于是log里会得到x=12345 y=123.45. 我想知道第二行的informat里写什么格式可以让x
也被读成123.45呢?
谢谢!
f*******w
发帖数: 407
21
举个例子吧,比如说在这个网站:
http://www.commscope.com/catalog/wireless/2147485858/product.as
有很多产品信息,你是怎么就能够把这些信息提取出来并编辑成需要的数据格式吗?那
你需要我提供什么呢?
f*******w
发帖数: 407
22
举个例子吧,比如说在这个网站:
http://www.commscope.com/catalog/wireless/2147485858/product.as
有很多产品信息,你是怎么就能够把这些信息提取出来并编辑成需要的数据格式吗?那
你需要我提供什么呢?
m********r
发帖数: 2895
23
我以前SD card也是这个情况,带娃娃去游乐园的照片和摄像都差点损失了,后来用数
据恢复软件自己整出来了,折腾了3天
你这个应该也还有救,但是数据格式太多了就不容易恢复---相比单纯的图片和视频
d******a
发帖数: 32122
24
Microsoft Access
录入文本数据格式最强悍
我试过MySQL SqlServer 录入都有问题
所以我经常 text to access to sqlserver
g****c
发帖数: 108
25
来自主题: Statistics版 - 求高人指点一个SAS数据的转换问题
想把数据格式
A 1
A 2
A 3
A 4
B 1
B 2
B 3
B 4
变成
A B (variable name)
1 1
2 2
3 3
4 4
求一个最简单的SAS code。
多谢。
v*******e
发帖数: 11604
26
多年经验,总结出来就一句话:搞数据格式,能不用R处理就不用R处理。
理由:1. 慢 2. 陷阱多容易出错 3. 繁复

发帖数: 1
27
不得不承认,目下的中国文化重建工作,正在面临着一种非常复杂微妙的局势。一方面
,国学的复兴热潮正在吸引大量的社会资源与学者的精力,去从事对于中国传统文化的
理解与注释和传播工作;而另一方面,人工智能、大数据等新技术载体的出现,又在全
面地削弱各种传统的文化信息传播模式(特别是对于纸媒)的社会影响力,进而通过对
于“娱乐至上”理念的扩散来抵消严肃文化的传播学效应。耐人寻味的是,国内从事儒
家政治哲学研究的学者,大多倾向于将自己的理论谈话伙伴,定位为同样属于学者意识
形态的自由主义或政治保守主义,却很少顾及信息技术载体下的大众意识形态样态产生
的动力学机制。在笔者看来,这种过于“不食人间烟火”的态度,或许既会削弱儒家在
新技术条件下的说服力与传播学效力,亦会加高在不同专业群之间业已存在的信息壁垒
。而本文的目的之一,也便是本着“消除跨专业对话壁垒”的学术初心,向读者展示激
活传统文化资源应对新技术时代的可能性,由此甚至为一种具有“数码化的儒家”(
digitalized Confucianism)色彩的新技术路线的发育,提供思想层面上的预备性讨论。
然而,使得本文的讨论得以展开的“元语言框... 阅读全帖
z****e
发帖数: 54598
28
来自主题: Programming版 - 如果要做一个铁路售票网站
如果你拿到这个需求
你第一反映是什么?
我的第一反映是,我需要了解一下当前的it系统是怎么运作的
尤其是数据格式,是怎样的,然后再根据当前系统提出后续处理的方案
对不对?
但是,这个最基本的问题,魏老师是不考虑的,因为这是别人的问题
然后是魏老师的新的数据格式
那么一个很本能的问题:如果你要新构建一个数据结构,那么如何保证旧的数据结构
平滑地过渡到新的这个数据结构中去呢?还有如何保持新旧数据一致呢?
我相信在铁道部几十年的建设中,他们肯定会有那么一套现存的
而且运转得相对不错的it系统在运作,那么他们的数据肯定有一个存放格式
而且更重要的是,这个核心的数据存放,外面会有相关依赖于这个数据格式的系统
很正常嘛,你现在打开随便一个运作十年以上的公司的数据库schema
哪个不是密密麻麻跟蜘蛛网一样的各种关联关系?
一个破公司尚且如此,更何况铁道部
那你认为,做一个哪怕是最简单的parse工具,去parse现有的各种数据格式
是不是都很难?更不要说重新构建一个新的数据格式了
所以估计铁道部网站就是在这个数据格式外层,再单独做web server
然后跟现有的数据格式做一个衔接,以这种方式来先... 阅读全帖
F********r
发帖数: 407
29
在老妞的PIP里,她需要达到每周50个模块的实在进展。但是老妞和手下人准备的那些
模块根本就测试不过去。老妞坚持他们的模块没有问题,但也解释不了为什么新的模块
就不工作。说起来那五个高级合同员工水平是比较高的。但是考虑到他们公司还为许多
其他公司服务,我们不允许他们触及我们内部的一些系统核心。这样他们在做模块时候
就比较侧重通用,而我们内部必须根据他们准备的模块进行客户化和系统集成。因为这
个欧洲项目实际涉及四个不同系统(还有额外的一个系统以后需要加进去)和数据库,
其中还包括两个是很老的系统(legacy system)。这其中的数据传递和计算并不是非
常简单的,要把这些都整合到一起需要比较多的实际经验,也需要不少创造性。
我叫老妞把她和我老板做的模块计划设计给我看,并问她老板怎么说的。她回答说老板
可能没有看,但是似乎并不担心有什么问题,因为他们是按照我原来签放的模块来做方
案的。结构和总体流程几乎没有差别,变化就是部分细节内容,所以错误很可能是原来
我做的模块就有的。我也很纳闷,只好带着文本回家晚上阅读。就像当年编程一样,阅
读和修改别人的程序是件非常头疼的事。不仅要看懂别人写的... 阅读全帖
h*******e
发帖数: 9
30
Update一下:
(i) 通过邮件又沟通了好几个来回,终于明白为什么转换后得到的数据是corrupted了
。这个软件最初的设想是把不同的原始数据格式(比如说A,B,C)转换成统一的一种
格式(比如说X)方便存储和管理,并能转换回原来的格式。当时做这个东西的时候,
对方只给了原始格式为A的测试数据(并没给B或C格式的测试数据)。最后做完的时候
,顺利地实现了A和X之间的相互转换。现在对方说如果原始数据other than A(也就是
B或C)的话,转换后的数据就是corrupted了。读入原始数据的过程是通过调一个工具
包来实现的。对方可能觉得因为这部分是调第三方工具包来实现的,如果A测试通过了
,那B或C也应该没问题。现在B或C的数据转换出问题了,所以我应该把这个问题解决掉。
(ii) 另外一个发现的问题是转换的过程中原始数据里有一个参数可能没拷贝到转换后
的数据里,于是转换后的数据里这个参数就始终是默认值了。
非常感谢上面回复的同学的意见。关于合同,当时没有跟对方签合同,只有口头和邮件
里同意做这个东西。另外,关于让他们雇用我,我觉得也不太可能。因为一直感觉对方
在各个方面都省钱... 阅读全帖
h*******e
发帖数: 9
31
来自主题: WaterWorld版 - 【请教】 这种情况下我该怎么办?
Update一下:
(i) 通过邮件又沟通了好几个来回,终于明白为什么转换后得到的数据是corrupted了
。这个软件最初的设想是把不同的原始数据格式(比如说A,B,C)转换成统一的一种
格式(比如说X)方便存储和管理,并能转换回原来的格式。当时做这个东西的时候,
对方只给了原始格式为A的测试数据(并没给B或C格式的测试数据)。最后做完的时候
,顺利地实现了A和X之间的相互转换。现在对方说如果原始数据other than A(也就是
B或C)的话,转换后的数据就是corrupted了。读入原始数据的过程是通过调一个工具
包来实现的。对方可能觉得因为这部分是调第三方工具包来实现的,如果A测试通过了
,那B或C也应该没问题。现在B或C的数据转换出问题了,所以我应该把这个问题解决掉。
(ii) 另外一个发现的问题是转换的过程中原始数据里有一个参数可能没拷贝到转换后
的数据里,于是转换后的数据里这个参数就始终是默认值了。
非常感谢上面回复的同学的意见。关于合同,当时没有跟对方签合同,只有口头和邮件
里同意做这个东西。另外,关于让他们雇用我,我觉得也不太可能。因为一直感觉对方
在各个方面都省钱... 阅读全帖
z****e
发帖数: 54598
32
来自主题: Programming版 - 好虫,看看你的东东有没有问题?
我觉得这里的人背景不一样
很多人是完全没有相关行业的从业经验,就瞎说
就像楼主总是把这种系统比作股票交易一样
两个完全不同的行业,数据格式要求精度以及来源什么都不一样
如果死搬经验就是邯郸学步
而我总是把火车票的买卖跟飞机票的买卖做比较
因为我相信,飞机票跟火车票的买卖是类似的
股票的交易还有web公司平台,都不是一回事
因为数据格式不一样,要求也不一样,差别很大
所以最好的办法就是参考飞机票的买卖,而不是淘宝等web公司
也不是股票交易市场的系统
如果真想做这个系统,最先应该做的是了解一下现有火车票的数据格式是什么样子的
而不是假设这个数据格式应该是某一种格式
就这么大的系统而言,在短时间内
往往是连最简单的数据格式的转换都几乎是个不可能完成的任务
更不要说重新构建一个有向图,再读到内存中去了
l**p
发帖数: 474
33
来自主题: _Graphics版 - WMF文件格式
发信人: Able (泡泡龙·24岁), 信区: Graphics
标 题: WMF文件格式
发信站: 北大未名站 (2003年08月12日16:55:09 星期二), 转信
8.4 WMF文件格式
8.4.1.简介
Wmf文件格式是微软公司为其windows环境提供的另一种图形文件格式,与bmp不同的是
wmf文件格式在存储图像数据时不是以位为单位存储,而是以向量格式存储。其全称为
windows meta File,即windows元文件。最初是为了支持windows环境下保存与交换图像
而设计的一种图像存储格式,而且仅作一种图形宏指令进行使用的。但是由于这种格式在
构成和操作上的灵活性,现在应用范围已经逐渐扩大,成为基于windows应用程序中的一
般图形交换文件格式。
8.4.2.文件格式描述
WMF文件格式由一个短小的头文件及一些记录组成,其中每个记录一般由尺寸,函数号以
及一些参数组成,对应与一个windows函数调用。大多数情况下,记录中包含的参数恰好
为需要传送到相应windows GDI子程序中的数据值。当然,对于某些非常复杂的子程序而
言,例如,相应win
a****k
发帖数: 3457
34
一个文本数据文件A.txt,如下格式:
12,34
24,45
21,33
05,44
。,。
每行两个数据,用逗号分开。有N行(N不大于100).
现在要求将A.txt中第一行的两个数据写入文本文件1.txt的第二行和第三行指定位置,
取代原来的数据;将A.txt中第二行两个数据写入文本文件2.txt的第二行和第三行指定
位置,取代原来的数据;以此类推,将A.txt的第N行数据写入n.txt文件的第二行和第
三行指定位置,有N多个文本文件。
被修改的文本文件有相同的格式。如原来的1.txt格式如下:
DataSet=1
low=01
high=05
。。。。。
修改后的1.txt为:
DataSet=1
low=12
high=34
。。。。。
要求写一个VB小程序实现
c********n
发帖数: 225
35
鉴于韩春雨实验室在Addgene于2016年8月8日更新的实验流程
https://twitter.com/Addgene/status/762641610073051137
https://www.addgene.org/78253/
under “RESOURCE INFORMATION” section “Supplemental Documents”:
“A general protocol of NgAgo/gDNA-mediated genome editing”
【跟帖格式指南: “重复验证NgAgo”实例跟帖】
特于2016年8月8日更新版本:Updated Version CBC20160808.1
【记录历史】谁重复验证了NgAgo?
跟帖格式指南: “重复验证NgAgo”实例跟帖
Version CBC20160808.1
版本修定注明:
1.基于 Version CBC20160807.1
http://www.mitbbs.com/article_t/Biology/32035279.html
2. Addgene Han Lab added tips 201... 阅读全帖
a*********7
发帖数: 30080
36
来自主题: mitOCEF版 - 讨论: 做一个ocef的手机app?

service
--------------
这个没看明白。。。
web service就是一个简单的收、取数据的方案,访问某个url,就得到某种structured
data,几乎就跟直接从数据库读取差不多了。不管从什么“平台”(我其实不太明白
你这里的平台指的是什么)去读取,拿到的数据格式都是一样的,比如说json; 这些
“平台”只要知道怎么处理这个数据格式就可以了。 只要这个数据格式不变,以后web
service这边的变动也不会导致接口的变动。
哦,还有一个可能会导致接口的变动:url本身变了,或者url的参数变了 -- 这个
相当于web service的api变动? 对于要访问service的client来说,url + its
parameters就算是api了。
------------------
---------------
你是指ocef现在的网站可能加一个插件来做这件事? 这个我就不清楚了。如果可能的
话当然最好。
从过去的经历,我猜现在的官网应该是静态显示的,需要更新一条新信息,就需要it组
的义工手工加上去。如果是这种情形的话,估计不大好象你说的这样... 阅读全帖
w***z
发帖数: 1848
37
看了最近的面试人vs面试官讨论,想问问系统设计题中如何摸清面试官想要的答案?最
近面了几个都栽在这上面。算法题都没问题,无外刷题,就算不是面试官想要的答案,
至少也可以侃思路。可系统设计题。。。
举个栗子,问有那么一块数据空间,只有某个API可读,主程序怎么找到并传给这API来
读?
首先反应这是个IPC,传数据用文件头格式+未知数据,广播所有在听的API。对方说
API不知道文件头格式。
好吧,用通用TLV?数据前加个magic word来指示这个API怎么读。对方说系统不支持
TLV。
那用function pointer?(其实已经在胡说八道了)主程序按数据格式做switch 选择相
应的API执行。对方说switch耗cpu cycle不好。
一来二去时间就耗掉了,思路也一下卡在那里。最后对方说可以直接广播数据,API用
type cast直接读就行。。。
其实面试官想考的技术我是知道的(事后回顾),也不难。但是如何在当时半小时内能
反应过来并摸清面试官想要的答案呢?我当时想的答案也是工作中常用到的,对方说不
行也没办法。。。求指教。
c*********e
发帖数: 16335
38
java web services怎么把xml,json数据解析?用哪些插件?
1)怎么把xml,json格式的数据解析成数据,然后存进数据库?
2)怎么把数据库里的数据拼装成xml,json格式的数据,然后发送给用戶?
记得用c# web services的时候,用过第三方软件,直接在poco和json之间转换,不用
我自己写解析code.
z*******3
发帖数: 13709
39
来自主题: Programming版 - MapReduce 的思想是怎么发明的?
因为rdbms的格式远比nosql的格式要工整许多
table,column什么都很工整,都是structured data
数据工整了,自然可以把很多操作傻瓜起来
就不需要high order functions你也可以通过一些脚本做出你需要的运算
比如简单的crud,一些aggregation
一开始连工整的数据都没搞定的时候,没功夫思考不工整的数据怎么搞
但是nosql的数据格式很混乱,经常需要处理数据,所以需要更general的工具
而这种工具你事先并不知道用户会输入什么样的func
所以需要一种方式能够把函数当成参数来输入
来处理数据然后反馈给用户
hadoop没有做到spark纯粹是因为hadoop忙着解决hdfs的事情了
你要做出这种系统来,首先第一步先用一个统一的接口封装所有的file system
至于hdmr,没想那么复杂,因为第一步已经够麻烦的了
然后spark的作者觉得,这里有提升的空间,所以就搞出了spark
同样的,spark的batch做得不错,但是至于streaming,没想那么多
所以flink出来说,诶,你这个streaming做得不行,我能够做得更... 阅读全帖
i*****g
发帖数: 11893
40
2007年,龙芯3号的设计揭开序幕,当被人问到龙芯3号的意义时,胡伟武老师微笑
不语,提笔写下一行字,“如果说龙芯1号是在迷雾中起步,还看不到先行者的影子,
那么龙芯2号完成后,在当时实际上已经超过了一些同行者,看清了领先者的背影,而
龙芯3号的完成将使龙芯大踏步赶上并超过领先者。”
(批注:这些项目,要持续支持30年,直到和米帝分庭抗礼。开始的亏损,不能以寻常
市场经济盈利心理来衡量。)
四年时间过去,龙芯3号已经从设计变成现实,并已发展出一系列改进型号。依托
龙芯3号的研发,龙芯团队已经实现了胡老师的预期,走在了世界体系结构研究的最前
沿。从2008年开始,龙芯在顶级会议和期刊上发表了一系列论文:IEEE Trans.on
Computers、IEEE Micro、ISSCC、ISCA、HPCA、IJCAI、HotChips、SPAA和DATE等等。
可以说,相比美国顶尖大学的一个研究组的论文发表水平也毫不逊色
(批注:也就是说,对阵米帝整体他们的实力其实不强,估计米帝有几百个这样的实验
室。如果说他们一个公司是intel 1/3,那还可以。)。更重要的是,龙芯的研究已经
... 阅读全帖
w******g
发帖数: 189
41
来自主题: Programming版 - Spark上怎么join avro format的数据?
看见这里有scala 和spark的大牛,问问一个困扰多时的问题。Spark上怎么join avro
format的数据?
如果是plain text,用TAB分割开的数据,做join操作很容易就是把A和B表弄成(key,
value)格式的rdd再调用A.join(B)就可以了。但是我现在要join avro格式的数据,还
是A和B,格式都是(STRING, GenericRecord)。读是可以都的,因为可以执行first和
count的action,但是join貌似要shuffle,shuffle的话要serialize 临时数据。已经
用了kyro的serializer register A和B类了,还是不行。大牛谁有经验或者可以run的
例子吗?
z****e
发帖数: 54598
42
平台固定,只需要对付这一个平台
什么语言都可以很快,快不了我们做各种优化都没有问题
但是这个东西要有普适性,要能适应所有的系统
对付所有的数据格式,远不是什么json和xml那么简单,还包括各种你想都想不到的格式
比如我们要同时对付上百个政府和监管机构提供的数据结构
你跟我说来优化?统一成一种格式?
让中国或者美国政府听你的?统一各国政府的格式?
你丫的搞笑吧?
对于现实复杂性没有任何概念的人,也敢大谈说,我跟谁急
行啊,cia就在那里,你去急吧,要不澳洲移民局也在那里,你去急吧
去骂他们,草你妈,居然不听老子指挥,不把格式做对,搞得我们parse数据格式需要
时间
你敢吗?我很乐意看到你过去跟他们拍桌子

c#
z****e
发帖数: 54598
43
平台固定,只需要对付这一个平台
什么语言都可以很快,快不了我们做各种优化都没有问题
但是这个东西要有普适性,要能适应所有的系统
对付所有的数据格式,远不是什么json和xml那么简单,还包括各种你想都想不到的格式
比如我们要同时对付上百个政府和监管机构提供的数据结构
你跟我说来优化?统一成一种格式?
让中国或者美国政府听你的?统一各国政府的格式?
你丫的搞笑吧?
对于现实复杂性没有任何概念的人,也敢大谈说,我跟谁急
行啊,cia就在那里,你去急吧,要不澳洲移民局也在那里,你去急吧
去骂他们,草你妈,居然不听老子指挥,不把格式做对,搞得我们parse数据格式需要
时间
你敢吗?我很乐意看到你过去跟他们拍桌子

c#
y**b
发帖数: 10166
44
java程序, client可以登录、聊天、画图,这些信息要送到server,
(server验证帐号,以及把聊天文本或绘出的图像发送给其他clients)。
1.请问client端这些不同类型、不同时段、长度随时变化的数据,应该
用什么格式的stream发送呢?
2.server一个while循环怎么接收、识别这些不同类型的数据呢?
3.client也要接收数据,while循环岂不会造成blocked?
4.一对sockets之间,能不能某个时段传一种stream格式,另一个时段
传另一种stream格式?
5.比如我一边画图(每画一笔就传送出去,其他用户能收到),一边接收
对方聊天文本,一定需要两个线程吗?这两个同时运行的线程能否同时
与server进行传输?
c********n
发帖数: 225
45
【记录历史】谁重复验证了NgAgo?
跟帖格式指南: “重复验证NgAgo”实例跟帖
Version CBC20160807.1
用“重复验证NgAgo”的实例跟帖时,请用以下跟帖格式
− 实例类别
− 实例介绍
在原帖下跟帖
【记录历史】谁重复验证了NgAgo?
原帖链接:
http://www.mitbbs.com/article_t/Biology/32034437.html
实例类别
- 现版本包括以下6种实例类别
第一类“重复” 验证实验信息:匿名或无记名,网络、论坛发布
- 成功重复、拓展验证韩春雨NgAgo实验
- 包含无任何实验细节描述,无发布方城市,国家等细节的信息发布
- 不包含以韩春雨名义单方发布的信息
第二类“重复” 验证实验信息:实名,网络、论坛发布
- 曾发布NgAgo “Maybe working”的结果,后经深入实验数据采集分
析研究,重新发布结论-现有数据不能支持NgAgo基因组编辑功能
- 暂不包含无具体实验流程或具体实验结果的发布报告
- 需包含发布方城市,国家
第三类“... 阅读全帖
P****D
发帖数: 11146
46
没看懂。你的问题不是已经解决了?既然已经知道“发现这两个格式都不能导入HLM,
除非SPSS数据转化成sav后缀名的格式,或者SAS转化成sas transport后缀名的格式。
”,那就照做就是了啊。
如果你是手里只有.sps(SPSS没有这种后缀名,你看错了sys?)和.sas7bdat(SAS后
缀名)文件但不知道怎么转化的话。我假设你手里有SPSS和SAS软件。那么双击打开.
sas7bdat,然后File->Export Data->Next->有个下拉框可以选你要的格式,可以选
Excel或Tab Delimited File(我就不信有软件不支持这两种格式)-> Next->告诉SAS
你想把转换成的文件存放在哪里->确定,然后看到“完成”出来的时候就点完成。
l**p
发帖数: 569
47
这是sogotrade的数据格式。好像每次问customer service要的数据都不一样,如果你
的格式跟这个不同,照着这个格式改一下就好了:
还有,如果你的broker不支持,可以选ExcelFile作为broker类型,然后填入数字。其
实每一种broker都可以按ExcelFile format填入。比如上个sogotrade的数据,是trade
log类型的(就是每行只有买/卖时间),
可以填入以下数字。Trade statement (就是每行同时有买和卖)的类似。
b*******b
发帖数: 613
48
【 以下文字转载自 Software 讨论区 】
发信人: bloodyjob (BloodyJob), 信区: Software
标 题: 如何从excel以特定格式导出数据到word?
发信站: BBS 未名空间站 (Tue Jun 17 09:58:03 2008)
excel里面的数据如下格式:
A B C D
p********a
发帖数: 5352
49
来自主题: Statistics版 - [合集] SAS 读入数据的问题
☆─────────────────────────────────────☆
mee (sheen) 于 (Sat Jul 7 16:51:57 2007) 提到:
同样的数据,用 proc import 读
有一列数据比较少
如果是从csv读,把数据读成char格式,guessrows=也不行
如果是从xls读,还是char格式,更狠的是,直接把数据全都删了
有什么办法没有从xls读的时候,多检查点数据?
高手给个例子吧
完了,从来没见过sas这么蠢的软件,被他搞疯了,不知道为什么这么烂的东西用的人
还那么多
☆─────────────────────────────────────☆
statcompute (statcompute) 于 (Sat Jul 7 17:13:39 2007) 提到:
the stupid is as the stupid does.
☆─────────────────────────────────────☆
mee (sheen) 于 (Sat Jul 7 17:29:40 2007) 提到:
啥意思?
W****T
发帖数: 78
50
来自主题: Statistics版 - 问 Excel VLOOKUP的问题
查查数据格式吧,很有可能那个0001234那一列的数据格式不一致,看着都是数字,有
可能有的是text或者其他格式
如果这一列的数据的length都是7,还可以用len()查查有没有隐藏的空格这种,或者直
接用left()取最左边7个数字,取得时候同样要注意Number format
1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)