由买买提看人间百态

topics

全部话题 - 话题: 字段
1 2 3 4 5 6 7 8 9 下页 末页 (共9页)
m**********o
发帖数: 58
1
别人的数据库里出错要改一下,其中一个字段是序号,一个字段是条码。现在是大约有
2-3000条纪录的序号是重复的,俺想把它们直接改成条码得了。手动改太累了,请哪位
大虾指点一下。SQL这个东西俺不熟啊,双簧包答谢。
对了,俺是在SQL Management Studio里改。
a***h
发帖数: 29
2
来自主题: Database版 - SQL Server 中如何设置Unique字段.
SQL Server 中如何设置Unique字段.
若 *不是* 用sql语句生成table, 如何可以将某项设置Unique字段?
x**m
发帖数: 941
3
我的需求是在多个表的多个字段中进行全文查找, 像:
table1.field1 like '%keyword1%' AND table1.field1 like '%keyword2%'
OR table2.field1 like '%keyword1%'...
除了PostgreSQL的tsearch和OpenFTS, 还有没有方便点的东西?
谢谢.
z********4
发帖数: 1668
4
有48张表,每个表有一个id字段(建立了unique idex),一个value字段:
表1的字段:id, value1
表2的字段:id, value2
表3的字段,id, value3
……
表48的字段:id, value48
现在希望把这48张表根据id字段合并为一张,结构为:
id, value1, value2, value3,...,value48
问题是,每个表记录的id并不完全一样,表1中有的id表2中可能没有,反之亦然。但是
要求保留所有在48张表中出现过的id。如果这个id在表x中不存在,那么合并后的总表
中,这个id的valuex字段赋一个-1值。
例如,总表可能是这样的:
id, value1, value2, value3,...,value48
a, 1, 2, 3, ..., -1
b, 2, -1, 3, .... 3
...
另外一个问题是,每个表都非常大,记录数量在1200w左右。
数据库为postgresql,求好的解决方案。感谢!
D******6
发帖数: 6211
5
刚看见,谢谢意见!
这个办法我试过,不行,这样读数据打乱了安排,如果address字段中中间,把后面的
字段长度都读进去了,格式就乱了。
昨天晚上罗尼在古典版给的意见比较简洁好使,只在data proc 开始的时候设置
address的最长字段长度(不设置的话默认是8),然后读具体数据的时候还用我原来的
读取方式就可以了。
奇怪的是,我以前的读取方式,读英文字段多长的字节都没有问题,就是读中文字段,
超过8给就不读了。。。
A*********u
发帖数: 8976
6
我那dollar sign前面有个冒号
遇到delimiter会停的,不是一定读到200 :)

刚看见,谢谢意见!
这个办法我试过,不行,这样读数据打乱了安排,如果address字段中中间,把后面的
字段长度都读进去了,格式就乱了。
昨天晚上罗尼在古典版给的意见比较简洁好使,只在data proc 开始的时候设置
address的最长字段长度(不设置的话默认是8),然后读具体数据的时候还用我原来的
读取方式就可以了。
奇怪的是,我以前的读取方式,读英文字段多长的字节都没有问题,就是读中文字段,
超过8给就不读了。。。
o**y
发帖数: 1466
7
来自主题: Database版 - 问一个SQL LOADER BLOB的问题
我在做一个项目,要求在1个小时的窗口内,把整个数据库全部更新一次(头的要求很奇怪
,要full,不能incremental).现在的瓶颈在一个BLOB的字段上,这个字段存放一个Object
Type,object不大,BLOB的长度在100-10000之间,但有2 million rows.整个BLOB全部加
起来也不大,只有200MB左右.
我在网上找的例子用SQL LOADER 做LOB,全部是文本CLOB的例子,看不到BLOB的例子,
BLOB的例子也有,但是都是从不同的文件载入的,比如说一条记录对应一个外部文件. 这
对我来说不现实,在本地盘上装2M个文件会慢得要死.我现在的办法是把BLOB变成BASE64
,到了ORACLE里面再把BASE64 decode成BLOB,这样可以把数据搞上去,但是这个数据内解
码耽误时间,速度达不到要求,很慢.
我希望的方法是把所有记录的BLOB内容放在一个文件里,然后用LOBFILE constant指定
一个文件名,所有的记录都在这个文件里找内容,现在的问题是我不知道怎么样把各条记
录的BLOB在一个文件里分割.ORACLE DOC上说可以... 阅读全帖
m**q
发帖数: 189
8
来自主题: JobHunting版 - 问几道算法题
第一题可以用部分和的方法,先算出a[0]~a[i] (0<=i 放在数组b[]中,同时把对应的i值记录下来,就是说b数组每个元素是一个
结构,包含a[0]~a[i]的部分和以及对应的i值;然后根据部分和的值sort b数组,
用两个指针指向b数组开头,递增前指针直到前后指针指向的元素的部分和字段的
差值大于或等于MaxSum,然后递增后指针直到两指针指向元素的部分和字段的差
小于或等于MaxSum,在此过程中只要前后指针指向元素的部分和字段差值小于
等于MaxSum时就计算前后指针指向元素的i值字段的差值,并更新最大差值。
算部分和O(n), sort b数组 O(nlgn), 前后指针遍历数组b O(n),总时间O(nlgn)。
x*******9
发帖数: 138
9
1. 由于数据量比较大,肯定是需要分库的。
2. 使用列式存储,像类似于 这样的字段,可能有很多是重复的。所以
单独提出来,也会有不少的收益。
3. 同样是列式存储,对于 等变长字段,尽量避免与定长字段混合存储
,以提高检索效率。(对于变长字段的去重,效果会非常好,但是在fb这样的场景下,
是否有意义,需要数据的支持)
只想到这么多,等楼上楼下补充。向大家学习。
s***d
发帖数: 15421
10
来自主题: Stock版 - 说baba没技术的看看这篇知乎
12306首秀被骂的狗血喷头后铁道部找来IBM、阿里巴巴等大企业要解决方案,给出的条
件是资金管够但是问题得解决。几大企业最后都拒绝了(其中阿里巴巴最后负责了排队
系统的建设)。12306开始自己尝试解决问题。他们发现市面上可以买到的成套解决方
案都不足以应付春运购票负载,所以只能自己改进已有的数据库(注:其实是改用
VMware SQLFire/GemFire,这里我之前理解错误)。以前12306用的是小型机,发现性
能严重不足,遂改用x86系统+linux平台(原平台为HP Superdome小型机,UNIX系统,
Sybase ASE数据库)。最后他们的核心系统用了十几个节点(现在应该是17节点)的多
路Xeon E7(具体几路待考),每个节点配1TB内存,数据库全部在内存中运行。2013年
春运,12306系统峰值负载11万tps,与2012年淘宝双11活动峰值负载相当,新的系统基
本经受住了考验。
补充:以上内容是我在2013年7月得知的信息,彼时没有任何公开来源提到过12306新系
统的技术细节。甚至,当时局外人没人知道12306已经在2012年开始做了技术改造。直
到数日... 阅读全帖
W*******e
发帖数: 1268
11
学习学习国内的IT项目-12306铁道部订票网站性能分析【转载】
业务
任何技术都离不开业务需求,所以,要说明性能问题,首先还是想先说说业务问题。
一,有人可能把这个东西和QQ或是网游相比。
但我觉得这两者是不一样的,网游和QQ在线或是登录时访问的更多的是用户自己的数据
,而订票系统访问的是中心的票量数据,这是不一样的。不要觉得网游或是QQ能行你就
以为这是一样的。网游和QQ 的后端负载相对于电子商务的系统还是简单。
二,有人说春节期间订火车的这个事好像网站的秒杀活动。
的确很相似,但是如果你的思考不在表面的话,你会发现这也有些不一样。火车票这个
事,还有很多查询操作,查时间,查座位,查铺位,一个车次不 行,又查另一个车次
,其伴随着大量的查询操作,下单的时候需要对数据库操作。而秒杀,直接杀就好了。
另外,关于秒杀,完全可以做成只接受前N个用户的请求(完全不操作后端的任何数据
, 仅仅只是对用户的下单操作log),这种业务,只要把各个服务器的时间精确同步了
就可以了,无需在当时操作任何数据库。可以订单数够后,停止秒杀,然后批量写数据
库。火车票这个岂止是秒杀那么简单。能不能买到票得当时... 阅读全帖
f*****g
发帖数: 3086
12
来自主题: PhotoGear版 - 妮马,这谁认得
你们太土了。这些验证码叫recaptcha
一半是电脑生成的“验证码”,一半是书本上扫描下来的字段。
目的是通过让人使用验证吗,逐渐把书本上ORC不认识的字段人工识别出来。
所以呢,呵呵,扫描的那个字段你就随便说好了,电脑不会有任何异议的。
比如说你就说那个 "inu"是 tmd也能通过
当然,这其实也不会真的让你的 “tmd" 成为最终答案,除非很多人恰好跟你一样
都告诉数据库那个字段是 tmd
c*****d
发帖数: 6045
13
来自主题: Database版 - 奇怪的 SQL 问题
实验了,还是无法复制出这个问题
你能一次把你的case说明白吗?
哪几个表,哪个字段有0,index在哪几个字段上
语句中x=y是字段x = 字段y ?
c*****d
发帖数: 6045
14
来自主题: Database版 - 奇怪的 SQL 问题
实验了,还是无法复制出这个问题
你能一次把你的case说明白吗?
哪几个表,哪个字段有0,index在哪几个字段上
语句中x=y是字段x = 字段y ?
s**u
发帖数: 105
15
来自主题: Hardware版 - 配个处理access的电脑求建议
要做如下的一个任务在本地一个大约700兆的access数据库里:
A表有2百万个记录,每个记录20个字段吧;B表有50万个记录每条记录10个字段。
需要针对A表里的每个记录一个字段值在B表中查询,根据查询结果做一些日期的逻辑判
断最后更新A表中的三个字段。
现在的电脑是这个配置:i5-2400 3.1G + 20G RAM + 512 SSD
写了段VBA做上面的任务,处理提条记录需要0.12秒。整整一个周末没跑完!
如果想显著提高速度(比如提高10倍)需要一个什么样的硬件配置?软件解决方法有啥
?Python会快么?本人斧头帮出身,望班上高手不吝赐教。
s**u
发帖数: 105
16
来自主题: Hardware版 - 配个处理access的电脑求建议
要做如下的一个任务在本地一个大约700兆的access数据库里:
A表有2百万个记录,每个记录20个字段吧;B表有50万个记录每条记录10个字段。
需要针对A表里的每个记录一个字段值在B表中查询,根据查询结果做一些日期的逻辑判
断最后更新A表中的三个字段。
现在的电脑是这个配置:i5-2400 3.1G + 20G RAM + 512 SSD
写了段VBA做上面的任务,处理提条记录需要0.12秒。整整一个周末没跑完!
如果想显著提高速度(比如提高10倍)需要一个什么样的硬件配置?软件解决方法有啥
?Python会快么?本人斧头帮出身,望班上高手不吝赐教。
H*******d
发帖数: 2394
17
【 以下文字转载自 WashingtonDC 讨论区 】
发信人: Westridge (不折腾), 信区: WashingtonDC
标 题: 学习学习国内的IT项目-12306铁道部订票网站性能分析【转载】
发信站: BBS 未名空间站 (Thu Jan 17 14:48:59 2013, 美东)
学习学习国内的IT项目-12306铁道部订票网站性能分析【转载】
业务
任何技术都离不开业务需求,所以,要说明性能问题,首先还是想先说说业务问题。
一,有人可能把这个东西和QQ或是网游相比。
但我觉得这两者是不一样的,网游和QQ在线或是登录时访问的更多的是用户自己的数据
,而订票系统访问的是中心的票量数据,这是不一样的。不要觉得网游或是QQ能行你就
以为这是一样的。网游和QQ 的后端负载相对于电子商务的系统还是简单。
二,有人说春节期间订火车的这个事好像网站的秒杀活动。
的确很相似,但是如果你的思考不在表面的话,你会发现这也有些不一样。火车票这个
事,还有很多查询操作,查时间,查座位,查铺位,一个车次不 行,又查另一个车次
,其伴随着大量的查询操作,下单的时候需要对数据库操作。而秒杀,... 阅读全帖
s**s
发帖数: 242
18
b 退一个字段,
e 进一个字段,
dw 删除一个字段
cw 修改一个字段
0 到行首
$ 到行尾
d*******2
发帖数: 3045
19
来自主题: Military版 - sb中国人的最新sb行为——
命硬的eno 赞同了回答 • 1 天前
如何看待支付宝六一强制在名称后面加「宝宝」,且用户不能修改?
如何看待今天支付宝于今日给所有人的昵称后... 显示问题详情
473
赞同反对,不会显示你的姓名
Jason Ng ,有人说我老黑支付宝
麋鹿的橘子、噗噗噗、李思瑾 等人赞同
结论:这是一次拍脑袋的失败营销,但是是一次保住 KPI 的运营事件。
昨天我写了一篇文章,整理成知乎答案:
1.忙死支付宝工程师的一天
看看今天支付宝的工程师宝宝们,有多忙。
1.1 不允许更改昵称
2016 年 6 月 1 日早上,支付宝把所有用户的昵称都改成了「XXX 宝宝」,也就是,
都添加了「宝宝」二字,经测试,如果名字本身已经带了简体中文的「宝宝」,支付宝
不会再次添加。
如果用户试图更改昵称,会被系统提示,不允许更改:
你没看错,6月1日- 6月5日,用户不能更改昵称。
1.2 允许修改昵称实体
估计是被用户和自媒体骂惨了,下午支付宝允许修改昵称,但只允许修改昵称的主体,
无论你怎么修改,保存后,它都会默认加上「宝宝」二字,如下图:
1.3 一个下午回到解放前
本来还信誓旦旦不让用户修改昵... 阅读全帖
m****v
发帖数: 84
20

一般来说,应该是顶级域名一个字段,加上前面一个字段,比如说是公司的名字、网站
的名字。加起来
就是xxx.com,yyy.org这种
但是有时候,顶级域名会有两个字段,比如aaa.co.uk,bbb.edu.cn这种
l******8
发帖数: 1691
21
来自主题: JobHunting版 - 问个facebook的题目
dfs应该就可以。从c开始往下,recursive,保持一个当前字段,一点点延长,一直找
到终点,最后是w就把当前字段加入到resutls。然后从当前字段每次删除最后一个字符
,返回,即续找。最后返回results。
h******a
发帖数: 10
22
美国医生的比较详细的信息,含地理信息.
字段内容如下:
Base Data—contains these fields: fullname,First Name, Last Name, Gender,
Title, Specialty, practicename,language
Mailing Address—contains these fields: Address 1, Address 2(部分医生属于多
个practice), City, State, Zip, Latitude, and Longitude
Phone—contains this field: Phone.
(以上字段每条记录均有)
optional:education,hospital,insurance(单独一张表)(以上字段少部分医生没有).
记录总数:1049427(涵盖所有USA当前执业的医生).
更新日期:2014年5月.
说明:这些数据都是我原来网站的比较重要的数据.当初投资不少.现在升级改版,所以部
分非核心数据整理后准备出售.价格RMB8000元.淘宝交易.可提供一份sample ... 阅读全帖
W******e
发帖数: 3319
23
1。介绍
我的兴趣在研究创造性的灵感的挫折,我
觉得作为一个学生,那么作为一个教授。我想知道我怎么能
鼓励在自己的创造力,我的学生,我的同事。
政治家,工业管理,教务管理员和其他领导人
常说,创新是文明的未来至关重要,我们的
的国家,他们的公司,但在实践中,同样是这些人往往充当
如果说,创新是一个邪恶的,必须加以抑制,或至少是紧密
控制。
这篇文章的目的是:(1)一些快速检查
不寻常的创造力和相关的人格特质,
创新(2)批评管理和教育技术
惩罚或阻碍创造力。的方式来增加的生产率
创意的人很简单:给他们的资源(时间,设备,资金)
脱颖而出,他们的出路!
-------------------------------------------------- --------------------------
----
2。定义
首先,考虑创造力的定义。有创造性的人做的事情
从来没有做过的事情。特别重要的情况下,
创意,包括科学和医学方面的新知识,发现,
发明的新技术,组成优美的音乐,或分析
一种新的方式的情况下(例如,法律,哲学或历史)。
区分三种不同的特性是很重要的:
智力,创造力,和学... 阅读全帖
h******a
发帖数: 10
24
美国医生的比较详细的信息,含地理信息.
字段内容如下:
Base Data—contains these fields: fullname,First Name, Last Name, Gender,
Title, Specialty, practicename,language
Mailing Address—contains these fields: Address 1, Address 2(部分医生属于多
个practice), City, State, Zip, Latitude, and Longitude
Phone—contains this field: Phone.
(以上字段每条记录均有)
optional:education,hospital,insurance(单独一张表)(以上字段少部分医生没有).
记录总数:1049427(涵盖所有USA当前执业的医生).
更新日期:2014年5月.
说明:这些数据都是我原来网站的比较重要的数据.当初投资不少.现在升级改版,所以部
分非核心数据整理后准备出售.价格RMB8000元.淘宝交易.可提供一份sample ... 阅读全帖
a********y
发帖数: 122
25
美国检方周三逮捕了一名实验室员工,起诉他利用妻子在律所担任律师期间获得的非公
开信息进行非法交易。
31岁的中国籍公民Fei Yan被曼哈顿检方指控犯有两起证券欺诈罪和一起电信欺诈罪。
他是在波士顿地区被捕的。
据麻省理工学院(Massachusetts Institute of Technology)一位发言人说,Fei Yan曾
在麻省理工学院电子研究实验室担任博士后研究员。目前不清楚他是否仍供职于这家实
验室。
联邦检方称,在科罗拉多州矿业公司Stillwater Mining Co.被南非矿业公司Sibanye
Gold Ltd.收购前,Fei Yan通过交易Stillwater Mining Co.的期权赚得逾10万美元。
Fei Yan涉嫌从他妻子那里获悉了有关这一交易的机密信息,他妻子当时在年利达律师
事务所(Linklaters LLP)曼哈顿代表处担任律师并参与了这桩收购交易的相关工作。
年利达律师事务所一位发言人称,这位在起诉书中并未具名的律师已被停职,无法进入
该律所系统,也无法获得机密信息。这位律师尚未被逮捕。该律所称,正在协助调查。
Sibanye发言人不予置... 阅读全帖
s****a
发帖数: 6521
26
来自主题: PhotoGear版 - 求一网络编程解决办法 (转载)
【 以下文字转载自 Programming 讨论区 】
发信人: shorea (未注册用户), 信区: Programming
标 题: 求一网络编程解决办法
发信站: BBS 未名空间站 (Mon Sep 9 00:51:04 2013, 美东)
PHP里两个输入框,想在第一个输入框输完,onblur后,就查询数据库,以第一个框内
容为字段A,查询mysql得出字段B,再把字段B显在第二个输入框中。
是不是必须用Ajax才能实现? 请指教!
D******6
发帖数: 6211
27
来自主题: ChineseClassics版 - 请教一个SAS读中文数据库的问题 (转载)
但是这个字段的长度不是固定的。有的地址可能是10个汉字,有的可能是20个。所以,
我觉得应该让SAS自动读,逗号是分隔符。问题是,如果是英文字符字段,长短不一没
有问题,SAS分得清。就是中文的字段长短不同,SAS就只读8个(4个中文字符)。。。
A***g
发帖数: 158
28
来自主题: Database版 - 数据库入门知识之3(关系数据库)
关系数据库(Relational Database):一个关系数据库是由若干表
组成。在Delphi中,数据库概念对应到物理文件上是有一些不同的
。对于dBASE、FoxPro、Paradox这三种数据库系统,数据库对应于某
一个子目录,而其它类型如MSAccess、Btrieve则是指某个文件。这
是因为前者的表为单独的文件,而后者的表是聚集在一个数据库文
件中的。
表(Table):一个表就是一组相关的数据按行排列,象一张表格
一样。比如一个班所有学生的期末考试成绩,存在一个表中,每一
行对应一名学生,在这一行中,包括学生的学号、姓名以及各门
课程的成绩。
字段(Field):在表中,每一列称为一个字段。每一个字段都
有相应的描述信息,如数据类型、数据宽度等。
记录(Record):在表中,每一行称为一条记录。
索引(Index):为了加快访问数据库的速度,许多数
据库都使用索引。
d**i
发帖数: 83
29
来自主题: Database版 - 请教C++制作数据库的问题
我以前作数据文件,格式都是自己定制的。
你可以自己定义一个结构,然后一个一个结构写进DAT文件中去。
比方说一个数据文件就是一张表,表中的字段定义为一个结构。以后读取字段和存储字段
都是通过向文件中读取一个或者几个结构,写入一个或者几个结构来完成。
大致我的想法就是这样。如果是你想要的答案,并且你想详细的了解的话,我们再聊
t********k
发帖数: 808
30
来自主题: Database版 - 再一个Access问题
表1 tab1有三个字段
col11 col12 col13
1 11 111
2 22 222
3 33 333
4 44 444
5 55 555
6 66 666
有6行数据
表2 tab2有三个字段
col21 col22
a aa
b bb
c cc
有3行数据
现想建一个报表report显示tab1三个字段
数据和表2col21这列数据
怎么做?
create a report that shows tab1(col11,col12,col13)
and tab2(col21).
万分感谢!
a*******o
发帖数: 4
31
来自主题: Database版 - urgent problem about database
hi, all:
Appreciate sb who can solve this problem !
1. 解决数据库因容量过大而溢出,可将数据转储到其他硬盘或软盘上。转储文件名自动

成,可包含溢头、日期等来以示区别。
2. 原构造可打开EXCEL文件格式的数据库,现要求可打开ACCESS格式的数据库,以方便

询等操作。
3. 原数据库各字段做死,不可改变。现要求改为动态数据库。数据库中字段个数可变,

另一组毕业设计的界面重构来传入字段名等。
c*****d
发帖数: 6045
32
en, 比如说每个table都有如下类似字段,但是名字没有规则
tableA: yearAA, AmonA, dateA, otherA
tableB: yearB, monBBBB, dateBB, otherB
。。。。
tableZ: yearZ, monZZ, dateZZZ, otherZ
你想完成下面的功能
select yearAA, AmonA, dateA from tableA;
select yearB, monBBBB, dateBB from tableB;
。。。。
select yearZ, monZZ, dateZZZ from tableZ;
在information_schema.columns中有字段位置,字段名字,表名
用sql语句把他们拼起来
c*****d
发帖数: 6045
33
是的,在sqlldr之前表要存在
大部分情况下,导入之前应该知道表的每个字段的含义和数据类型
否则导入这些数据有什么用呀
一种方法是把所有字段都定义成varchar2
导入之后再说
另外一种更规范的做法
我在前面的帖子里说了
sqlldr的control file可以规定bad file
可以将导入过程中类型错误的记录存在这个文件里
这样你就知道那些行被剔除出来了
比如应该是两个字段(number, varchar2)
500 abc
结果数据文件里存的是
500abc
那么对生成的bad file修改之后
把bad file作为新的数据文件进行导入

了.
d******a
发帖数: 32122
34
来自主题: Database版 - 微软太行为艺术了
1 从sql server management studio上无法import Excel数据库。微软建议我卸掉64位
Office, 安装32位的
2 只好打开Excel,然后存成csv。结果management studio出错,说某字段被切掉。实
际是另外一个字段包含带了逗号的字符串。尽管字符串被括了起来,management
studio仍然把逗号后边的当成了下个字段。
处理带逗号内容的csv,应该早就成熟了,怎么2008版management studio仍然无法处理
c*****d
发帖数: 6045
35
来自主题: Database版 - 为啥RDBMS只用一个Index? (转载)
第一点,当然可以创建bitmap然后and/or操作。但是bitmap和btree index存储方式完
全不同,并不是所有的字段都适合bitmap。你这两个字段都不适合bitmap
第二点,“composite index一般不index单个column,浪费很大”不知道你在说什么。
composite index本来就是在两个字段上作index

cost
t********k
发帖数: 808
36
来自主题: Internet版 - 再一个Access问题
表1 tab1有三个字段
col11 col12 col13
1 11 111
2 22 222
3 33 333
4 44 444
5 55 555
6 66 666
有6行数据
表2 tab2有三个字段
col21 col22
a aa
b bb
c cc
有3行数据
现想建一个报表report显示tab1三个字段
数据和表2col21这列数据
怎么做?
create a report that shows tab1(col11,col12,col13)
and tab2(col21).
万分感谢!
h***r
发帖数: 726
37
来自主题: Linux版 - Grep 能作这个吗?
【 以下文字转载自 Unix 讨论区 】
发信人: haier (no nickname), 信区: Unix
标 题: Grep 能作这个吗?
发信站: BBS 未名空间站 (Thu May 14 17:28:28 2009), 转信
我有文本文件如下
1 200
2 199
4 198
13 190
2 180
...
可以看出已经按照第二个字段排序了。
现在我想找出 top 100 (针对第二个字段而言)
但是第一个字段的值必须大于5
我知道如果想找等于5,用grep
cat a | grep "^5\t" |head
但是对于大于5就傻眼了。
用sed行吗?怎么写script?
编一个解决不是solution, 肯定有linux/unix command吧?
thanks!
b***y
发帖数: 2799
38
☆─────────────────────────────────────☆
nkw (非死非活) 于 (Sat Jul 19 03:08:26 2008) 提到:
今天浪费很多时间在一个很简单的regex上,原来是grep没有\t (tab).有没有什么
option让这些程序使用一个统一的regex?对不常用的人要记住这些细微差别不容易。
还遇到一怪事,我的数据是三个字段以tab分割的结构,第三个日期字段很多为空字段。
xxxx{tab}yyyy{tab}12/31/2007
xxxx{tab}yyyy{tab}
xxxx{tab}yyyy{tab}11/30/2007
xxxx{tab}yyyy{tab}
当时我不知道grep的tab输入时不得不先用sed把\t换成|。
sed 's/\t/|/g' file|grep "[^|]*|[^|]*|.+" 得不到任何结果。
sed 's/\t/|/g' file|grep "[^|]*|[^|]*|[0-9]+" 就能有输出。
前一个有什么问题?
☆────────────────────────────────────
l******x
发帖数: 46
39
来自主题: Programming版 - 算法求教
算法求教
数据库中的一个table, 有a b c d e f ...等字段.现给定一个记录,要求找出该table
按如下算法得出的适应值分数大于或等于3的所有记录
适应值分数:
1。 a 相同 +1分
2. b 相同 +1分
3. c 相同 +1分
4. d 相同 +2分
5. e 相同 +0分 但不相同 -2分
想了半天,貌似只能每个字段进行比较算每个记录的适应值.不知大家有没有什么好的算
法?
由于table 中数据很多(上万),每个字段都计算分值感觉效率不高,不知道怎样做可以最
快最有效
谢谢!
s****a
发帖数: 6521
40
来自主题: Programming版 - 求一网络编程解决办法
PHP里两个输入框,想在第一个输入框输完,onblur后,就查询数据库,以第一个框内
容为字段A,查询mysql得出字段B,再把字段B显在第二个输入框中。
是不是必须用Ajax才能实现? 请指教!
s*******0
发帖数: 3461
41
我觉得 creation data for reserve 应该是it做的事情 精算这块主要是拿到这些已经
有的数据 然后再处理 算准备金 现金价值 以及偿付能力之类的 具体不是creation 应
该是processing
我的经验是 比如说每个月从it 那边拿来的数据 在access里面 或者其他的数据库软件
里面 有相关字段比如说保单号 合同号 保费 投保日期 评估日,险种编码等等
比如说如果算未满期净保费 那么就可以用PREM*(365-(评估日-生效日))/365,这个是针对一年期产品 趸交的情况 也可以区分是不是闰年之类的
根据这些信息 然后处理算准备金 未满期净保费之类的 你们那个公司 没有说明用什么
软件进行计算 这个最好了解一些 不一样的软件语句不一样
应该是一个保单号 一条记录 如果有赔付的话 在claim字段里面有显示 同时赔付掉的
话 应该在保单状态里面显示 保单终止 或者是可以多次赔付的险种 在字段里面都会有记录 这个不同公司肯定记录方法不一样了 估计面试就是问问你大概的含义
h******a
发帖数: 10
42
借宝地做个推广,希望对业内人士有帮助.
============
美国医生的比较详细的信息,含地理信息.
字段内容如下:
Base Data—contains these fields: fullname,First Name, Last Name, Gender,
Title, Specialty, practicename,language
Mailing Address—contains these fields: Address 1, Address 2(部分医生属于多
个practice), City, State, Zip, Latitude, and Longitude
Phone—contains this field: Phone.
(以上字段每条记录均有)
optional:education,hospital,insurance(单独一张表)(以上字段少部分医生没有).
记录总数:1049427(涵盖所有USA当前执业的医生).
更新日期:2014年5月.
说明:这些数据都是我原来网站的比较重要的数据.当初投资不少.现在升级改版,所以部
分非核心数据整理后... 阅读全帖
i****1
发帖数: 84
43
严飞夫妇
据温哥华港湾 肖莉综合报道:麻省理工学院(MIT)中国籍博士后严飞(Fei Yan,音译)利用哈佛毕业的妻子职务之便,从他担任律师的妻子那里获取内幕信息,非法交易获利约12万美元。昨日(3月30日),严飞在纽约被判15个月监禁和两年监视居住,并被当场收押。
据侨报、世界日报等媒体报道,严飞现年31岁,在美10年,是中国公民。他2013年在MIT获得工程博士学位,目前在MIT从事博士后研究,研究领域是量子物理学。严飞才华横溢,过去几年他作为共同作者,在《科学》等专业杂志上发表了16篇文章。
严飞与妻子王梦露(Menglu Wang,音译)结婚超过一年,王是哈佛大学法学院毕业,受此案影响她被美国公司解雇,在美的律师执照也被冻结,并已返回中国。
MIT博士利用哈佛妻子职务之便谋利
根据纽约南区联邦检察官的指控,严飞的妻子在纽约一家知名国际律师事务所工作,该律师楼从2016年8月开始参与一家公司并购的谈判工作,该并购案资金达24亿美元。检方指控,严飞在收购消息向公众公布之前,利用内幕消息进行交易,获利约9700美元。
2016年11月,南非一家矿业公司计划斥资22亿美元,收购科罗拉多... 阅读全帖
n****j
发帖数: 1708
44
来自主题: Military版 - 国内很多案子没人管
归根到底,你们是不是觉得这玩意难度很大啊?账户上多个标准、增加一个字段的事,
甚至字段都不一定要加。

发帖数: 1
45
我的密码分段分级,
比如二个字母字段,一个用于普通网站,一个用于私密网站
分级别的几个数字段组合,比如支付密码是最高级别组合不出现于其它场合,
这样,一个网站哪怕我密码完全忘了,掂量下这个网站的性质,试几次就能猜出来。
m*********2
发帖数: 748
46
看到了斑竹的置顶声明,但似乎这里最近还有不少有关法轮功的文章,所以冒昧一贴,
在此仅请斑竹谅解,这帖意在劝善救人,谢谢
更多真相, 请到真相之光俱乐部
http://www.mitbbs.com/club_bbsdoc2/everybodydeservestruth_0.htm
法轮大法是佛法
http://www.mitbbs.com/club_bbsdoc/FalunDafaistheBuddhaFa.html
http://www.minghui.org/mh/articles/2014/11/8/明慧法会-公司副总-
【字号】大 中 小
文/大陆大法弟子
【明慧网二零一四年十一月八日】
叩拜师尊!
各位同修,大家好!
我是大陆某公司董事、副总经理,九七年开始修炼法轮功,九八年加入这家公司,至今
十六年。
(一)开创稳定环境,随时随缘讲真相
师父在《世界法轮大法日讲法》中说:“很多人开始就抱着一种临时思想,拼一阵子时
间就过去了,现在发现不是这么回事。大法弟子做什么事情一定要踏踏实实的,把心放
在那去做,不要管时间,不要想那么多。你一定要尽心尽力的做好你该做的事情,那整
件事情就... 阅读全帖
h******a
发帖数: 10
47
Base Data—contains these fields: fullname,First Name, Last Name, Gender,
Title, Specialty, practicename,language
Mailing Address—contains these fields: Address 1, Address 2(部分医生属于多
个practice), City, State, Zip, Latitude, and Longitude
Phone—contains this field: Phone.
(以上字段每条记录均有)
optional:education,hospital,insurance(单独一张表)(以上字段少部分医生没有).
记录总数:1049427(涵盖所有USA当前执业的医生).
更新日期:2014年5月.
说明:本人业余时间运营一个面向北美地区的医疗健康网站,目前需要投资升级.所以仅
出售一次.价格RMB8000元.淘宝交易.可提供一份sample data供 考察.
国外类似数据库价格都是上万美元(例如http://www... 阅读全帖
r********3
发帖数: 2998
48
来自主题: JobHunting版 - 去某刚上市公司面试被赶出来了。
呵呵,一般考memory allocate等细节,可以看出这个人是工程派还是面试派的。
那个Predicate是javax.sql.rowset的interface, for all FilteredRowSet。考这道题
,就是看你真的熟悉JDBC不。熟悉JDBC的人,几乎背都可以背得出来。不熟悉的人,一
下子还很难明白题目的意思。这个题目,明显不是靠楼主算法,思维的能力,而仅仅也
是想鉴别楼主到底是工程派还是面试派。
LZ的sql方面问题不是很大,但是也不够好。首先你的课程号怎么没有年份?semester
这些。大家选课的时候,难道不考虑是哪个学期的课程吗?
其次varchar到底有多长?是varchar(10)还是varchar(4096)甚至还是long varchar?
是不是unique的?varchar在数据库里面的存储空间是固定的,所以用不好容易造成空
间浪费,而且在读数据的时候也造成Disk I/O的浪费。这个表很小,disk i/o上的浪费
可能比你实际要用的数据都还大。起码你的rowid应该用unique bigint?还有你的rowid
是auto-increm... 阅读全帖
g*****u
发帖数: 298
49
来自主题: JobHunting版 - 去某刚上市公司面试被赶出来了。
这可不见得。
首先,select count(distinct studentid)并不是只读一个column。这个是先select整
个table,然后project studentid。对于row store db,最小读取的单位是row,没有说一
次读一个column的。
其次,select count(distinct studentid)要做duplicate elimination。当studentid
没有index的时候,数据库需要做sort或者hash,速度可能比count(*)慢几百倍,尽管
select count(*)也会scan整个table或clustered index

用select count(distinct studentid)?这个只用比较一个studentid字段,而select
count(*)要比较所有字段,慢上几倍。
f*****7
发帖数: 92
50
来自主题: JobHunting版 - DP感受 (高手请绕行)
DP的定义是递归的
我们要得到原问题的最优解,就得先算出若干个子问题的最优解,然后extend到原问题
。我们不断地把大问题归结为若干个小问题,最后就是解决base case。这种思维方式
by nature就是递归的思想。----最优子结构
对于多个大问题,要解决它们所用到的子问题可能有重复。所以我们需要用cache记录
已经计算过的子问题,如果该子问题被解决过了,直接从cache中fetch子问题的解。如
果该子问题没有被解决,那么就解决这个子问题,并且将solution存在cache对应的
entry里。----重复子问题
这两个是DP的重要性质。
CLRS对于DP的算法有两种
1. Top-down recursion with memoization
这种写法就是递归,用数组保存子问题的solution。
好处在于解决某些大问题,并不需要tabulate所有的子问题的时候,我们可以节约计算
时间,类似lazy evaluation。子问题只有在需要的时候才会被计算。第二个好处是直
接从定义出发,递归结构清晰,易于调试。
坏处是递归函数需要OS维护stack frame,如果问... 阅读全帖
1 2 3 4 5 6 7 8 9 下页 末页 (共9页)