e****9 发帖数: 316 | 1 假设有1M个字串,字串的平均长度1MB,需要对这些字串做排序。
因为字串会有变动,而且对排序速度有要求,所以基于写文件的merge sort不适用。
如果直接load到内存,至少需要1TB的内存。
之前想到的是算每个字串的hash值,然后直把hash load到内存中做树或者堆排序,这
样可以减少内存的消耗。但是一般的hash函数会改变原来的排序,所以这个地方会有问题
有没有什么比较好的排序方式? |
|
p*****b 发帖数: 291 | 2 一个array有220万个字符串。其中有一小部分字符串可能是该list中其他字串的子串(
只从左边界算)。
要求找出所有这样的串及其包含该串(只从左边界算)的长串。如何做可以效率高?
A list contains:
o123
o12345
o12378
o78675
o78o123
...
需揪出o123,及o12345和o12378但不要o78o123 |
|
|
V*********r 发帖数: 666 | 4 【 以下文字转载自 JobHunting 讨论区 】
发信人: Voigtlander (Voigtlander), 信区: JobHunting
标 题: 请教一个字串提取的问题
发信站: BBS 未名空间站 (Wed Jul 31 02:51:27 2013, 美东)
给定一个字符串集合 S = {s_1, s_2, ..., s_n}
问题:判定是否存在 S 的一个子集 S',满足:
(1) S' 至少包含 N 个元素;
(2) S' 里所有元素都有某一个共同的子串 sub;
(3) sub 长度至少为 M;
(4) 不存在满足上述 (1)-(3) 条件的另一个子集 S",使得S'是S"的子集。
输入 S、M、N,
输出一组 S'、sub —— 如果存在的话。
比如:输入
S = {'aaa0000', '1aaa111', '22aaa22', '333aaa3', '4444aab'}
N = 3
M = 3
输出:
S' = {'aaa0000', '1aaa111', '22aaa22', '333aaa3'}
sub = 'aaa'
有没有高效一些的算法? |
|
e****9 发帖数: 316 | 5 因为字串多并且可能变化,所以外排序都不可以用。
现在考虑的就是有没有可能有什么hash函数,hash之后不改变原来的排序。
就是hash("abc") < hash("bac") < hash("cab") |
|
S********I 发帖数: 618 | 6 bbs.dlut.edu.cn
那位在国内的给提供两个“特征”字串。
啥意思??用过代理检索的都知道。 |
|
l*w 发帖数: 646 | 7 应该是当你连同的时候出现的字符。
也就是login as bbs.........
那些话。出现这些表明已经连同了。
所以bbs就可以作为这个字串 |
|
Z*****Z 发帖数: 723 | 8 这样做可不可以?
假设ASCII字符,范围0-255。
假设做给字符集合c1,c2,...ck
用一个大小为256的int数组T记录当前所查找的子字符串包含给定字符的情况。
T[*] = -1;
T[ci] = 0;
用一个整数变量d记录未找到字符个数
d = k;
两个指针p,q
第1步,找到第一个符合条件的子字符串
第1.1步,找到第一个符合条件的子字符。用p从头扫描给定字串,如果不在给定字符集
合中,重复1.1。否则到1.2
第1.2步,假设p指向cj,那么T[cj]++,d--,q指向p+1
第1.3步,用q向后扫描寻找剩下的字符,每次找到一个cl,则:
if(T[cl] == 0){
d--;
}
T[cl]++
第1.4步,重复1.3直到到达所给字符串末尾(不存在那样的子串),或者d变成0(找到
第1个符合条件的子串)
记录当前子串长度L,
第2步,扫描剩下的字串,寻找更优解
第2.1步,用q继续向后扫描,每次发现cj,则T[cj]++,到2.2
第2.2步,
while(T[*p] != 1){
if(T[*p] > 1){
|
|
|
V*********r 发帖数: 666 | 10 给定一个字符串集合 S = {s_1, s_2, ..., s_n}
问题:判定是否存在 S 的一个子集 S',满足:
(1) S' 至少包含 N 个元素;
(2) S' 里所有元素都有某一个共同的子串 sub;
(3) sub 长度至少为 M;
(4) 不存在满足上述 (1)-(3) 条件的另一个子集 S",使得S'是S"的子集。
输入 S、M、N,
输出一组 S'、sub —— 如果存在的话。
比如:输入
S = {'aaa0000', '1aaa111', '22aaa22', '333aaa3', '4444aab'}
N = 3
M = 3
输出:
S' = {'aaa0000', '1aaa111', '22aaa22', '333aaa3'}
sub = 'aaa'
有没有高效一些的算法? |
|
w******t 发帖数: 16937 | 11 孜然要现磨出来的才好。
钎子要用车条。
加个字""串。
照片来了
★ Sent from iPhone App: iReader Mitbbs Lite 7.56 |
|
M**********7 发帖数: 378 | 12 首先感谢推荐以及陪同午饭的大牛哥,以及一直帮忙的美女!
本着同样帮同胞的精神回馈一下版面。
今天接到人力电话,说反馈还不错,但是很遗憾只能明年见了,不知道啥原因。
当时面试感觉挺好的,面之前就知道这个据点不怎么招人,不知道是不是这个原因。
电面两轮。
共五轮,有三轮和面试官谈的双方都很开心,其他的一轮也算中上,有一轮一般,但题
也做出来了。
所有题不是leetcode加面经覆盖过的,就是思路不怎么难的题。
不按照顺序上题
一、一道面经里面提到过讨论过,但是不太一样的。改用中文例子。
就是字符串编码解码。
编码规则是
原字串:
春节快乐喜气羊羊羊年大吉
编码为:
春节快乐喜气3x羊年大吉
两个情况下会有歧义:一个是原字串中的数字加x
之前面经提到的是用两个x转义,但是我遇到的要求是解码程序的逻辑不能改变。
此外还有压缩后前面的数字问题,比如
3羊羊羊开泰
变成33x羊开泰则解码程序会出错。
实际上这两个问题是一个问题,就是编码后源串中代表数字的字符恰好出现在数字加x
前面怎么办。
经过讨论,解决方法是将所有的领头数字编码例如:
3羊羊羊开泰
就编码成
1x33x羊开泰
要求尽量优化,也就... 阅读全帖 |
|
M**********7 发帖数: 378 | 13 首先感谢推荐以及陪同午饭的大牛哥,以及一直帮忙的美女!
本着同样帮同胞的精神回馈一下版面。
今天接到人力电话,说反馈还不错,但是很遗憾只能明年见了,不知道啥原因。
当时面试感觉挺好的,面之前就知道这个据点不怎么招人,不知道是不是这个原因。
电面两轮。
共五轮,有三轮和面试官谈的双方都很开心,其他的一轮也算中上,有一轮一般,但题
也做出来了。
所有题不是leetcode加面经覆盖过的,就是思路不怎么难的题。
不按照顺序上题
一、一道面经里面提到过讨论过,但是不太一样的。改用中文例子。
就是字符串编码解码。
编码规则是
原字串:
春节快乐喜气羊羊羊年大吉
编码为:
春节快乐喜气3x羊年大吉
两个情况下会有歧义:一个是原字串中的数字加x
之前面经提到的是用两个x转义,但是我遇到的要求是解码程序的逻辑不能改变。
此外还有压缩后前面的数字问题,比如
3羊羊羊开泰
变成33x羊开泰则解码程序会出错。
实际上这两个问题是一个问题,就是编码后源串中代表数字的字符恰好出现在数字加x
前面怎么办。
经过讨论,解决方法是将所有的领头数字编码例如:
3羊羊羊开泰
就编码成
1x33x羊开泰
要求尽量优化,也就... 阅读全帖 |
|
S***w 发帖数: 1014 | 14 二、每个字串可以编码为头尾字符和中间的字符数
例如
新春快乐万事如意
变成
新6意
实现方法给一个字典,一个字串,返回字串的编码是否在字典里面有冲突。
确认了字串是否一定在字典里;反问你怎么设计;我说如果在的话还是返回是否有冲突
,如果不在的话返回是否和现有的有冲突;认可这个设计。
确认字串长度不足3怎么办;反问你怎么设计;我说不足就是返回原串;认可这个设计。
确认思路是每个字串都可以直接得到编码,之后用这个编码字串判断冲突就可以。
实现很直接;写的时候,提到如果工作中遇到的话,一般要构建这个字典,所以可以保
留一个编码到字串的哈希表,用来直接判断。
对方听了以后让设计这个类的api。
这题目 什么意思
没看懂 :-) |
|
S***w 发帖数: 1014 | 15 二、每个字串可以编码为头尾字符和中间的字符数
例如
新春快乐万事如意
变成
新6意
实现方法给一个字典,一个字串,返回字串的编码是否在字典里面有冲突。
确认了字串是否一定在字典里;反问你怎么设计;我说如果在的话还是返回是否有冲突
,如果不在的话返回是否和现有的有冲突;认可这个设计。
确认字串长度不足3怎么办;反问你怎么设计;我说不足就是返回原串;认可这个设计。
确认思路是每个字串都可以直接得到编码,之后用这个编码字串判断冲突就可以。
实现很直接;写的时候,提到如果工作中遇到的话,一般要构建这个字典,所以可以保
留一个编码到字串的哈希表,用来直接判断。
对方听了以后让设计这个类的api。
这题目 什么意思
没看懂 :-) |
|
s*******8 发帖数: 12734 | 16 来自主题: JobHunting版 - 分享一盗题 有很多 字串, 经常要作的操作有 , 插入, 删除, 清空,
查询以某前缀字串开头的所有的字串
查询以某前缀字串开头的所有的字串的个数
查询前缀字串开头的字串的所有 可能的下一个字母
例如
[abc, abd, abe]
input ab
return [c, d, e]
要求使3个查寻操作的时间上最优, 插入, 删除, 清空,的性能表现可以牺牲
那种数据结构实现比较好。 |
|
n*******0 发帖数: 2002 | 17 只需去掉科学和宗教中和目前观察矛盾的那些字串,之后得到初始自圆其说集合,在这
些集合上随意添加无意义字串,得到的就是能够自圆其说的字串的集合的一部分。可能
存在另一些基本不包含现有科学和宗教字串的那些字串集合也可以自圆其说。所以全体
文字组成的字串集合里面能够自圆其说的那些集合个数至少和宗教与科学是相当的。 |
|
w**********g 发帖数: 3158 | 18 新华网贵阳1月25日电 39岁的维吾尔族汉子阿里木并不觉得自己是“草根英雄”。
1月13日,他登上新华社“中国网事·感动2010”年度网络人物颁奖台。领奖前一天
,他却私下问与他颇为相熟的记者:“北京能不能烤羊肉串?我想找个地方,自己烤烤
肉串。几天没摆摊,手痒了……”
整整8年,在贵州省毕节市,阿里木烤羊肉串赚钱为生,同时还用卖烤肉串攒下的1
0多万元,资助了上百名贫困学生。他的故事,使无数网民为之动容,誉之为“烤羊肉串
的‘慈善家’”。
平凡如此,却又不平凡如此,阿里木其人其事,缘何打动人心?
网络投票高居榜首——是什么让众多网民“力挺”这位新疆汉子?
“阿里木是个并不富裕的小商贩,但财富有价,爱心无价。并不富裕的阿里木用一
颗赤诚之心,支撑起最朴实也最沉甸甸的慈善事业。”——网民“郭杨阳”如此评价。
2010年底,新华社发起“中国网事·感动2010”年度人物评选。作为候选人之一,
阿里木最终获得24万多张网络投票,高居榜首。
当年9月,阿里木获评贵州省道德模范,到任刚满一个月的贵州省委书记栗战书被其
感人故事深深打动,并号召全省人民向阿里木学习。之后不到5个月的时间内,栗战书在
... 阅读全帖 |
|
F**********1 发帖数: 96 | 19 39岁的维吾尔族汉子阿里木并不觉得自己是“草根英雄”。
1月13日,他登上新华社“中国网事·感动2010”年度网络人物颁奖台。领奖前一
天,他却私下问与他颇为相熟的记者:“北京能不能烤羊肉串?我想找个地方,自己烤
烤肉串。几天没摆摊,手痒了……”
整整8年,在贵州省毕节市,阿里木烤羊肉串赚钱为生,同时还用卖烤肉串攒下的
10多万元,资助了上百名贫困学生。他的故事,使无数网民为之动容,誉之为“烤羊肉
串的"慈善家"”。
平凡如此,却又不平凡如此,阿里木其人其事,缘何打动人心?
网络投票高居榜首——是什么让众多网民“力挺”这位新疆汉子?
“阿里木是个并不富裕的小商贩,但财富有价,爱心无价。并不富裕的阿里木用一
颗赤诚之心,支撑起最朴实也最沉甸甸的慈善事业。”——网民“郭杨阳”如此评价。
2010年底,新华社发起“中国网事·感动2010”年度人物评选。作为候选人之一,
阿里木最终获得24万多张网络投票,高居榜首。
当年9月,阿里木获评贵州省道德模范,到任刚满一个月的贵州省委书记栗战书被
其感人故事深深打动,并号召全省人民向阿里木学习。之后不到5个月的时间内,栗战
书在不同地方、不同场合多次“... 阅读全帖 |
|
x*******6 发帖数: 262 | 20 二、每个字串可以编码为头尾字符和中间的字符数
例如
新春快乐万事如意
变成
新6意
实现方法给一个字典,一个字串,返回字串的编码是否在字典里面有冲突。
这个题好像当年叫i18n?
发现现在好多公司出老题
原字串:
春节快乐喜气羊羊羊年大吉
编码为:
春节快乐喜气3x羊年大吉
这个一两年前也好像也见到过,aabccc -》 a2bc3
赞面经 |
|
x*******6 发帖数: 262 | 21 二、每个字串可以编码为头尾字符和中间的字符数
例如
新春快乐万事如意
变成
新6意
实现方法给一个字典,一个字串,返回字串的编码是否在字典里面有冲突。
这个题好像当年叫i18n?
发现现在好多公司出老题
原字串:
春节快乐喜气羊羊羊年大吉
编码为:
春节快乐喜气3x羊年大吉
这个一两年前也好像也见到过,aabccc -》 a2bc3
赞面经 |
|
n*******0 发帖数: 2002 | 22 客观事实在哲学层次上是不可判定的,所以您老这么说等于什么也没有说。
关于宗教,我是这么理解的:在全体文字组成的字串的集合里面,宗教涵盖的字串数量
是很少的,科学也是。而全体文字组成的字串集合里面能够自圆其说的那些集合个数至
少和宗教与科学是相当的。考虑到宗教目前与我们观察到的事实的冲突,真正能够描述
整个宇宙基本问题的那些字串的集合即便不是科学,也绝对不会是现在已有的任何宗教。 |
|
g****t 发帖数: 31659 | 23 改成5万的话不知道可不可以这样做。
长度为L的字符串S,有L-3个满足要求的4字子串。
Let S子串的集合为f(S)
Let S最后3位的串 g(S)
加一个新字母只需要查最新的4字子串是否和L-3个相同就可以了。
这个检查似乎可以承受。
选最新字母的时候启发式,选一个x,导致g(S) + x组成的四子字串
和f(S)的平均值距离最近,不知道可以吗。
这样可以启发式的节省字母。
或者nearest neighborhood之类的选一个新字母。
回头我写个程序试试。 |
|
M*****h 发帖数: 214 | 24 李庄:大家好!我就不坐了,站着讲吧。
非常感谢,有这么一个机会站这儿,跟各位领导和老师讲讲重庆的过去。我一上楼梯就
看到了这个标题——“依法治国与重庆教训”,这个题目很好,我把它拍了下来。重庆
的教训,是惨痛的,是用生命和血的代价换来的。
在重庆时的网络受到了干扰
这两天,很多海内外媒体也都在关注着重庆、关注着李庄事件,我昨晚刚刚从重庆回京
,今天就马上赶过来,在重庆那几天,就有几十家的媒体追访,回到北京,出了首都机
场又被围追堵截跟到家里,从首都机场到家的路上,是在车上进行的搜狐微访谈直播,
他们搜狐很敬业,知道我回京,就提前到机场截住我,在车上,他们用无线网边提问、
我边回答网友提问,两天前在重庆,我也接受了新浪和腾讯的微访谈,与广大网友在线
交流,在重庆时的网络受到了干扰,好几分钟打不上去一个字,上千个问题我才回答了
20多个,如果正常,可以回答两三百个问题的。
在重庆那几天,有一个特殊现象,是什么呢?中央电视台、人民日报都去了,这是我出
狱一年多的首次中央级的媒体来采访,追到重庆、追到我住的酒店,他们扛着摄像机从
重庆下飞机到我入住的酒店,到进法院、出法院,再到机场上飞机,出首... 阅读全帖 |
|
A*********r 发帖数: 564 | 25 链表头要min,是为了计算当前子串的长度?
看你的例子:
s1 = "ADOBECODEBANCBBCAA"
s2 = "ABC"
0,3,5,9,10,12,13,14,15,16,17
刚开始依次遍历到0,3,5, hashtable为
a b c
0 3 5
计算此时的字串长度为5, 保存当前最小字串
遍历到9,10,
hashtable 依次被更新为 0 9 5 --> 10, 9, 5, 最小index变为5, 所以计算此时的
字符串长度为5,不比之前的更小,不用更新最小字串
继续遍历到12, hashtable 变为 10, 9, 12, 更新长度为3
继续遍历到13, hashtable变为 10,13,12,长度一样,不更新
继续遍历到14,15,16,17, hashtable依次变为
10, 14, 12 -> 10, 15, 12 -> 16, 15, 12 -> 17, 15 , 12
长度都没有被更新。。
唯一的问题就是在hashtable中,计算当前字串长的问题,貌似直接算的话需要O(m).
如果在链表头保留了当前hashtable中最小ind |
|
d********y 发帖数: 2114 | 26 用KMP的next table
1.计算KMP的next table。这个是O(n)
2.如果有重复字符串组成,用输入字符串长度减去next table的最后一个值再减1,得
到重复字串的长度。
3.验证此子串长度大于1,子串最后一个字符和输入字符串最后一个字符相等,字符串
长度可以整除字串长度。
假设计算出的子串长度为p。根据next table的定义,对于0 <= i < i+p <= s.Length
- 1, s[i] = s[i + p]。这就是一个周期函数的表达式。 |
|
c****t 发帖数: 19049 | 27 第七十三章 无妨
单以毒术而论,除了下落不知的燕顶,还有谁强得多琥珀?花小飞也不行,宋阳更差得
远。
琥珀的声音低沉:“我受了伤,动不了武,但下毒的本事总算还在。”说完,她看
了阿九一眼,淡淡道:“就这样吧。”
阿九不敢再多说什么,转回身又去指挥战阵……
北门附近鏖战不休,琥珀却坐得很稳,周围打得再怎么凶狠都无所谓,她要做的事
情很简单:等。
僧兵、护法、回鹘战士全都加入战团,拼出性命去阻挡燕军的疯狂反扑;胡大人、
二傻萧琪等等这些不能打的,则聚集在国师身边,脸色苍白目光惊慌。苏杭也不例外,
她害怕。归根结底也还是个普通女人,置身于战场核心,眼中血肉横飞、耳中惨叫哀嚎
,又有谁能不动容。
不过害怕也没能耽误苏杭的好奇,蹲到琥珀跟前:“你在等宋阳?”
琥珀点点头,反问:“你喜欢宋阳?”
苏杭毫不犹豫:“这个世上我就喜欢他。”
琥珀笑了:“那我也喜欢你。”
苏杭的眸子亮晶晶的,上下打量着国师,片刻后露出个笑容,灿然而妩媚:“你要
总能帮他,我就会喜欢你。”
琥珀、苏杭,一个全身笼在罩子下显得神秘恐怖,一个奇装异服身体还在轻轻打颤
,但语气带笑低语不休,两个妖精聊得挺融洽。
可一旁指挥僧兵的... 阅读全帖 |
|
c****t 发帖数: 19049 | 28 第七十三章 无妨
单以毒术而论,除了下落不知的燕顶,还有谁强得多琥珀?花小飞也不行,宋阳更差得
远。
琥珀的声音低沉:“我受了伤,动不了武,但下毒的本事总算还在。”说完,她看
了阿九一眼,淡淡道:“就这样吧。”
阿九不敢再多说什么,转回身又去指挥战阵……
北门附近鏖战不休,琥珀却坐得很稳,周围打得再怎么凶狠都无所谓,她要做的事
情很简单:等。
僧兵、护法、回鹘战士全都加入战团,拼出性命去阻挡燕军的疯狂反扑;胡大人、
二傻萧琪等等这些不能打的,则聚集在国师身边,脸色苍白目光惊慌。苏杭也不例外,
她害怕。归根结底也还是个普通女人,置身于战场核心,眼中血肉横飞、耳中惨叫哀嚎
,又有谁能不动容。
不过害怕也没能耽误苏杭的好奇,蹲到琥珀跟前:“你在等宋阳?”
琥珀点点头,反问:“你喜欢宋阳?”
苏杭毫不犹豫:“这个世上我就喜欢他。”
琥珀笑了:“那我也喜欢你。”
苏杭的眸子亮晶晶的,上下打量着国师,片刻后露出个笑容,灿然而妩媚:“你要
总能帮他,我就会喜欢你。”
琥珀、苏杭,一个全身笼在罩子下显得神秘恐怖,一个奇装异服身体还在轻轻打颤
,但语气带笑低语不休,两个妖精聊得挺融洽。
可一旁指挥僧兵的... 阅读全帖 |
|
|
|
e****9 发帖数: 316 | 31 用hash的目的是缩减所需要的存储
比如下面的字串长度可能是1000生成long的hash只要8 bytes.
abcd....
但是同时还要用这些字串来排序,hash之后排序完全没有了。
现在就想要没有一个算法,既可对原来的字串做某种压缩,并且压缩之后的不改变原来
的排序顺序。 |
|
w****c 发帖数: 2667 | 32 来自主题: JobHunting版 - 一道算法题 有没有哪位大牛给点思路?Radix tree? Prefix tree?
现有三到五百万的英文词组字典(phrases)。
系统中有大量的用户会输入查询字串,每个查询字串中可能含有零个或多个词组, 现
在,需要实时地匹配查询字串中的所有词组。 |
|
d*k 发帖数: 207 | 33 说一个思路,适合k很小或者char的取值范围很小时候。预处理把所有长度为k的string
和B的距离算出来放到hash table里面。顺序扫描一遍A,对于每个遇到的字串,在hash
table里直接获得它和B的距离。
普通的hash table算一个字串的hash需要O(k)的时间,这样总体和暴力解法一样。因此
需要自己设计hash。很多rolling hash(http://en.wikipedia.org/wiki/Rolling_hash)都可以满足。这样计算第一个字串的hash需要O(k)的时间,后面每一个只需O(1)的时间。
若char的取值个数是O(v),则预处理时间是O(v^k),之后扫描的时间是O(n)。
如A |
|
M*******p 发帖数: 18 | 34 来自主题: JobHunting版 - 分享一盗题 好
:有很多 字串, 经常要作的操作有 , 插入, 删除, 清空,
:查询以某前缀字串开头的所有的字串 |
|
a*o 发帖数: 25262 | 35 【 以下文字转载自 WaterWorld 讨论区 】
发信人: chiwawa (Takoyaki - 章鱼小丸子), 信区: WaterWorld
标 题: 你看過金庸小說嗎?
发信站: BBS 未名空间站 (Wed Apr 6 11:38:17 2011, 美东)
你看過金庸小說嗎?
一位中年人問年輕人:「你有看過金庸的小說嗎?」
年輕人說:「沒有,只有看過電視劇。」
中年人說:「那你知道金庸寫的14部小說的書名的第一個字,串起來會成為一首詩:
『飛雪連天射白鹿,笑書神俠倚碧鴛』嗎?」
年輕人說:「嗯…不知道,但是我有看羅琳(哈利波特作者)的小說,你知道這七本小
說書名的第一個字串起來是 什麼嗎?」
中年人:嗯…不知道耶
.
.
.
.
.
.
.
.
.
.
年輕人:哦,她寫的七本小說書名的第一個字串起來是
『哈哈哈哈哈哈哈』! |
|
c*****a 发帖数: 1577 | 36 你看過金庸小說嗎?
一位中年人問年輕人:「你有看過金庸的小說嗎?」
年輕人說:「沒有,只有看過電視劇。」
中年人說:「那你知道金庸寫的14部小說的書名的第一個字,串起來會成為一首詩:
『飛雪連天射白鹿,笑書神俠倚碧鴛』嗎?」
年輕人說:「嗯…不知道,但是我有看羅琳(哈利波特作者)的小說,你知道這七本小
說書名的第一個字串起來是 什麼嗎?」
中年人:嗯…不知道耶
.
.
.
.
.
.
.
.
.
.
年輕人:哦,她寫的七本小說書名的第一個字串起來是
『哈哈哈哈哈哈哈』! |
|
y******g 发帖数: 21 | 37 十一· 小聪明
建文不假思索地将破译了的按键记录电邮给方庸。
第二天早上,方庸在公司查阅私人电子邮件的时候,看到建文的电邮。奇怪的
是,内容是一连串的字串符号,对方甚么也没有交待。方庸当然感到奇怪,不过,
富有经验的他一看便猜到这些字串符号是中文输入码按键,于是在文书处理器上认
真地照着电邮内容按键。
只是,现在是早上,同事们开始相继返回公司。为免被人家看见自己在做与工
作上无关的东西,方庸将那些字串复制及贴上在一个正文编辑程式,再慢慢地将内
容解码,他的举动倒是显得偷偷摸摸。
花了约一个小时,方庸终于将内容解码:
※ ※ ※
「琼,你好。现在我没甚么做,只是闲着上线。你呢?」
「是啊,刚才和逸谦一起到金龙船吃晚餐。 ^^ 」
「方庸很好,我们每星期仍会见面两次,在星期三和星期六。」
「甚么不公平?人家很忙嘛!我早上上班时会致电和他聊聊天。」
「如果可以选择,我宁愿一直保持现状。 :o 」
「其实,逸谦的性格较灰暗悲观,凡事总是向坏的一面想;和方庸一起虽然快
乐,不过平日只能到便宜的餐厅用膳,没有甚么特别娱乐。」
「你知道吗?逸谦现正住在一间大型豪宅,他还提议我到那儿居 |
|
O**y 发帖数: 666 | 38 1。升级后程序总是无故退出,很多程序都这样。后来干脆格盘重来,这个问题好像没
了。
2。Nikon ViewNX出现一个很有趣的现象,那些菜单,按纽,字串都不显示真正的字串
了。所有菜单,按纽,字串都变成了IDS_MENU_xyz/IDS_BUTTON_xyz这样的东西,格盘
重来后还是一样。 |
|
w****c 发帖数: 2667 | 39 【 以下文字转载自 JobHunting 讨论区 】
发信人: wormcc (虫虫), 信区: JobHunting
标 题: 一道算法题
发信站: BBS 未名空间站 (Sun Feb 17 20:24:30 2013, 美东)
有没有哪位大牛给点思路?Radix tree? Prefix tree?
现有三到五百万的英文词组字典(phrases)。
系统中有大量的用户会输入查询字串,每个查询字串中可能含有零个或多个词组, 现
在,需要实时地匹配查询字串中的所有词组。 |
|
w****c 发帖数: 2667 | 40 【 以下文字转载自 JobHunting 讨论区 】
发信人: wormcc (虫虫), 信区: JobHunting
标 题: 一道算法题
发信站: BBS 未名空间站 (Sun Feb 17 20:24:30 2013, 美东)
有没有哪位大牛给点思路?Radix tree? Prefix tree?
现有三到五百万的英文词组字典(phrases)。
系统中有大量的用户会输入查询字串,每个查询字串中可能含有零个或多个词组, 现
在,需要实时地匹配查询字串中的所有词组。 |
|
t*****o 发帖数: 4919 | 41 烤的时候撒孜然辣椒面没错, 但是还是要用盐腌。
教你正宗新疆烤羊肉串的做法
今天让你见识一下什么才是正宗的新疆烤羊肉串--《正宗新疆烤肉制作密籍》。
有人在胡乱歪曲新疆烤肉,其实那说的是黑心商贩的欺诈行为。
实在看不过眼,一气之下,今天破例透露一下正宗的新疆伊犁烤肉烹制密籍(一般
是不外传的)。
新疆各地的烤羊肉,风味各有不同,我都吃过来了,其实最正宗的还是伊犁烤肉。
注意:伊犁,是指新疆伊犁哈萨克自治州,而不是内蒙古的那个“伊利”,别搞混
了。
一、选伊犁哈克萨羊肉若干公斤,肥瘦比例为1:3,切成麻将大小的块;
要点1:产自伊犁大草的哈萨克羊,都是吃野草、喝泉水长大的,从来不知道什么
叫人工饲料,甚至从小长到大都从没见过粮食,与野生动物无异,故其肉质异常鲜嫩,
绝无内地羊肉的那种膻味儿;
要点2:用其它地方的羊肉做烤肉,一般都要选全瘦肉,因为肥肉又腻又膻。因这
里选用的是伊犁哈萨克羊,就可以有一定比例的肥肉,这样味道会更加鲜美;
要点3:肉一定要切成麻将大小的块,记住,是方块,不是肉片,这一点很重要。
我吃过南疆、乌鲁木齐的烤肉,看起来挺大,其实都是炒菜用的那种薄肉片,上火一烤
水分... 阅读全帖 |
|
M**********7 发帖数: 378 | 42 再举个例子说明
比如字串是
恭喜发财红包拿来
第一个字 恭
最后一个字 来
中间夹6个字
所以编码后就是
恭6来
如果字典是:
恭喜发财红包拿来
恭贺新禧好运常来
而字串是
恭喜发财红包拿来
则返回冲突,因为 恭贺新禧好运常来 的编码也是 恭6来
计。 |
|
M**********7 发帖数: 378 | 43 再举个例子说明
比如字串是
恭喜发财红包拿来
第一个字 恭
最后一个字 来
中间夹6个字
所以编码后就是
恭6来
如果字典是:
恭喜发财红包拿来
恭贺新禧好运常来
而字串是
恭喜发财红包拿来
则返回冲突,因为 恭贺新禧好运常来 的编码也是 恭6来
计。 |
|
j*****a 发帖数: 489 | 44 触景生情(2) (2013-10-27 22:12:54)
我昨天在中文学校刚做了分享: 把那些开学时候齐刷刷地说:I hate Chinese. 变成了
为他们喜不喜欢中文? 一口同声的说:喜欢.
quit了中学文学习的家长, 现在在考虑要重新开始学习中文.
我用了情景教学法.
我给女儿的学习, 粗看, 是东一点西一点, 可是, 因为我自己对文字有感觉, 后来会串
起来. 学的字是她愿意的, 记忆起来轻松很多. 我把她愿意学的字组合起来学习, 效果
还不错. 老公会怪我, 有现成的教材, 你干嘛要花这工夫? 我的工夫在几年前早就花了
, 对我来说, 不累的.
比如, 五月份, 后院种了女儿选择的樱桃树, 那天, 她要我教她樱桃. 我教了樱桃, 还
有婴儿. 她狂喜欢小兔兔. 我后来就用了一句话,把相近的字串在了一起:小兔子跳起来
挑了一个桃子逃走了. 也许, 这个方法不太好,可是, 我教她写桃跳桃挑的时候, 她很
容易就都记住了. 最后,我就把这些字写成一句话.
我把这件事放在讨论中分享了, 受到了来自本地州大中文教育的专家的肯定, 他说在学
习过程里一定要让孩子参与, 不要让孩子... 阅读全帖 |
|
j*****a 发帖数: 489 | 45 触景生情(2) (2013-10-27 22:12:54)
我昨天在中文学校刚做了分享: 把那些开学时候齐刷刷地说:I hate Chinese. 变成了
为他们喜不喜欢中文? 一口同声的说:喜欢.
quit了中学文学习的家长, 现在在考虑要重新开始学习中文.
我用了情景教学法.
我给女儿的学习, 粗看, 是东一点西一点, 可是, 因为我自己对文字有感觉, 后来会串
起来. 学的字是她愿意的, 记忆起来轻松很多. 我把她愿意学的字组合起来学习, 效果
还不错. 老公会怪我, 有现成的教材, 你干嘛要花这工夫? 我的工夫在几年前早就花了
, 对我来说, 不累的.
比如, 五月份, 后院种了女儿选择的樱桃树, 那天, 她要我教她樱桃. 我教了樱桃, 还
有婴儿. 她狂喜欢小兔兔. 我后来就用了一句话,把相近的字串在了一起:小兔子跳起来
挑了一个桃子逃走了. 也许, 这个方法不太好,可是, 我教她写桃跳桃挑的时候, 她很
容易就都记住了. 最后,我就把这些字写成一句话.
我把这件事放在讨论中分享了, 受到了来自本地州大中文教育的专家的肯定, 他说在学
习过程里一定要让孩子参与, 不要让孩子... 阅读全帖 |
|
p*****e 发帖数: 16417 | 46 生于70,80 ,成长于90,00的我们,远离硝烟,不曾见战场;然而我们对军人的形象并
不陌生,军队的故事我们也有耳闻。让我们借着夏末微凉的风,在莺啼虫鸣的日子里聊
聊亲身经历的或是听说来的和军队军人有关的故事吧。
Memory版征文活动方案
1,大家随便聊聊和军队有关的故事,可以是道听途说,可以是亲身体验(比如军训)
;
2,晓古通今的文豪,可以给大家介绍一位将军,描述一场战斗。选材有典可据,须翻
译成白话文,最好还有自己的见解评述;
3,有超前预见力的占卜士,请天马行空的预见一下未来的军队,未来的战争;
4,总之,大家随便聊点儿东西,只要和军旅挂得上边即可;
5,活动暂定即日起至8月31日止。
活动要求
1,字数不能太少,起码300字(恍惚记得小学3年纪就要求300字了,这个要求不高吧);
2,一个ID可多次参与活动,但每篇文章必须是全新的话题;同一话题每篇字数超过1,
500可连载,算新文章;
3,为方便版务mark,版友阅读。征文请用【Memory征文】开头开帖,小标题请另加,如
不想上十大可在征文标题前加入[bssd] 字串符(如想上十大可加入[dssd]字串符);
活动奖 |
|
l*****f 发帖数: 13466 | 47 【 以下文字转载自 TVChinese 讨论区 】
发信人: xjack (xjack), 信区: TVChinese
标 题: Re: 从肉串看网上大妈如何冷嘲热讽,胡批新版红楼梦
发信站: BBS 未名空间站 (Wed Jul 14 18:18:27 2010, 美东)
其实庵字错了,按庚辰本,这个字写作广,这是个象形字,和被简化成广的廣是两个字
。这个字就读眼,意思是靠近山崖而作成的房子。《说文》:广,因崖为屋。唐朝韩愈
《陪杜侍御游湘西两寺》诗里有:剖竹走泉源,开廊架崖广。 |
|
z*y 发帖数: 1311 | 48 你用两个字符的串就可以看出端倪了
p[0]指整个字串,*p[0]是这个字串的第一个字符
其它数组也是一样,见例程
#include
main()
{
char *p[3]={"ab", "c", "d"};
printf("%s\n", p[0]);
printf("%c\n", *p[0]);
int a[] = {0, 1, 2};
printf("%d\n", *a);
} |
|
l******l 发帖数: 2651 | 49 Source:
Dec. 5th, 2010
http://www.singtaousa.com/
批韓寒《保住非法字元》的謬誤
當虛情加假意遇上淺薄
( 梁建鋒 )
編者按:續昨日中國年輕作家韓寒於九月撰寫博文評論釣魚台事件,本文作者依其原文
作點評。
都是中國政府害的嗎?
又,韓說本來問題不複雜,是中國領導人拖長了時間而變得複雜。這說法幼稚得可笑,
也令人憤怒!釣島問題從一開始就相當複雜。二戰結束,國共隨即展開內戰,此時美軍
單方面宣布將琉球群島及釣魚台等水域劃歸美國直接軍管。五十年代的中國可以向美國
怎麼樣?七十年代初的中國大陸國力薄弱──可也奮力打過幾場非戰不可的國土保衛戰
,下文再談──,台灣則仍需仰「美」鼻息,我們可以怎麼樣?釣魚島問題一直解決不
了,是簡單地因中國官方不處理嗎?
再說五十年代,當時韓戰爆發,幾十萬中國志願軍在朝鮮半島與美軍殺個你死我活,而
釣魚島其時正由美國琉球政府管理,這問題簡單嗎?是中國政府怕事不願冒外交和軍事
風險嗎?韓才子是否知道六十年代末中蘇交惡,六九年發生珍寶島軍事衝突;中國同時
又支援北越對抗美軍,美第七艦隊駐防台灣海峽以示回應。在歷... 阅读全帖 |
|