j*******1 发帖数: 425 | 1 写了一个复杂的,MS SQL Server 测试通过。先找每个员工的销售小计(sub_total), 再找区域冠军(champion),然后跟person表jion一下找两个最年轻的。
select top 2 sub_total2.*, p3.age
from ( -- get region champion
select region, max_volumn=MAX(sub_total1.total_volumn)
from ( -- get sub total of each person
select p1.personid, p1.region, sum(s1.volumn) as total_volumn
from person p1, sales s1
where p1.personid = s1.personid
group by region, p1.personid
) sub_total1
group by sub_total1.region
) cha... 阅读全帖 |
|
o****o 发帖数: 8077 | 2 might be this way:
proc sql;
create table new as
select a.*
from yourdata as a
left join (select personid, count(*) as count
from yourdata(keep=personid)
group by personid
) as b
on a.personid=b.personid
where b.count>=3
;
quit;
or a SAS way
proc freq data=yourdata noprint;
table personid/out=_freq_(where=(count>=3)
keep=personid count
|
|
j*******1 发帖数: 425 | 3 今天翻书看到SQL Server的CTE可以简化如下,但是不知道符合不符合只用
一个SQL语句的要求:
with
sub_total as
( select p.personid, p.region, sum(s.volumn) as total_volumn
from person p, sales s
where p.personid = s.personid
group by region, p.personid
),
champion as (
select region, max_volumn=MAX(total_volumn)
from sub_total
group by region
)
select top 2 s.*, age
from champion c, sub_total s, person p
where s.region=c.region
and s.total_volumn = c.max_volumn
and p.personid = s.personid
order by... 阅读全帖 |
|
d********y 发帖数: 2114 | 4 sql新手写得比较复杂。
MySQL测试通过。
select p1.personId, p1.region, p1.age, s1.volume, champion.maximum from (
select p.region, max(s.volume) as maximum from Person p JOIN Sales s on p.
personId=s.personId group by p.region) as champion join Person p1 on p1.
region=champion.region join Sales s1 on s1.personId=p1.personId where s1.
volume=champion.maximum order by p1.age ASC limit 2; |
|
o****o 发帖数: 8077 | 5 sorry , use join, not left join
"sir" is right, you should use having statement in your code in place of 'where'
proc sql;
create table new as
select a.*
from yourdata as a
join (select personid, count(*) as count
from yourdata(keep=personid)
group by personid
) as b
on a.personid=b.personid
where b.count>=3
;
quit; |
|
r****m 发帖数: 70 | 6 自己总结的一些思路,欢迎讨论
1. 需求分析,问问题,列出input, output,可以根据input, output设计API /
interface
2. 分析流程,设计use scenario, 可以用(Given, When, Then)关键词描述
eg: 取款流程
Give a person has a bank account with balance 100
When the person withdraw 30
Then the balance will be changed to 70
3. 根据use scenario设计data model
将上面例子中的名词抽取出来作为对象或属性,动作抽取作为方法
class Person{
long personId;
List accounts;
}
class BankAccount{
long accountId
double balance;
... 阅读全帖 |
|
r****m 发帖数: 70 | 7 9月份的面试,连续四天面了LGTF,准备面试的半年多时间来从本版受益匪浅,现在把
面经写出来回馈本版,希望大家把好的传统延续下去。
L偏重设计,也可能与面的组是platform有关,6个面试有三个是设计,而且涉及很多细
节,比如index,distribute hash, circule counting. 有一面是manager问项目,个
人觉得选一个自己从头到尾做过的项目,然后按我下面的6点进行准备,基本就够了。
L是有题库的,建议多刷版面和glassdoor。
G偏重coding,每一面都是coding开始,而且占很大比例,如果时间多的话可能有两个
coding,也有可能接一个design问题。
T的面试最没规律,感觉基本是面试官自己决定问什么,所以这里不怎么好做总结。
F的面试是最标准化的,两个半coding + 一个design + 半个项目介绍 (项目介绍同上
面L的), F的题目重现率比较高,看版上的题目就差不多了,design问题基本在之前版
上归纳的几个类别: 设计feed,message, search,存储,都和大数据沾边。
LFT面试官大部分是同胞,大部分同胞是... 阅读全帖 |
|
r****m 发帖数: 70 | 8 9月份的面试,连续四天面了LGTF,准备面试的半年多时间来从本版受益匪浅,现在把
面经写出来回馈本版,希望大家把好的传统延续下去。
L偏重设计,也可能与面的组是platform有关,6个面试有三个是设计,而且涉及很多细
节,比如index,distribute hash, circule counting. 有一面是manager问项目,个
人觉得选一个自己从头到尾做过的项目,然后按我下面的6点进行准备,基本就够了。
L是有题库的,建议多刷版面和glassdoor。
G偏重coding,每一面都是coding开始,而且占很大比例,如果时间多的话可能有两个
coding,也有可能接一个design问题。
T的面试最没规律,感觉基本是面试官自己决定问什么,所以这里不怎么好做总结。
F的面试是最标准化的,两个半coding + 一个design + 半个项目介绍 (项目介绍同上
面L的), F的题目重现率比较高,看版上的题目就差不多了,design问题基本在之前版
上归纳的几个类别: 设计feed,message, search,存储,都和大数据沾边。
LFT面试官大部分是同胞,大部分同胞是... 阅读全帖 |
|
m**********u 发帖数: 2 | 9 I am using SAS to deal with a huge data file with over 10 millions of
observations. “personid” is a variable. The structure of “personid” is
like, for example, xxxx2, xxxx2, xxxx2, xxxx3, xxx3, xxxx5, xxxx5, xxxx5,
xxxx6, xxxx7……., for a unique “personid”, there are several observations
as shown in the example above. I am trying to get subset that the frequency
of the unique “personid” has certain frequency, say, frequency=3, in the
case of example above, that means I want to obtain a subset: |
|
s********e 发帖数: 893 | 10 多谢楼上几位回复。实际的情况的确是meiyoutu说的这个样子。我给的例子里没有给出
每个人的ID。实际上每个人都只有5个Score。但是某一个人的5个score的ID可能是不连
续的。比如121-125的这5个score是1个人的,另一个人的5个score的ID可能是130,
135, 142,144,145.
我最后的query是先用Row_number partition by PersonID, sort by ID 给每个人的5
个score按照ID排了个序,就成这样:
ID PersonID Score RN
121 33 10 1
122 33 8 2
123 33 7 3
124 33 8 4
125 33 10 5
130 78 9 1
135 78 8 2
142 78 9 3
144 78 10 4
145 78 8 5
然后... 阅读全帖 |
|
s*******2 发帖数: 791 | 11 I use first. and last. in data step. It works well.
I will try sql later.
proc sort data=raw;
by personid;
run;
data subset (drop=count);
set raw;
by personid;
if first.personid then count=1;
else count+1;
if count<=3 then output;
proc print data=subset;
title 'Subset size is 3';
run; |
|
h**********d 发帖数: 4313 | 12 公司名就不说了,不是大公司
不过效率极高,从hr联系我到拿到offer,3周不到。。。(一个重要的原因是我一开始
就跟他说我有学校offer了,他问我prefer学校还是industry,我赶紧说当然industry
更好~)
电面1, SW director
问了interface vs abstract class, encapsulation(为啥要用,我解释了privacy,
protect data, 他似乎不是很满意。。), exception throw的overridden为什么不能
throw更多exception, SQL语句, 问文件如果不打开如何知道有多少行(我说用linux
command.... 想了以下, cat -n|tail ? 不过他没说啥貌似听到用command很满意。。
。)
后来还做了coding assesment, OO Design, 一个小时,写了7个class,用了delegate
pattern,自我感觉比较牛叉的design (LOL)
果然director 发信来说他们都很enjoy我的homework,哈哈哈(这还用说么)
电... 阅读全帖 |
|
a**********2 发帖数: 340 | 13 a. 一个Collection, 一个Collection, Person有 PersonId 和 name
, Color有colorName 和 personID
要求输出每个PersonName & colorName 组合
心想这也太简单了。。。说了3种方法,从brute force到用hashmap,最后O(n+m)
不太明白这题,求组合怎么做到O(n+m)? |
|
I*********9 发帖数: 15 | 14 I have two tables. one is person table, another is sales table. we want to
write an SQL query that returns the two youngest region champions. A region
champion is the sales person who has made the highest sales (SUM(volume)) of
all sales persons of that region.
I am think there should be two steps: - find the region champions - then
find the two youngest region champions. but how can I construct all SQL
query in one.
1. person table
personid region age;
1 ca 30
2 ca 20
5 ca 40
9 ca 35
10 ca 24
1... 阅读全帖 |
|
s**********o 发帖数: 14359 | 15 你的FACT TABLE就是
PERSONID, DEPTROLEID, MEASURES
PERSON一个DIMENSION PERSONID IS KEY
DEPT+ROLE是一个DIMENSION DEPTROLEID IS KEY
我没实践过,理论上做做,好像是这样的 |
|
s**********o 发帖数: 14359 | 16 如果是3RD NORMAL FORM,TABLE应该是这样的,数据应该是这样存放的,
JOIN一下不就完了,有什么难的
PERSON
PERSONID PNAME GENDER OTHERSTUFF
1 JOHN M PIG
2 MARY F BITCH
DEPT
DEPTID DEPTNAME HEADCOUNT OTHERSTUFF
1 HR 3 GOTOHELL
2 IT 20 USELESS
ROLE
ROLEID ROLENAME OTHRESTUFF
1 MANAGER SHOULDDIE
2 ENGINERR SITTINGDUCK
PERSON_DEPT_ROLE
PERSONID DEPTID ROLEID
1 1 1
1 2 2
1 2 1 |
|
z**********8 发帖数: 2049 | 17 SELECT RecordSourceID, [1] AS JAN, [2] AS FEB, [3] AS MAR, [4] AS APR, [5]
AS MAY, [6] AS JUN, [7] AS JUL, [8] AS AUG, [9] AS SEP, [10] AS OCT, [11] AS
NOV, [12] AS DEC
FROM
(SELECT personid, Month(DateEntered), RecordSourceID
FROM dbo.tblPerson
WHERE RecordSourceID BETWEEN 152 AND 162 AND LoginPass IS NOT NULL AND year(
DateEntered)=2013) p
pivot
(
COUNT (personid)
FOR MONTH(DATEENTERED) IN
( [1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12])
)AS pvt
结果出不来啊。
Msg 170, Level 15, Sta... 阅读全帖 |
|
z**********8 发帖数: 2049 | 18 WITH PivotData AS
(
select CalendarYear, state, personid
from [dbo].[tblImportPerson])
select CalendarYear, [2008], [2009]
from pivotData
pivot ( sum(personid) for state IN ([2008],[2009])) as p;
--Msg 102, Level 15, State 1, Line 9
Incorrect syntax near ')'.
谢谢! |
|
A*******n 发帖数: 625 | 19 为什么state是2008,2009?
sum(personid)也有点奇怪,要算多少个personid,用count吧 |
|
A*******n 发帖数: 625 | 20 try this:
select *
from (
select CalendarYear, state, personid
from [dbo].[tblImportPerson]
) as s
pivot
( count(personid)
for state in ([PA],[TX])
) as p |
|
z**********8 发帖数: 2049 | 21 我所有的数据都varchar, 也不行啊。
with pivotdata as
(
select state, year, personid
from [dbo].[Sheet2$]
)
select state, [2008], [2009]
from pivotdata
pivot(count(personid) FOR year in ([2008], [2009])) as p; |
|
发帖数: 1 | 22 【 以下文字转载自 Military 讨论区 】
发信人: SteveBannon (米大統領の首席戦略顧問), 信区: Military
标 题: 大家来看看这个金融公司的国女高管是不是学历诈骗?
发信站: BBS 未名空间站 (Fri Jan 6 09:36:05 2017, 美东)
https://www.dianrong.com/public/about#/leadership/
邝旭霞女士在金融行业和高科技领域拥有10余年的丰富经验。在加入点融网之前,曾任
职于美林证券和摩根士坦利公司的投资银行部,主要负责兼并、收购、投资和资产出售
,领导和推动了近千亿项目的实施。
早前,邝旭霞女士还曾任职于全球最大的企业软件公司甲骨文,作为核心技术团队负责
设计和开发实时在线和协作系统,并获得多个互联网科技专利。
邝旭霞女士毕业于麻省理工学院,拥有经济和计算机数学双学位,并在宾夕法尼亚大学
沃顿商学院获得工商管理硕士学位,主修金融学和战略管理。
----------
这个“计算机数学”是个什么东西?!
https://www.linkedin.com/in/xuxia-kuang-邝旭... 阅读全帖 |
|
|
|
|
|
|
发帖数: 1 | 28 http://www.bloomberg.com/research/stocks/people/person.asp?personId=40333120
Dr. Shakil Ahmed is the Founder at Princeton Alpha Management LP (now known
as Princeton Alpha). Prior to forming Princeton Alpha, Dr. Ahmed served as
the Global Head of Market Making at Citibank N.A. and served on the
Executive Committee of the Equities Division. While at Citibank, Dr. Ahmed
also served as the Global Head of Quantitative Strategies and sat on the
management committee of Citi Alternative Investments. Pr... 阅读全帖 |
|
L***s 发帖数: 9258 | 29 发信人: Mang (忙 盲 茫), 信区: TsinghuaCent
标 题: 在加拿大大学任教的清华学子
发信站: 水木社区 (Thu Sep 12 18:23:58 2013), 站内
【致谢】感谢参与编写和提供信息的以下校友:
strong IhateBS Firster
统计了清华校友在加拿大部分大学任教的情况,缺漏错误之处难免,请大家补充
分为Full Professor(正教授)、Associate Professor(副教授)和Assistant
Professor三类,
其中前两类一般具有终身教职,不含解放前的清华学子,也含有极少数已离职的人员,
只列
出,不计入统计总数。
共有在职Tenure track系列教职的共75人
---------------------------------------------------------------------------
多伦多大学 5
祖武争
Full Professor(力学和工业工程),
加拿大工程学会会长,加拿大工程院院士,加拿大机械工程师学会会长
多伦多大学机械系系主任。
美国机械工程师学会会士、... 阅读全帖 |
|
P**********c 发帖数: 3417 | 30 先把personID-->personName存成一个hash table, 然后遍历所有的color collection?
name |
|
|
|
|
|
|
|
l*******r 发帖数: 4 | 37 刘文兰,男,现就职于美国新墨西哥大学药学院,虽然“学术近亲繁殖” 在某些高校
依然存
在,但我们对这种现象也不能一棒子打死,正如某些支持“学术近亲繁殖” 的人所说
的,“这
种繁殖有利于研究团队的内部团结,增强内部稳定性”,但是,这种现象势必会造成不
公平
竞争,让一些同等竞争力的人才失去发挥才能的机会。
他的个人主页:
http://hsc.unm.edu/pharmacy/directory/index.cfm?personId=127
刘文兰,本科毕业于山东医科大学,不知道怎么3年后进入了湖南医科大学,后来与郭
迅结
婚,而郭迅是当时湘雅医学院教授、博士生导师郭兆贵的女儿,这样一来,刘文兰自然
成了
郭兆贵的女婿,所以一路顺风顺水,当上了郭兆贵的博士研究生,跟郭迅还在一个实验
室,
以后都不用回家吃饭了,家就是实验室,实验室就是他们家,这种以学校为家的精神,
真是
值得我们佩服。
让我们看看他们发表的文章,更是体现了这种近亲繁殖的团结精神:
1、发表于《中国药理学报英文版》2002年第3期的文章,雌激素通过对p38和p44/42
CCDPK
的相反作用阻止TNF—α诱导牛主动脉内... 阅读全帖 |
|
|
l*******r 发帖数: 4 | 39 刘文兰,男,现就职于美国新墨西哥大学药学院,虽然“学术近亲繁殖” 在某些高校
依然存在,但我们对这种现象也不能一棒子打死,正如某些支持“学术近亲繁殖” 的
人所说的,“这种繁殖有利于研究团队的内部团结,增强内部稳定性”,但是,这种现
象势必会造成不公平竞争,让一些同等竞争力的人才失去发挥才能的机会。
他的个人主页:
http://hsc.unm.edu/pharmacy/directory/index.cfm?personId=127
刘文兰,本科毕业于山东医科大学,不知道怎么3年后进入了湖南医科大学,后来与郭
迅结婚,而郭迅是当时湘雅医学院教授、博士生导师郭兆贵的女儿,这样一来,刘文兰
自然成了郭兆贵的女婿,所以一路顺风顺水,当上了郭兆贵的博士研究生,跟郭迅还在
一个实验室,以后都不用回家吃饭了,家就是实验室,实验室就是他们家,这种以学校
为家的精神,真是值得我们佩服。
让我们看看他们发表的文章,更是体现了这种近亲繁殖的团结精神:
1、发表于《中国药理学报英文版》2002年第3期的文章,雌激素通过对p38和p44/42
CCDPK的相反作用阻止TNF—α诱导牛主动脉内皮细胞凋亡,第一... 阅读全帖 |
|
发帖数: 1 | 40 【 以下文字转载自 Military 讨论区 】
发信人: SteveBannon (米大統領の首席戦略顧問), 信区: Military
标 题: 大家来看看这个金融公司的国女高管是不是学历诈骗?
发信站: BBS 未名空间站 (Fri Jan 6 09:36:05 2017, 美东)
https://www.dianrong.com/public/about#/leadership/
邝旭霞女士在金融行业和高科技领域拥有10余年的丰富经验。在加入点融网之前,曾任
职于美林证券和摩根士坦利公司的投资银行部,主要负责兼并、收购、投资和资产出售
,领导和推动了近千亿项目的实施。
早前,邝旭霞女士还曾任职于全球最大的企业软件公司甲骨文,作为核心技术团队负责
设计和开发实时在线和协作系统,并获得多个互联网科技专利。
邝旭霞女士毕业于麻省理工学院,拥有经济和计算机数学双学位,并在宾夕法尼亚大学
沃顿商学院获得工商管理硕士学位,主修金融学和战略管理。
----------
这个“计算机数学”是个什么东西?!
https://www.linkedin.com/in/xuxia-kuang-邝旭... 阅读全帖 |
|
|
|
|
|
|
z**********8 发帖数: 2049 | 46 如果要在一个table里面,寻找和列出,姓名相同的records,
PERSONID, FIRSTNAME, LASTNAME, EMAIL
使用self join? 急求?
我只能找出哪些名字是有duplication,但是不知道如何LIST THE
SE RECORDS WITH ITS OWN EMAIL AND PERS
ONID RESPETIVELY.
xiexie |
|
s**********o 发帖数: 14359 | 47 GROUP BY PERSONID, FIRSTNAME, LASTNAME, EMAIL
HAVING COUNT(*)>1 |
|
d****n 发帖数: 12461 | 48 select
PERSONID, FIRSTNAME, LASTNAME, EMAIL
from t_personel
where
(FIRSTNAME, LASTNAME)
in
(select FIRSTNAME, LASTNAME
from t_personel
group by FIRSTNAME, LASTNAME
having count(1)>1) |
|
|
h**k 发帖数: 662 | 50
column="personID"
class="com.company.pack1.Person"/>
错误出在 class="com.company.pack1.Person", 我如果吧person放在data package,
class="Person", it will work. 但我想map到另外一个package的Personl Class, 怎
么设置。。
谢谢了 |
|