由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 保险公司建模问题
相关主题
遇到这样的regression问题model和variables都sig.但每个category都不sig
请教大家这个数据应该用什么统计模型统计课题弱问, 包子感谢.
急问,有学金融的吗?做loss forecasting大概需要什么知识,on[合集] 请教一个有关logistic regression的问题
regression problem - go confusedHow to the macro regression with if?
紧急求助,问到MULTIPLE REGRESSION的题问一个和regression analysis有关的问题
a question请教 sas regression 问题
SAS Regression Macro 问题请教 (有包子)请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD
sampling weight variable怎么用到linear regression里啊?linear regression 问题请教
相关话题的讨论汇总
话题: loss话题: insurance话题: claim话题: regression话题: model
进入Statistics版参与讨论
1 (共1页)
f**********t
发帖数: 1001
1
今天面了个保险公司实习,问到一个建模问题,没做过,答得好烂。。。
应该还是很基本的,就是根据customer's claim和auto insurance loss来设
计一个predictive model
厄。。。自己先抛砖引玉,说下我的烂回答吧。
我的理解是,insurance loss和customer的一些feature有关,比如age,
gender, married, salary, etc. 然后设法找出这些feature和未来可能发生
accident概率的关系。比如可以用regression。另外一点是有些feature比较重
要,有些比较次要。通过regression的coefficient能看出来。
欢迎大家指点。。。PS,有没有值得推荐的书或者handout或者link?感觉原理可能
都学过,就不知道怎么用。非常感谢!
k*******a
发帖数: 772
2
我觉得和customer没啥关系把,应该和accident的性质有关
比如谁的责任,车的型号,车的年代,车的损坏程度等等

【在 f**********t 的大作中提到】
: 今天面了个保险公司实习,问到一个建模问题,没做过,答得好烂。。。
: 应该还是很基本的,就是根据customer's claim和auto insurance loss来设
: 计一个predictive model
: 厄。。。自己先抛砖引玉,说下我的烂回答吧。
: 我的理解是,insurance loss和customer的一些feature有关,比如age,
: gender, married, salary, etc. 然后设法找出这些feature和未来可能发生
: accident概率的关系。比如可以用regression。另外一点是有些feature比较重
: 要,有些比较次要。通过regression的coefficient能看出来。
: 欢迎大家指点。。。PS,有没有值得推荐的书或者handout或者link?感觉原理可能
: 都学过,就不知道怎么用。非常感谢!

s*********e
发帖数: 1051
3
this shouldn't be a simple regression. instead, the best one should be a
tweedie model, which is a composite model. for instance, when claim = 0,
then loss = 0. when claim > 0, then loss > 0.
this type of model is very complex and might be beyond most people's skill.
y*****n
发帖数: 5016
4
what is the target variable? auto insurance loss? you got to make it clear
first.
second, if auto insurance loss is the target, then are you going to make it
a continuous variable (i.e. amount of loss) or a binary variable(i.e. loss
or no loss)?
third...
fourth...
anyway, in an interview, asking for clarification is the first reaction you
should have when a question is asked. this will help you answer the question
in the right track and more importantly, how you ask for clarification will
demonstrate you knowledge and potential...
y*****n
发帖数: 5016
5
再补充两句。
很多新人在面试的时候很紧张。总以为对方一个问题出来就马上扒拉扒拉地回答是最好
的。其实这是最糟糕的。我在面试的时候如果对方没有要求我补充或澄清任何东西的情
况就不停地说的话,我马上就知道对方不懂这个东西或者缺乏经验了。。相反,他/她
如果先反问我一些问题,比如说target 是interval还是binary…工具有什么,数据的
范围是什么,methodology 上有什么preference…等等,我就知道他/她对这个东西起
码是有所了解的。。。
f**********t
发帖数: 1001
6
谢谢。收益很深!

最好
的情
他/她
么,数据的
个东西起

【在 y*****n 的大作中提到】
: 再补充两句。
: 很多新人在面试的时候很紧张。总以为对方一个问题出来就马上扒拉扒拉地回答是最好
: 的。其实这是最糟糕的。我在面试的时候如果对方没有要求我补充或澄清任何东西的情
: 况就不停地说的话,我马上就知道对方不懂这个东西或者缺乏经验了。。相反,他/她
: 如果先反问我一些问题,比如说target 是interval还是binary…工具有什么,数据的
: 范围是什么,methodology 上有什么preference…等等,我就知道他/她对这个东西起
: 码是有所了解的。。。

y*****n
发帖数: 5016
7
顺便问一下面试的是哪家保险公司?不要告诉我是state farm...

【在 f**********t 的大作中提到】
: 谢谢。收益很深!
:
: 最好
: 的情
: 他/她
: 么,数据的
: 个东西起

N****n
发帖数: 1208
8
难道你是STATE FARM的?
我托一位朋友帮我套套SF,至今没消息,哎 ~~~

【在 y*****n 的大作中提到】
: 顺便问一下面试的是哪家保险公司?不要告诉我是state farm...
f**********t
发帖数: 1001
9
traveler

【在 y*****n 的大作中提到】
: 顺便问一下面试的是哪家保险公司?不要告诉我是state farm...
P****l
发帖数: 156
10
MM加油~~~~
她家面试第一轮好像是只要听的懂你说啥
就给下一轮
相关主题
a questionmodel和variables都sig.但每个category都不sig
SAS Regression Macro 问题请教 (有包子)统计课题弱问, 包子感谢.
sampling weight variable怎么用到linear regression里啊?[合集] 请教一个有关logistic regression的问题
进入Statistics版参与讨论
y****n
发帖数: 11
11
MM 的学校应该很牛吧,这么早就拿到interview了。

【在 f**********t 的大作中提到】
: traveler
f**********t
发帖数: 1001
12
我是面实习,还没投他家的正式工作呢。呵呵,还担心实习挂了的话正式工作也没得申
请了。
并且那个是电面,不知道算不算一面?
f**********t
发帖数: 1001
13
其实让我比较不解的是,这个model的目的是什么?要预测什么?可能是我对保险
业不懂的原因……已知target value是insurance loss。
我的猜测是根据现有的customer信息以及他们的insurance loss数据来建一个
model。一般来说保险公司都用decision tree。我们把customer信息都分成若
干个categorical,比如年龄分成不同的年龄段,GPA分成不同的段。然后
insurance loss也分成不同的段。根据这些已有数据,用decision tree学出
规则。
然后我的猜测是,我们希望看到新的customer后,根据他们的信息和建好的
decision tree来预测insurance loss,然后决定收他们多少保险。(此处是
我最不确定的地方)
另外还有个问题是claim data在这里有啥作用?不太懂claim。理解就是顾客告
诉保险公司出了事故,要求索赔。
打算看下传说中的tweedie model。呵呵。
还望各位指教!

来设
发生
较重
可能

【在 f**********t 的大作中提到】
: 今天面了个保险公司实习,问到一个建模问题,没做过,答得好烂。。。
: 应该还是很基本的,就是根据customer's claim和auto insurance loss来设
: 计一个predictive model
: 厄。。。自己先抛砖引玉,说下我的烂回答吧。
: 我的理解是,insurance loss和customer的一些feature有关,比如age,
: gender, married, salary, etc. 然后设法找出这些feature和未来可能发生
: accident概率的关系。比如可以用regression。另外一点是有些feature比较重
: 要,有些比较次要。通过regression的coefficient能看出来。
: 欢迎大家指点。。。PS,有没有值得推荐的书或者handout或者link?感觉原理可能
: 都学过,就不知道怎么用。非常感谢!

T****n
发帖数: 2195
14
如果是做车保险问题的话,能不能回忆一下你的车买保险的时候,上网填表的几个步骤
,最后生成你的INSURANCE价钱的过程?记得有年龄,婚姻状态,车型,车颜色,以前
事故发生否,地点,房子是买的还是租的,每月固定收入,etc。
应该就是那几个重要的VARIABLE吧,至于算法和模型,每个公司应该都大同小异吧。

【在 f**********t 的大作中提到】
: 其实让我比较不解的是,这个model的目的是什么?要预测什么?可能是我对保险
: 业不懂的原因……已知target value是insurance loss。
: 我的猜测是根据现有的customer信息以及他们的insurance loss数据来建一个
: model。一般来说保险公司都用decision tree。我们把customer信息都分成若
: 干个categorical,比如年龄分成不同的年龄段,GPA分成不同的段。然后
: insurance loss也分成不同的段。根据这些已有数据,用decision tree学出
: 规则。
: 然后我的猜测是,我们希望看到新的customer后,根据他们的信息和建好的
: decision tree来预测insurance loss,然后决定收他们多少保险。(此处是
: 我最不确定的地方)

f**********t
发帖数: 1001
15
嗯。这几个变量讲得很详细。谢谢 :)

步骤
色,以前
吧。

【在 T****n 的大作中提到】
: 如果是做车保险问题的话,能不能回忆一下你的车买保险的时候,上网填表的几个步骤
: ,最后生成你的INSURANCE价钱的过程?记得有年龄,婚姻状态,车型,车颜色,以前
: 事故发生否,地点,房子是买的还是租的,每月固定收入,etc。
: 应该就是那几个重要的VARIABLE吧,至于算法和模型,每个公司应该都大同小异吧。

l*********s
发帖数: 5409
16
good suggestion

【在 T****n 的大作中提到】
: 如果是做车保险问题的话,能不能回忆一下你的车买保险的时候,上网填表的几个步骤
: ,最后生成你的INSURANCE价钱的过程?记得有年龄,婚姻状态,车型,车颜色,以前
: 事故发生否,地点,房子是买的还是租的,每月固定收入,etc。
: 应该就是那几个重要的VARIABLE吧,至于算法和模型,每个公司应该都大同小异吧。

y*****n
发帖数: 5016
17
综合回答一下楼主的几个问题。
Claim data 当然很重要。建模预测insurance loss 是为了什么?是为了根据预测到的
insurance loss 的数额来决定对各个顾客的pricing (当然,最极端的就是拒保)。
所以这就是为什么我在前面说到你必须反问面试你的人这个insurance loss到底是个
continuous variable 还是个binary target. 因为我认为更可能是前者。如果是前者
,那么建模的方法就不大可能是decision tree 或logistic regression, 反倒有可能
是ols regression 一类的。。。好了,再回到为什么要有claim data的问题,保险模
型定价的对象无非是3类,一是以前从没有投过保,二是已经在本公司投保但是要renew
的,三是过去在别的公司投保但是现在要转来本公司的。除了第一类没有claim
history, 其他两类都是有的。而在过去的term(s) 里claim次数的多少是直接跟现在和
将来的insurance loss 是相关的。注意,虽然 claim 一般是发生了事故,但并不等于
事故,有些人有些时候发生了事故并没有向保险公司claim, 而有些人有些时候发现车
子有未明原因的损伤也会file claim. 所以,claim不光是部分地反映了事故的多少,
而且还反映了该顾客是否喜欢让保险公司赔钱。。。
l***a
发帖数: 12410
18
informative

renew

【在 y*****n 的大作中提到】
: 综合回答一下楼主的几个问题。
: Claim data 当然很重要。建模预测insurance loss 是为了什么?是为了根据预测到的
: insurance loss 的数额来决定对各个顾客的pricing (当然,最极端的就是拒保)。
: 所以这就是为什么我在前面说到你必须反问面试你的人这个insurance loss到底是个
: continuous variable 还是个binary target. 因为我认为更可能是前者。如果是前者
: ,那么建模的方法就不大可能是decision tree 或logistic regression, 反倒有可能
: 是ols regression 一类的。。。好了,再回到为什么要有claim data的问题,保险模
: 型定价的对象无非是3类,一是以前从没有投过保,二是已经在本公司投保但是要renew
: 的,三是过去在别的公司投保但是现在要转来本公司的。除了第一类没有claim
: history, 其他两类都是有的。而在过去的term(s) 里claim次数的多少是直接跟现在和

f**********t
发帖数: 1001
19
非常感谢yuxuxin。回答确实很informative,收藏!

根据预测到的
是拒保)。
底是个
者。如果是前者
regression, 反倒有可能
题,保险模
要renew
接跟现在和

【在 y*****n 的大作中提到】
: 综合回答一下楼主的几个问题。
: Claim data 当然很重要。建模预测insurance loss 是为了什么?是为了根据预测到的
: insurance loss 的数额来决定对各个顾客的pricing (当然,最极端的就是拒保)。
: 所以这就是为什么我在前面说到你必须反问面试你的人这个insurance loss到底是个
: continuous variable 还是个binary target. 因为我认为更可能是前者。如果是前者
: ,那么建模的方法就不大可能是decision tree 或logistic regression, 反倒有可能
: 是ols regression 一类的。。。好了,再回到为什么要有claim data的问题,保险模
: 型定价的对象无非是3类,一是以前从没有投过保,二是已经在本公司投保但是要renew
: 的,三是过去在别的公司投保但是现在要转来本公司的。除了第一类没有claim
: history, 其他两类都是有的。而在过去的term(s) 里claim次数的多少是直接跟现在和

1 (共1页)
进入Statistics版参与讨论
相关主题
linear regression 问题请教紧急求助,问到MULTIPLE REGRESSION的题
SAS又一问题请教各位大牛a question
How to rank variables in regression?SAS Regression Macro 问题请教 (有包子)
求一个用SPSS算multilevel logistic regression。谢谢了。sampling weight variable怎么用到linear regression里啊?
遇到这样的regression问题model和variables都sig.但每个category都不sig
请教大家这个数据应该用什么统计模型统计课题弱问, 包子感谢.
急问,有学金融的吗?做loss forecasting大概需要什么知识,on[合集] 请教一个有关logistic regression的问题
regression problem - go confusedHow to the macro regression with if?
相关话题的讨论汇总
话题: loss话题: insurance话题: claim话题: regression话题: model