由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Parenting版 - 如何理解加州caaspp评估报告单? (转载)
相关主题
如何爬藤(转载;看贴的给我包子;诚信比高分更重要)[转载] 为什么说usamo 简单
小学数学书推荐?问个数学问题
教绝对值方程:Khan Academy vs AMC10 答案 vs 分段函数替换?讲个笑话
请教CTY Program有人了解吗?理科家长的几个通病
Universal Daycare 是个好话题觉得美帝数学进度慢的进来看一下
不太喜欢同事老是炫耀自己的孩子纪伯伦的诗两首
有明天考AMC 8的吗?发现和培养孩子的超能力
加州的娃,估计将来只能考虑上COMMUNITY COLLEGE转载: 从首个IMO季军谈起 by 付云皓
相关话题的讨论汇总
话题: 分数话题: 评估话题: 分区话题: 年级话题: 考试
进入Parenting版参与讨论
1 (共1页)
w********9
发帖数: 8613
1
【 以下文字转载自 SanFrancisco 讨论区 】
发信人: wewill2009 (daluobe), 信区: SanFrancisco
标 题: 如何理解加州caaspp评估报告单?
发信站: BBS 未名空间站 (Wed Oct 14 01:07:58 2015, 美东)
我们搬了家,因此今天才收到(转来的)小孩在今年春天6年级时的评估报告。否则都
忘了这个考试。
我过去几年只是看一下分数就差不多知道是怎么回事了。这次看了小孩新型评估的分数
后有些不明白。
语言部分分数2724,列出来的四个分数区间是(不达标2210-2456,近达标2457-2530,达
标2531-2617,超标2618-2724),小孩的分数“误差”/浮动范围只有左边一半,似乎是
不能再提高了的意思(粗看这像是个巨大的bug);
数学分数是2727,列出来的四个分数区间是(不达标2235-2472,近达标2473-2551,达标
2552-2609,超标2610-2748),“误差”/浮动标左右都有一半。
我带着对这些区段有点乱的疑问,查到信中说考试分数是在2000和3000之间。当时就觉
得小孩表现欠佳(至少在数学方面)。后来小孩说考试是computer adaptive性质的,
而且知道自己做错过题目。
为了有些对照,我查到了个官方的sample
http://www.cde.ca.gov/ta/tg/ca/documents/caaspp15scorerpt.pdf
那里面的分区也是很不规则。而且下限或上限都离2000或3000有相当大的距离。难道这
些分区是因人考试的内容不同而异?这里有自己小孩当时也在6年级的父母吗?可以对
照那些分区吗?
这份评估报告单很奇怪。不能与加州过去评估分数对比。分区也不规则。也没有
percentile这类细的东西。感觉挺粗糙的。希望评估内容不是这样。
t******l
发帖数: 10908
2
我觉得你上网看一下 CAASPP 样题的难度,估计就不纠结这点分数差别了。:-)

【在 w********9 的大作中提到】
: 【 以下文字转载自 SanFrancisco 讨论区 】
: 发信人: wewill2009 (daluobe), 信区: SanFrancisco
: 标 题: 如何理解加州caaspp评估报告单?
: 发信站: BBS 未名空间站 (Wed Oct 14 01:07:58 2015, 美东)
: 我们搬了家,因此今天才收到(转来的)小孩在今年春天6年级时的评估报告。否则都
: 忘了这个考试。
: 我过去几年只是看一下分数就差不多知道是怎么回事了。这次看了小孩新型评估的分数
: 后有些不明白。
: 语言部分分数2724,列出来的四个分数区间是(不达标2210-2456,近达标2457-2530,达
: 标2531-2617,超标2618-2724),小孩的分数“误差”/浮动范围只有左边一半,似乎是

w********9
发帖数: 8613
3

并不是那个。考试本来就是computer adaptive的,四档的难度无法确定。我疑惑的是
不规则性或者大的浮动性,包括各年级分区的不统一性和它导致的不可比较性。从来没
有见过这么不规则分区的考试。你见过?

【在 t******l 的大作中提到】
: 我觉得你上网看一下 CAASPP 样题的难度,估计就不纠结这点分数差别了。:-)
t******l
发帖数: 10908
4
我的意思是你看看最高一档的难度就不纠结了。

【在 w********9 的大作中提到】
:
: 并不是那个。考试本来就是computer adaptive的,四档的难度无法确定。我疑惑的是
: 不规则性或者大的浮动性,包括各年级分区的不统一性和它导致的不可比较性。从来没
: 有见过这么不规则分区的考试。你见过?

w********9
发帖数: 8613
5

你把问题想得太简单了。你根本没看懂我的几个意思。我问的根本不是分数本身,而是
其它的。比如,个年级4个区制定以及年级之间的大涨落导致的没有任何的年级之间的
可比较性。
我随便问你两个问题。
1.语言部分。为什么4区中的最高区(超标区)的下限离理论上的上限,3000,会有400
分量级的差别,而离不达标区的实际下限(2210)也只有400分?
2.语言部分。2724是所有人中最高的分数吗?如果不是,为什么我小孩的分数没有往上
的误差/浮动,而只有往下的?
3.数学部分。(有向上的浮动,合理。)有上面同样的问题。还有,一般来说,数学容
易达到很高的分数。如果理想上限是3000,为什么超标的下限那么低?

【在 t******l 的大作中提到】
: 我的意思是你看看最高一档的难度就不纠结了。
w********9
发帖数: 8613
6
不同年级的达标区实际上限会差150分以上。年级之间没法做有意义的比较。也可以说
,同一个学生在后一年的分数与他/她前一年的分数基本上是没法比较的。不知如何判
断每个学生是否在一年里有明显进步。过去评估的实际上限就是理想上限,学生可以大
致对比前后两年的成绩。
t******l
发帖数: 10908
t******l
发帖数: 10908
8
其实我一般不打算在半夜里在网上浪费时间,但对于这个 common core 的问题,
尤其是 common core math explanation,俺老确实担心 new math 的历史极其
可能会再次重演 -- a good intention followed by poor implementation。
我从网上和学校看到的信息,基本是对于小学 K 班,common core math 基本
make sense(小娃的 math home work)。但是初中的 common core math 课本,
以及上面那个 link 里 smart & balanced 样题,老实说有点惨不忍睹了。
我个人觉得,以上这个 pattern,可能侧面说明,common core 的 implementation
确实不好说。我大胆假设海量廉价题的最终拍板人,其平均数学认知水平(真正理解
而不是依葫芦画瓢)可能就停留在小学算术阶段,初中前代数就开始力不从心了,
后面不提了。决定旧题型还可以依葫芦画瓢,不需要真正的理解。这次要按 common
core 新要求搞出新题型,温州老板们搞不好使不上劲就把题给拍板拍傻了。
(当然其实能出好题的教师我觉得还是不少的,但这政治驱动的新玩意儿,很可能
最终的题目是 sales 决定而不是 engineer 决定。sales 的数学水准嘛,你懂的,
首先的标准是好看!)。
当然这些玩意儿我都顾不上也没时间折腾。我现在最大的担心是俺娃不要被这次
风风火火的革命给不幸革炮灰了。所以俺现在特别热情于 AMC 8 / 10 / 12,
我觉得大风大浪中的救命稻草就靠这个历史证明有效的玩意儿了,至少那些题
不是数学傻鼻拍板的。最多适应新时代对速度正确率的要求稍作调整即可。
n***p
发帖数: 7668
9
The author of this article is just stubborn and picky. I think the example
problems
mentioned in this article are mostly good problems, and appropriate for
students.
It is a failure if a student can not solve them.

【在 t******l 的大作中提到】
: http://www.edsurge.com/news/2015-03-11-why-the-smarter-balanced
w********9
发帖数: 8613
10
你这些是完全离主题了。我讨论的不是common core是否有根本问题,而只是评估的
scaling、尤其是分区是否有根本上的问题。我开始就明说了我不是很清楚评估内容是
否有根
本问题,但那显然不是我关心的。(见原帖最后一句。)
把原题中的若干问题和后来我的解释想清楚再回复辟好不好?
如果有六年级的父母,看一下那些分区是否与我看到的一样,就可以回答原来的一、两
个问题了。

【在 t******l 的大作中提到】
: 其实我一般不打算在半夜里在网上浪费时间,但对于这个 common core 的问题,
: 尤其是 common core math explanation,俺老确实担心 new math 的历史极其
: 可能会再次重演 -- a good intention followed by poor implementation。
: 我从网上和学校看到的信息,基本是对于小学 K 班,common core math 基本
: make sense(小娃的 math home work)。但是初中的 common core math 课本,
: 以及上面那个 link 里 smart & balanced 样题,老实说有点惨不忍睹了。
: 我个人觉得,以上这个 pattern,可能侧面说明,common core 的 implementation
: 确实不好说。我大胆假设海量廉价题的最终拍板人,其平均数学认知水平(真正理解
: 而不是依葫芦画瓢)可能就停留在小学算术阶段,初中前代数就开始力不从心了,
: 后面不提了。决定旧题型还可以依葫芦画瓢,不需要真正的理解。这次要按 common

相关主题
不太喜欢同事老是炫耀自己的孩子[转载] 为什么说usamo 简单
有明天考AMC 8的吗?问个数学问题
加州的娃,估计将来只能考虑上COMMUNITY COLLEGE讲个笑话
进入Parenting版参与讨论
t******l
发帖数: 10908
11
It's a failure of testing system, if a student can use fraction of time to
solve the problem and prove mathematically (which means spatially), but have
to spend enormous time (relatively) to explain in ELA style just to conform
the standard, making the test less reflecting reality.
而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
为零。

【在 n***p 的大作中提到】
: The author of this article is just stubborn and picky. I think the example
: problems
: mentioned in this article are mostly good problems, and appropriate for
: students.
: It is a failure if a student can not solve them.

w********9
发帖数: 8613
12
刚查到所有年级的分区。
随年级的增高,每个区域总是朝3000的方向移动。到11年级达到2800和2860。真不明白
这种scaling如何让一个学生对自己前后两年的成绩大致做相对性的比较。
http://www.cde.ca.gov/ta/tg/ca/sbscalerange.asp
l*****e
发帖数: 2447
13
我们非加州,但是考的也是sbt,一个六年级娃分数和你们家闺女似乎一样。参考朋友
加州六年级娃的情况,感觉加州的做法是超过分数上限(2724/2748)直接咔嚓成上限
。。。你为啥关心分数分区?

【在 w********9 的大作中提到】
: 你这些是完全离主题了。我讨论的不是common core是否有根本问题,而只是评估的
: scaling、尤其是分区是否有根本上的问题。我开始就明说了我不是很清楚评估内容是
: 否有根
: 本问题,但那显然不是我关心的。(见原帖最后一句。)
: 把原题中的若干问题和后来我的解释想清楚再回复辟好不好?
: 如果有六年级的父母,看一下那些分区是否与我看到的一样,就可以回答原来的一、两
: 个问题了。

l*****e
发帖数: 2447
14
哦,这个我理解就是比去年多了就是好的,比去年少了就是不好的。不同年级之间同分
就是水平相当,要不然不可理解。

【在 w********9 的大作中提到】
: 刚查到所有年级的分区。
: 随年级的增高,每个区域总是朝3000的方向移动。到11年级达到2800和2860。真不明白
: 这种scaling如何让一个学生对自己前后两年的成绩大致做相对性的比较。
: http://www.cde.ca.gov/ta/tg/ca/sbscalerange.asp

w********9
发帖数: 8613
15

我在原帖里提及了。
对这种非线性的scaling,现在只能在此评估内部做横向比较,而纵向基本没法比。
你还是不明白我的疑惑是什么。(这种报告很可能就没什么用,只是一个CC的全州性的
评估报告。小孩在学校的表现才有用。我甚至不知道我小孩现在的新学校是否也收到这
份报告。)

【在 t******l 的大作中提到】
: It's a failure of testing system, if a student can use fraction of time to
: solve the problem and prove mathematically (which means spatially), but have
: to spend enormous time (relatively) to explain in ELA style just to conform
: the standard, making the test less reflecting reality.
: 而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
: 为零。

w********9
发帖数: 8613
16

这种考试是非线性的scaling。如果每个区的上下限按年级在明显浮动,基本上就是无
法对不
同年级之间的表现做比较的。

【在 l*****e 的大作中提到】
: 哦,这个我理解就是比去年多了就是好的,比去年少了就是不好的。不同年级之间同分
: 就是水平相当,要不然不可理解。

S****p
发帖数: 3928
17
还是不明白楼主纠结啥。
不在加州,不知道这个test. 但是很多test 是没有满分的,你要是一直对,难度可以
不停加,一直做下去,直到时间到了,或者你做不下去。
人是和自己比,和人比,不是和数字在比。
w********9
发帖数: 8613
18
我对标题的回答是:只能部分地理解,有很大部分没法理解。
现在可以讨论真正涉及common core的问题了。:)
还是涉及考试。好像Smart Balanced Testing用了一些回答时(更以往考试一样)回答
时不需要给出每个步骤的题目,另外也有不少需要详细解释的题目。后者的原意是测试
出学生的分析、解决和(语言方面)批判性思考的能力。想法是好的,作为新东西的实
施需要很大改进。但是有些必须人为的东西永远无法被排除,比如人工判分的部分有不
少,判分标准也是人订的。
新的测试说是能够测出是否达标和不达标。将来应该有进一步、更细致的测试,判断一
个学生大致达到的标准(比如一个6年级的学生大概是在CC5、CC6、CC7还是CC8的水平
)。
从前的标准考试有不少弊端。很多大的入学标准考试很多年前就开始进行了很大的改革
。现在的评估也算是一个大趋势里的一个后来者,但是在某些方面做得“最极端”。比
如,在比较高年级的数学解题方面,像是程序员在编程,应该允许“快速”越过一些非
常简单、相对初等的步骤(用并行运算的做法:)。
w********9
发帖数: 8613
19

这个主题是不太容易。
你这样说有一定道理。但是信中提到,scaling是在2000到3000之间。而实际的scaling
与它们相差甚远,每个年级之间的scaling也有明显差别。我没有找到为什么是这样的
任何解释。
同一个学生的前后两年的表现应该可以有比较定量的相对性比较。在非线性的scaling
情况下采用了逐年上浮的分区,基本消除了这种比较的可能性。
也许,这种scaling的基本前提假设是:差不多每个学生都在逐年进步,不需要做那种
对每个学生的相对比较。

【在 S****p 的大作中提到】
: 还是不明白楼主纠结啥。
: 不在加州,不知道这个test. 但是很多test 是没有满分的,你要是一直对,难度可以
: 不停加,一直做下去,直到时间到了,或者你做不下去。
: 人是和自己比,和人比,不是和数字在比。

w********9
发帖数: 8613
20

math
STAR test的设计要顾及州的总体水平,不是adaptive性质的,但会有个别的难题,在
有的学校只是placement的一个参考。Math placement中有些题目会难些、会更有综合
性、会更超前。
有些学校可能会用来做参考。在不少竞争激烈的学校,达到最高分和近高分的学生比例
应该不低。这类学校之间差别都会很大,不同老师差别也会很大。我小孩现在在学校的
作业少了很多,数学的相对难度也有不小的下降。

【在 t******l 的大作中提到】
: It's a failure of testing system, if a student can use fraction of time to
: solve the problem and prove mathematically (which means spatially), but have
: to spend enormous time (relatively) to explain in ELA style just to conform
: the standard, making the test less reflecting reality.
: 而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
: 为零。

相关主题
理科家长的几个通病发现和培养孩子的超能力
觉得美帝数学进度慢的进来看一下转载: 从首个IMO季军谈起 by 付云皓
纪伯伦的诗两首建议这里牛娃妈妈们上来BSO,多介绍不同州gift program(不感兴趣的勿进)
进入Parenting版参与讨论
w********9
发帖数: 8613
21

那按你这么说下去,搞每个学生的progressive reporting这类东西都没有实际意义。
在相对短的时间内,用很大的同一个学生群做相对性质的标本,应该可以提取出每个学
生的大致的进展。

【在 t******l 的大作中提到】
: It's a failure of testing system, if a student can use fraction of time to
: solve the problem and prove mathematically (which means spatially), but have
: to spend enormous time (relatively) to explain in ELA style just to conform
: the standard, making the test less reflecting reality.
: 而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
: 为零。

w********9
发帖数: 8613
22

相对而言的,新的考试顾及的程度会低不少。这是由于:评估包含了不小的adaptive的
成分。过去都是同一套试卷,只能靠个别题目区分更高水平的学生;另外还有不少××
×超标×××的测试。

【在 t******l 的大作中提到】
: It's a failure of testing system, if a student can use fraction of time to
: solve the problem and prove mathematically (which means spatially), but have
: to spend enormous time (relatively) to explain in ELA style just to conform
: the standard, making the test less reflecting reality.
: 而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
: 为零。

w********9
发帖数: 8613
23

我前面说了:每个学校和老师都会有很大的不同。我小孩去年的数学老师有很强的数学
背景,用的题目和资料比一般的老师多、深不少(包括Singapore Direct)。在现在的
班上,平时数学也有晋级性的测试练习(比如1-6级),我小孩感觉现在同学的数学质
量明显差(虽然两个学校的相对“名声”差不多)。
representation
long

【在 t******l 的大作中提到】
: It's a failure of testing system, if a student can use fraction of time to
: solve the problem and prove mathematically (which means spatially), but have
: to spend enormous time (relatively) to explain in ELA style just to conform
: the standard, making the test less reflecting reality.
: 而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
: 为零。

w********9
发帖数: 8613
24
在同一个学区里,另外一个学校的提前班在七年级用AMC10,8年级要用AMC12。
一般来说,到了中学,数学靠学校是不行的。在稍难的水平提高也不是很难,多花点时
间就很容易显现(相对来说,比在个别的集体体育项目上提高明显容易)。××好的**
公立学校的
平均水平也就那样。
w********9
发帖数: 8613
25

这个scaling被21个州采纳,在其中17州最先实施。
大致按学生表现的比例分区。粗略来说:30%,30%,30%,超标区15%。在××好××的
学校,大部分学生超标。(如果有真正的统一考试,加州可能很靠后了吧?)
http://www.edweek.org/media/achievement-levels-and-scale-scores

【在 w********9 的大作中提到】
: 刚查到所有年级的分区。
: 随年级的增高,每个区域总是朝3000的方向移动。到11年级达到2800和2860。真不明白
: 这种scaling如何让一个学生对自己前后两年的成绩大致做相对性的比较。
: http://www.cde.ca.gov/ta/tg/ca/sbscalerange.asp

w********9
发帖数: 8613
26

这个在前面我们也说了,对亚裔本来意义就不大。州的标准考试从来都是比较简单。这
边亚裔里近满分或满分的比例不低,有无数的不好学生垫底,因此大部分同学尤其是亚
裔同学都超标。这是自欺欺人。尤其是考虑到我小孩在参加考试时的那个数学水平。。


【在 t******l 的大作中提到】
: It's a failure of testing system, if a student can use fraction of time to
: solve the problem and prove mathematically (which means spatially), but have
: to spend enormous time (relatively) to explain in ELA style just to conform
: the standard, making the test less reflecting reality.
: 而且 computer adaptive 对题目质量要求其实更高,单题的 false negative 要几乎
: 为零。

t******l
发帖数: 10908
27
不能算自欺欺人,考试是真货,分数反映当前学的是不是达标。
看完分数继续往前挪就成,不纠结。

【在 w********9 的大作中提到】
:
: 这个在前面我们也说了,对亚裔本来意义就不大。州的标准考试从来都是比较简单。这
: 边亚裔里近满分或满分的比例不低,有无数的不好学生垫底,因此大部分同学尤其是亚
: 裔同学都超标。这是自欺欺人。尤其是考虑到我小孩在参加考试时的那个数学水平。。
: 。

Y********d
发帖数: 1478
28

家里娃还小,也没有时间精力去细究您的问题。
友情建议一句,潮水深更半夜的和您讨论问题,即便一时没有完全get your point,没
有功劳也有苦劳吧,否则您的这个帖子早就沉了,所以是否可以对他nice一点?
潮水在具体的academics上很有见地的,他家也有六年级娃。希望你们以后有很多有益
的讨论,也算给我们这些小娃父母提供些正外部性。谢谢。

【在 w********9 的大作中提到】
: 你这些是完全离主题了。我讨论的不是common core是否有根本问题,而只是评估的
: scaling、尤其是分区是否有根本上的问题。我开始就明说了我不是很清楚评估内容是
: 否有根
: 本问题,但那显然不是我关心的。(见原帖最后一句。)
: 把原题中的若干问题和后来我的解释想清楚再回复辟好不好?
: 如果有六年级的父母,看一下那些分区是否与我看到的一样,就可以回答原来的一、两
: 个问题了。

l*****f
发帖数: 13466
29
是的 标准化考试的改革似乎一直是拉平趋势。跟新SAT类似 所以考试成绩越来越不重要

【在 w********9 的大作中提到】
:
: 这个在前面我们也说了,对亚裔本来意义就不大。州的标准考试从来都是比较简单。这
: 边亚裔里近满分或满分的比例不低,有无数的不好学生垫底,因此大部分同学尤其是亚
: 裔同学都超标。这是自欺欺人。尤其是考虑到我小孩在参加考试时的那个数学水平。。
: 。

1 (共1页)
进入Parenting版参与讨论
相关主题
转载: 从首个IMO季军谈起 by 付云皓Universal Daycare 是个好话题
建议这里牛娃妈妈们上来BSO,多介绍不同州gift program(不感兴趣的勿进)不太喜欢同事老是炫耀自己的孩子
NYC公立小学排名有明天考AMC 8的吗?
9岁, 如何报名考amc10加州的娃,估计将来只能考虑上COMMUNITY COLLEGE
如何爬藤(转载;看贴的给我包子;诚信比高分更重要)[转载] 为什么说usamo 简单
小学数学书推荐?问个数学问题
教绝对值方程:Khan Academy vs AMC10 答案 vs 分段函数替换?讲个笑话
请教CTY Program有人了解吗?理科家长的几个通病
相关话题的讨论汇总
话题: 分数话题: 评估话题: 分区话题: 年级话题: 考试