资讯详情

SAT改革白皮书(一)新SAT改革细则

2017-02-15 阅读:5407 来源:上海三立教育
进入>

一、改革的历史

SAT考试从1926年成立,经历了大小十次改革,其中不免出现某些内容取消后再恢复的现象,比如1928年数学部分取消,1930年数学部分恢复;1974年设立写作部分,1994年取消写作部分,2005年再恢复写作部分;分数方面,2005年由1600改为2400,这次2016年改革再将总分改回至1600。SAT考试内容翻来覆去的改革是College Board基于美国中学生和大学生的考试成绩和在校表现,同时回应外界压力做出的决定。例如2005年的改革,当时因为College Board在美国西海岸的主要合作伙伴——加州大学经过数据研究,证明SAT成绩对于考生在大学表现的预估作用有限,宣称可能不再把SAT成绩作为加州大学系统的入学申请条件,College Board迫于外界压力,进行了改革,就产生了持续十年的现行SAT。

二、现行SAT的效度

效度(Validity)这个概念是测试学领域的基本概念,也是决定测试质量的更重要标准。效度指的是考试结果在多大程度上反映出所测试的能力。对于SAT考试而言,效度意味着SAT成绩在多大程度上反映出考生具备读大学本科的能力。为了证明SAT考试的高效度,College Board建立了全国高校学生表现数据库,根据历届高中毕业生参加完SAT后在大学一年级的表现,通过线性回归等数据统计方法,展开对于SAT预测效度(Predicative Validity)的研究。所谓预测效度,指的是考试成绩能够在多大程度上预测考生将来的能力或表现。表格一是基于2006年至2009年高中毕业的学生(2010-2013年大学毕业)在大学一年级的成绩和SAT各科目、高中平均分数。

表格一:SAT各科目,高中平均分和大学一年级平均分的相关系数

年份

写作

阅读

数学

阅读和数学

SAT总分

高中平均分

SAT总分和高中平均分

2009

0.52

0.48

0.48

0.52

0.54

0.54

0.62

2008

0.52

0.48

0.48

0.52

0.54

0.56

0.63

2007

0.53

0.50

0.49

0.54

0.56

0.56

0.64

2006

0.51

0.48

0.47

0.51

0.53

0.54

0.62

相关系数指的是两个变量之间的相关程度,相关系数低、中、高分别对应的数值是0.1,0.3,0.5,所以SAT各科目成绩与大学一年级平均分相关性非常高,尤其是写作部分。可以看出,阅读和数学合并在一起,才和写作成绩对于大学表现的相关性持平。另外,SAT总分和高中平均分预测学生在大一表现的强度是一样的。

为了进一步证明SAT的高效度不仅体现在大学一年级的表现,College Board利用相同的数据统计方法,研究SAT各科目、高中平均分对大三、大四学生的平均分以及累积平均分的预测效果,研究结果请见表格二。研究结果和表格一规律一致,不再赘述。值得一提的是,两个表格中相对应的单元格数据,在表格普遍略小,原因是随着在大学年级的提升,学生的学习成绩由学生在大学的学习影响很大,SAT成绩的预测效果就会相应当教学生降低,但即便如此,整个表格中所有相关系数都是大于0.3的,相关强度仍然是中等甚至高等。

表格二:SAT各科目,高中平均分和大学三、四年级平均分的相关系数

写作

阅读

数学

阅读和数学

SAT总分

高中平均分

SAT总分和高中平均分

3rd GPA

0.43

0.40

0.38

0.42

0.45

0.46

0.52

3 cum GPA

0.56

0.52

0.50

0.55

0.58

0.57

0.66

4th GPA

0.39

0.35

0.33

0.37

0.40

0.43

0.47

4 cum GPA

0.54

0.51

0.48

0.54

0.56

0.56

0.64

三、改革的动力

以上研究虽然规模大、数据量大,但都是由College Board自身执行的。以下是全美国针对SAT的第二大规模的研究,加州大学对78000名大一学生进行数据分析后,发现现行SAT在预测学生大学成绩时不如SATⅡ。美国很多名校招生时需要或者建议考生提供SATⅡ的成绩很好的验证了这个发现,用来弥补现行SAT的预测效度。SATⅡ是知识性测试,所以更和美国高中课程内容相符。虽然现行SAT一直鼓吹基于美国高中课程,可凡是对现行SAT考试内容熟悉的考生或家长很清楚,除了简单的数学部分外,现行SAT和美国高中教学内容没有知识和内容上的直接关联,反而其测试的很多能力是大学生活所必需的,在高中并没有经过充分的训练。早在2002年,Atkinson就指出,当时的SATⅠ(和现行SAT差别不大,主要是没有语法题和作文)测试了独立于高中课程内容的能力,然而SATⅡ测试了高中科目的知识和技能掌握情况。

加利福尼亚大学的这次研究还发现,比起SATⅡ,现行SAT成绩更受到社会经济变量的影响。简单说,家庭条件、父母受教育程度以及初高中学校水平等都在很大程度上影响着现行SAT的考试成绩,这就构成了测试偏见问题,使得SAT考试对经济条件好的考生更有利。其实这个问题在能力型测试中并不罕见,全球规模的PISA测试成绩就充分表明,社会经济变量很大程度地影响着考生成绩。出现这个现象的一个重要原因就是社会经济变量很大程度上影响着SAT的备考和表现,因为备考SAT所需的备考资料和培训课程价格不菲,对于低收入家庭是笔不小的开支,相比之下,SATⅡ基于高中课程,所以考生在准备起来,不需要太多额外的资金投入。针对这一点,College Board和Khan Academy(可汗学院)合作,在可汗学院网站上将发布新SAT练习题等资料,尽量削弱社会经济变量对新SAT成绩的影响。

College Board新总裁David Coleman来自教育世家,毕业于耶鲁大学,随后凭借罗氏奖学金先后在牛津和剑桥大学研究英语文学和古典教育哲学。科尔曼先生在2007年合伙创办非盈利机构 — 学生成就伙伴,该机构专注于制定和推广全美统一的数学和英语基础教育大纲(Common Core State Standard)。到目前为止,全美已经有46个州采用该课程大纲,而在此之前美国没有一个能为大多数州通用的基础教育阶段的课程大纲。在2012年10月,科尔曼先生离开创立五年之久的学生成就伙伴机构,正式加入美国大学理事会。就在科尔曼上任卓绝年,SAT考生人数被ACT超越,虽然科尔曼说这并不重要,但是ACT作为另一个美国高考(有时被称作美国会考)被越来越多的大学接受,这对College Board来说,是前所未有的挑战。科尔曼充分基于自己创立的极具影响力的美国课程大纲,对SAT进行了大刀阔斧的改革。

美国课程大纲是基于2009年创立的College and career readiness standards(大学和就业预备标准),该标准针对高中生进入大学和职场所需的知识和能力,这个美国课程标准和新SAT宗旨完全一致。美国课程大纲进行了国际化的分级,使得美国学生在于全世界学生竞争时有据可依。该大纲于2010年创立,在短短的2年内已经得到美国46个州的采用。新SAT基于美国课程大纲,考试内容和高中课程没有脱节,这对ACT也将是重重的一击。相比之下,ACT虽然一直在与课程结合方面做大力推广,比如中国的GAC课程,但是其影响力无法和新SAT所依靠的全美课程标准相比。

由于课程大纲内容繁多,本文仅节选和新SAT考试内容更为相关的部分。

Literacy.RL.11-12.5a

Interpret figures of speech (e.g., hyperbole, paradox) in context and analyze their role in the text.

Literacy.RL.11-12.6

Analyze a case in which grasping point of view requires distinguishing what is directly stated in a text from what is really meant (e.g., satire, sarcasm, irony, or understatement).

要求学生掌握修辞手法,区分文章字面意思和作者真正的意图或态度,这在现行SAT和新SAT中都是阅读题中的重点题型(如目的/功能题,态度/语气题,修辞手法题)所考察的能力。

Literacy.RL.11-12.9

Demonstrate knowledge of eighteenth-, nineteenth- and early-twentieth-century foundational works of American literature, including how two or more texts from the same period treat similar themes or topics.

要求学生了解18、19世纪以及20世纪早期的美国文学,了解同一时代的不同文章怎样讨论同一话题,这在现行SAT和新SAT中表现为小说和对比类文章,尤其是长对比。

Literacy.RL.11-12.5b

Analyze nuances in the meaning of words with similar denotations.

新SAT语法部分加入了区分近义词的题目。

Reading RI.11-12.7

Integrate and evaluate multiple sources of information presented in different media or formats (e.g., visually, quantitatively) as well as in words in order to address a question or solve a problem.

这是新SAT的特色,不论阅读、语法还是数学,都加入了大量的图表和数据分析元素,实用性更强。

Reading RI.11-12.8

Delineate and evaluate the reasoning in seminal U.S. texts, including the application of constitutional principles and use of legal reasoning (e.g., in U.S. Supreme Court majority opinions and dissents) and the premises, purposes, and arguments in works of public advocacy (e.g., The Federalist, presidential addresses).

Reading RI.11-12.9

Analyze seventeenth-, eighteenth-, and nineteenth-century foundational U.S. documents of historical and literary significance (including The Declaration of Independence, the Preamble to the Constitution, the Bill of Rights, and Lincoln’s Second Inaugural Address) for their themes, purposes, and rhetorical features.

这两条标准是新SAT的另一特色,就是每次考试必然会有一篇文章是美国建国文献或重要演讲。

Writing W.11-12.8

Assess the strengths and limitations of each source in terms of the task, purpose, and audience; integrate information into the text selectively to maintain the flow of ideas.

这可以说是新SAT的更大亮点,新SAT丢弃了现行SAT的作文(议论文),采用了分析性写作的形式。

四、改革内容

1. 分数和时间

数学

阅读

写作

总计

现行SAT

200-800分

200-800分

200-800分

600-2400分

70分钟

54题

70分钟

67题

35分钟

49题

25分钟

1篇作文

200分钟(不含加试)

170题 1篇作文

新SAT

数学

实证阅读和写作

作文(可选)

总计

200-800分

200-800分

满分8分

400分-1600分

80分钟

57题

65分钟

35分钟

50分钟

1篇

230分钟(不含加试)

52题

44题

153题 1篇作文

总分由2400回归到2005年之前的1600分,这些都是标准分,并非原始分,原始分是由做对题目和做错题目的数量决定的,而标准分是由原始分经过复杂函数换算的,标准分的目的非常明确,能够直观反映出获得某个分数的考生在整个考生群体中的排名。单科800分意味着在所有考生中排名卓绝,200分意味着倒数卓绝,500分意味着更中间排名,所以考生即使所有题目全部做错,在现行SAT中由于倒扣分制度导致原始分为负数,他也能拿到200分。总分同理。这也能很好的解释为什么每套试卷的评分表不一样,这是由试卷难度决定的。如果某套题难度特别大,虽然考生错题个数多,但是因为所有考生都面临同样的困难,导致整体错误率都高,为了保证每个标准分数段有固定比例的考生(正态分布),评分标准必然会宽松,考生反而考的不差。所以考生不论考现行SAT还是新SAT,都不需要纠结试卷的难度。同样,这也能解释为什么阅读有容错率,一般来说,阅读部分错1个,2个,甚至3个题都能拿到800分,这是因为做全对的考生比例太小,即使某考生错了3个,排名仍然十分靠前,仍然能拿到800分。当然,也能解释为什么错一个数学题目经常只能拿得到770或者760分。 

很明显,数学的分值比例明显增加,由30%上升到50%,因为中国考生数学较强,所以该比例上升是利好消息;阅读分值比例由30%下降为27%,变化很小,同时考虑到现行SAT占分比例为9.5%的句子填空题属于阅读部分,所以单论阅读题,实际上分值比例由24%上升到27%;语法分值保持23%不变;作文由原来的10%改为选考,不参与总分,单独计分。总之,数学的重要性在增加,作文计分方式改动,句子填空题取消。

从解题时间上看,数学由每题的1.3分钟增加到1.4分钟,增加了6秒钟,主要原因是新SAT数学题目阅读量明显变大,很多题目阅读量是现行SAT的2-3倍,所以在数学科目上,考生一定要专门训练解题速度。阅读方面,平均每题做题时间由63秒增加至75秒,增加了12秒,但是现行SAT是有19道句子填空题,该题型做题时间本来就很短,所以假设每道句子填空题用时30秒(大多数同学都能做到),现行SAT阅读题每题做题时间是75.6秒,和新SAT几乎完全一样。语法题每题做题时间有43秒增加到48秒,原因是新SAT语法题是分散在文章中的,不是孤立的一个句子一道题。50分钟的写作时间比较充分。

2. 取消倒扣分制度

现行SAT的倒扣分制度目的是消除猜题的影响,每题如果选错要倒扣0.25分,但是其不科学的地方在于分数的“零头”,比如原始分29.5, 29.75, 30, 30.25都归为30分,但29.5和30.25之间相差0.75,几乎是一个题目的分数。所以取消倒扣分制度更加科学,这样所有考生都不会空题,在“蒙答案”方面,如果随机选择,就看运气了,但如果是在排除干扰选项的前提下蒙答案,那么也能体现考生之间的水平差异,干扰选项排除的越多越准确,蒙对的几率就越高。

3. 选项个数改变

每个题目选项数量由5个变为4个。虽然干扰性很高的选项仍然存在,但是选项数量减少为考生减轻了阅读负担,有更多的时间和精力分析正确答案和强干扰选项。另外由于选错答案不倒扣分,得分的几率就更高了。

4. 数学部分的变化

4.1 形式变化

改革后的数学题型和现在一致:选择题和填空题;对应的题目数量也基本一致:选择题由44增加到45个,填空题由10增加到12个。计算器的使用规则有改变:由现在的数学部分都可使用计算器到改革后的部分可使用计算器。这对中国学生影响不大,因为大部分学生很擅长纸算或心算。

4.2 内容变化

(1)现在大纲中的考察部分“基础数论与运算”在新出的考纲中将被平均分配到“代数”“数据分析”“高等数学”“其他”中去。“其他”这一部分会新增如“复数”的考点。

(2)几何的考察比例由现在的25%-30%,将被缩减为不到10%。空间几何的内容将被删除。

(3)“数表分析”的考察比例(28%),较之现在(约15%)有较大提升。内容与现在的大纲基本一致,但是考察方式有所改变,除了继续考察图表数据分析外,还加强了对图像的特征进行文字描述的考察。

(4)新SAT将新增“高等数学”这一部分,其中考试的知识点,如多项式的因子,根等,是现行SATⅠ考试大纲中不做要求的,但SATⅡ数学要求。

4.3 阅读部分的变化

a 题材

考试大纲明确规定,美国及世界文学出1篇,历史及社会研究出2篇,科学出2篇。和现行SAT相比,科学类文章的比例有提升。历史及社会研究的这2篇中,有一篇必定是美国建国文献或者知名演讲。取消了短文章(包括单短和双短)。

b题型

句子填空题全部取消;修辞类题型的比例在上升。考察词义辨析、文章结构、目的解读、论证过程的题型比例比现行SAT要大;官方所特别强调的‘用原文合适的语句来支撑特定的观点’的题型,是新SAT特色题型,体现出基于证据的阅读宗旨;另一种新题型是图表题,要求考生将图表中的信息与对应的原文文本信息合成在一起,选一个答案。

4.4 语法部分的变化

a 题型

取消现行SAT中以单个句子为考察单位的题型:句子改进题(Improving Sentences)和句子找错题(Identifying Errors)。新SAT将所有题目嵌入文章中,需要考生结合上下文改进句子。与阅读一样,语法部分也加入了图表题。此类题目的本质,是“看图选正确的描述句”,考察“对这个图形来说,哪个选项的描述更准确、更全面。” 

b 考点

语法考点范围变化不大,但是标点符号考察的比例明显增加。此外,出现了近义词选择题,考察学生的选词能力,比如vacate(空出)、evacuate(撤出)和depart(分离)的区别。

c 题材

考试大纲显示,语法部分会有1篇职业类文章(如职位描述与分析)、1篇历史与社会研究、1篇人文、1篇科学。其中职业类文章是新SAT的特色文章。

4.5 作文部分的变化

a 形式

新SAT作文是分析性写作,要求考生针对一篇文章(650-750词)写一篇评论性文章。考生大纲明确规定,考生评价的方面有三:作者在论证自己论点时使用的证据好不好;在组织整体论证时,论证过程是否合理、严密;在完成论证目标时,采用了哪些风格上及说服上的元素。

b 评分标准

新SAT作文评分标准分3个部分:阅读文章理解的准确性与全面性;评价分析的点找的好不好、准不准、多不多;考生所用的语言质量及前后的衔接程度。这三个部分是分别判分的,满分为8分。   

加载全文

免责声明:本站部分内容、图片来自用户自主上传,如果您对本站信息资源版权的归属问题存有异议,请您致信,我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为,请通知我们,我们一定根据实际情况及时处理。

以上是上海三立教育为大家整理的有关SAT改革白皮书(一)新SAT改革细则的全部内容,更多精彩请访问学习资讯新闻专栏。
上一篇:

相关课程

更多>
2020猎学网广告栏
申请课程免费试听名额

课程顾问24小时内联系您

你好

顾问将于24小时内联系您!

确定
在线咨询 微信咨询 立即报名
申请1对1课程顾问咨询服务
×
你好

顾问将于24小时内联系您!

确定
上海猎学网 >上海三立教育 >SAT改革白皮书(一)新SAT改革细则