您的位置:新文秘網(wǎng)>>學(xué)校/知識(shí)競(jìng)賽/法制/>>正文

高考語(yǔ)文測(cè)試?yán)砟钊笔轿?/h1>

發(fā)表時(shí)間:2006/6/20 18:59:00
目錄/提綱:……
(一)過(guò)于相信經(jīng)驗(yàn),測(cè)試?yán)碚撉啡?br>(二)重書面表達(dá)輕聽(tīng)說(shuō)閱讀
(三)實(shí)踐性缺失
(四)“數(shù)量”觀念匱乏
(二)紙上的“品德”是很靠不住的,言行不一的現(xiàn)象畢竟太普遍
(三)很難定位量化
……
高考語(yǔ)文測(cè)試?yán)砟钊笔轿?
  
  
  一. 從一些統(tǒng)計(jì)和調(diào)查談起
 。1)教師評(píng)定(前20名左右)與高考成績(jī)相關(guān)性統(tǒng)計(jì)(擬作)
   (筆者以為教師的評(píng)定應(yīng)該是一個(gè)較好的效標(biāo),美國(guó)的很多大型關(guān)聯(lián)效度調(diào)查都以老師對(duì)學(xué)生一年以上的觀察作為效標(biāo))。語(yǔ)文應(yīng)該最差。
 。2)學(xué)生成績(jī)波動(dòng)性調(diào)查。(擬作)
   語(yǔ)文的波動(dòng)性肯定最大。
 。3)對(duì)中學(xué)語(yǔ)文教師的調(diào)查采訪(擬作)
   對(duì)語(yǔ)文高考命題科學(xué)性的認(rèn)識(shí) 采訪一些參加過(guò)高考閱卷的老師(評(píng)卷誤差)
   并調(diào)查中學(xué)語(yǔ)文教師的處境
 。4)對(duì)大一新生的調(diào)查(擬作)
 。ㄖ饕透呖几骺泼}的效度進(jìn)行調(diào)查。先給學(xué)生一個(gè)通俗易懂的“效度”定義---能測(cè)量出你真實(shí)水平的程度。然后讓他們回答諸如此類的問(wèn)題:請(qǐng)你按照效度水平給高考各科排序;按成績(jī)波動(dòng)性排序.)
 。5)高考成績(jī)與大學(xué)成績(jī)相關(guān)調(diào)查:
  語(yǔ)文“高考成績(jī)與大學(xué)成績(jī)相關(guān)極低”,說(shuō)明語(yǔ)文“高考的預(yù)測(cè)性很差,作為一種選拔性測(cè)驗(yàn)現(xiàn)行高考是不成功的”(轉(zhuǎn)引自北師大心理系高考研究組《改革高考,更加準(zhǔn)確有效地選拔人才》第83和89頁(yè))(再查出處)
 。6)歷年的高考抽樣統(tǒng)計(jì)結(jié)果
  已有93、97、98(在自抄的信紙上)、2000(在小筆記本上)、2002年的,無(wú)論信度效度(好像沒(méi)有公布)標(biāo)準(zhǔn)差(反映考生成績(jī)離散程度,即試卷的區(qū)分功能,在150分的試卷中標(biāo)準(zhǔn)差20分以上說(shuō)明離散程度較好。),還是成績(jī)的正態(tài)分布曲線,語(yǔ)文都基本上是最不理想的,而且和其他科(尤其英語(yǔ)和理科各科)相去甚遠(yuǎn)(語(yǔ)言測(cè)試略低一些可以理解,低得太多,就需反思)。
  官方對(duì)于低信度的解釋往往是:語(yǔ)文屬于異質(zhì)性測(cè)試(國(guó)內(nèi)的確也作過(guò)一些這方面的調(diào)查).我們不禁要問(wèn):為何國(guó)外的語(yǔ)文測(cè)試信度比我們高得多呢?為何高考英語(yǔ)試卷的信度往往是各科中最高的呢?再者,我們用來(lái)作異質(zhì)性調(diào)查研究的試題其命題和批閱質(zhì)量(尤其作文批改的誤差控制)有足夠的擔(dān)保嗎?
  而且,我國(guó)每年的高考抽樣統(tǒng)計(jì)公布都缺少最重要的一項(xiàng)統(tǒng)計(jì)指標(biāo):效度.(效度測(cè)起來(lái)的確更復(fù)雜更麻煩,但并非“沒(méi)有數(shù)學(xué)方法,只能靠定性分析”. 分析請(qǐng)參
……(新文秘網(wǎng)http://120pk.cn省略1517字,正式會(huì)員可完整閱讀)…… 
“我國(guó)高考工作者由于缺少教育測(cè)量學(xué)的理論與技巧,主要憑經(jīng)驗(yàn)進(jìn)行工作,在試卷編制上一般只有初步的編制計(jì)劃及按這初步計(jì)劃編寫試題的簡(jiǎn)單步驟,試卷初步編成后,不經(jīng)預(yù)測(cè)和數(shù)量化分析,只由編制人員根據(jù)經(jīng)驗(yàn)作一些主觀的討論、審核,即交付使用.致使試卷編制者本身對(duì)他的各項(xiàng)指標(biāo)心中無(wú)數(shù),造成歷年來(lái)高考難度波動(dòng)很大,甚至還有出錯(cuò)題目或出題不當(dāng)?shù)那闆r發(fā)生.”(北京師范大學(xué)心理系高考研究組《改革高考更加準(zhǔn)確有效的選拔人才》)(出處再查)
  實(shí)行了十幾年的高考標(biāo)準(zhǔn)化考試竟然仍采用老掉牙的原始分相加的方法來(lái)計(jì)分,說(shuō)明我們的測(cè)試?yán)碚撌嵌嗝吹那啡?“很多實(shí)行了標(biāo)準(zhǔn)分制度的六七個(gè)省份已經(jīng)取消(山東省于2001年取消)或正在取消,據(jù)說(shuō)原因僅僅在于某些領(lǐng)導(dǎo)欠缺基本的測(cè)試知識(shí). ”(馬文卿劉文超著《中國(guó)高考走向》山東人民出版社2002,3,一版,32頁(yè))“癥結(jié)主要有兩個(gè),一是統(tǒng)計(jì)測(cè)量理論沒(méi)有為高層決策者所熟悉;二是大眾對(duì)其陌生排斥! (馬文卿劉文超著《中國(guó)高考走向》山東人民出版社2002,3,一版,118頁(yè))
  國(guó)際上的語(yǔ)言測(cè)試早已發(fā)展到第三個(gè)階段--“交際測(cè)試” (communicative testing)階段,而我國(guó)的語(yǔ)文高考測(cè)試仍停留在第二階段--心理計(jì)量-結(jié)構(gòu)主義測(cè)試(psychometric-structuralist testing)的初期,仍然在圍繞著“要不要選擇題”“語(yǔ)文測(cè)試要不要精確量化”等本已無(wú)需再爭(zhēng)辯的問(wèn)題糾纏不休.
  “交際測(cè)試”以完形填空、短文聽(tīng)寫等題型為典型特征,強(qiáng)調(diào)語(yǔ)境中運(yùn)用,側(cè)重考查學(xué)生運(yùn)用語(yǔ)言的靈活性,對(duì)能力認(rèn)識(shí)更為全面深刻。而我國(guó)的語(yǔ)言測(cè)試在這點(diǎn)上幾乎為空白.
   “高揚(yáng)科學(xué)的大旗,…走出行政性評(píng)價(jià)的窠臼.…評(píng)價(jià)方式上力求創(chuàng)新,走科學(xué)評(píng)價(jià)的道路,既要做到倫理的善,更要做到邏輯的真和形式的美.”(孔祥沛《淺論傳統(tǒng)文化對(duì)我國(guó)教育評(píng)價(jià)制度的影響》《教育科學(xué)研究》年月待查)
  
 。ǘ┲貢姹磉_(dá)輕聽(tīng)說(shuō)閱讀
  中國(guó)古代相對(duì)封閉的社會(huì)實(shí)際以及重人文輕科學(xué)的傳統(tǒng),此外還有“以文取士”科舉制度的影響,使得“寫文章”得到了高得不能再高的社會(huì)地位,所謂“天子重英豪,文章授爾曹”,而“聽(tīng)說(shuō)”“閱讀”卻被大大的冷落了。此種偏差時(shí)至今日依然相當(dāng)嚴(yán)重,并在語(yǔ)文高考上體現(xiàn)出來(lái)。
  高考試卷中一篇作文幾乎占據(jù)半壁江山(60/150),而意義非常的聽(tīng)說(shuō)測(cè)試始終不能提上議事日程。(我們的高考第二語(yǔ)言聽(tīng)說(shuō)測(cè)試早已起步,而且也積累起了不少經(jīng)驗(yàn))
  這種偏頗的測(cè)試方式,遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)代信息社會(huì)的需求.在現(xiàn)今社會(huì),“聽(tīng)”“說(shuō)”“讀”“寫”四種語(yǔ)言活動(dòng)中,“寫”的地位應(yīng)該是最低的,前三者的重要性遠(yuǎn)遠(yuǎn)超過(guò)后者. “據(jù)專家研究,聽(tīng)說(shuō)在一生的語(yǔ)言活動(dòng)中占到75%,而讀寫只占25%.”(吳昌順<<語(yǔ)文教學(xué)需要科學(xué)化>>,出自<<中學(xué)語(yǔ)文教學(xué)>>2000年第九期)
  而傳統(tǒng)觀念里,“讀”也是從屬于“寫”的:“中國(guó)以前所謂‘讀寫結(jié)合’只不過(guò)是把讀物作為寫作的樣本,作為一種仿效的對(duì)象.所謂的‘讀’,只是揣摩作者是如何‘寫’的.閱讀教學(xué),也只是把教材作為一種寫作的模式加以分析,以便對(duì)寫作有所裨益.這種觀念,實(shí)質(zhì)上是以寫作為中心,閱讀不過(guò)是寫作的附庸.”(章熊<<中國(guó)當(dāng)代寫作與閱讀測(cè)試>>四川教育出版社2000, 10第二版47頁(yè))
  國(guó)外多數(shù)國(guó)家的語(yǔ)言測(cè)試則不然,其比例很注意和社會(huì)的需求相吻合.聽(tīng)說(shuō)測(cè)試受到高度重視,而且很多國(guó)家也舉辦的非常成功.此外,閱讀測(cè)試在書面語(yǔ)言測(cè)試中的分量也遠(yuǎn)遠(yuǎn)超過(guò)寫作測(cè)試.以美國(guó)的SAT(相當(dāng)于我國(guó)的高考)為例,其閱讀領(lǐng)會(huì)能力的考查占總分的51%,閱讀短文為五篇(以前為六篇),字?jǐn)?shù)約為2500~3000字;而我國(guó)高考閱讀領(lǐng)會(huì)短文大致為兩三篇,字?jǐn)?shù)約為1000~1500字,分?jǐn)?shù)比例也低得多。我國(guó)高考各科中試題命制科學(xué)性最高(有統(tǒng)計(jì)數(shù)據(jù)為證)社會(huì)信譽(yù)最好的英語(yǔ)科試題閱讀的短文數(shù)量達(dá)七篇左右,占總分一半還多。
  而且,現(xiàn)今寫作能力測(cè)試模式迫切需要改革的最重要的理由是:它是導(dǎo)致語(yǔ)文高考信效度不高的罪魁禍?zhǔn)住T蚝芎?jiǎn)單:我們的作文評(píng)閱雖經(jīng)不斷改進(jìn),但主觀誤差始終得不到有效控制。
  “九十年代初,有關(guān)部門曾經(jīng)連續(xù)做過(guò)幾年研究,結(jié)果表明高考語(yǔ)文試卷中的主觀性試題(主要是作文)誤差達(dá)到總分的40%,盡管我們采取了多種方法(制定作文評(píng)分量表,計(jì)算機(jī)監(jiān)控評(píng)分等)…但誤差仍然較大!保◤垈ッ鳌陡呖颊Z(yǔ)文科考試內(nèi)容與形式的改革》《中國(guó)考試》1999,1期)
  作文的評(píng)分誤差巨大是個(gè)不爭(zhēng)的事實(shí),很多的調(diào)查早已給出了駭人的評(píng)分差距.但筆者認(rèn)為,在大規(guī)?荚囍,誤差還要大得多,因?yàn)檫@里面有個(gè)“動(dòng)機(jī)效應(yīng)是值得注意的。黃煜烽等人的研究中曾經(jīng)讓一位教師在不到一年的時(shí)間里兩次批閱同一篇作文。第二次批改時(shí),作文前加上‘組織教師批改這篇作文的目的旨在測(cè)試語(yǔ)文教師對(duì)學(xué)生作文水平的鑒定水平,以此作為衡量教師批改作文能力的指標(biāo)’這樣一段話作為動(dòng)機(jī)暗示。結(jié)果,第一次評(píng)85分,第二次評(píng)72分,相差13分;第一次的評(píng)語(yǔ)是‘文章結(jié)構(gòu)完整,用詞恰當(dāng),注意了旁征博引,語(yǔ)言老練、簡(jiǎn)明’第二次的評(píng)語(yǔ)是‘本文結(jié)構(gòu)欠嚴(yán)謹(jǐn)和完整,觀點(diǎn)和材料不盡統(tǒng)一,語(yǔ)言上也有毛病’,從肯定變成了否定,截然相反。” (章熊<<中國(guó)當(dāng)代寫作與閱讀測(cè)試>>四川教育出版社2000, 10第二版69頁(yè))
  高考閱卷很大程度上還帶有大鍋飯性質(zhì),監(jiān)督不嚴(yán),建立老師評(píng)卷檔案等工作幾乎為空白,閱卷老師的認(rèn)真度是有限的;而應(yīng)付調(diào)查時(shí),作為調(diào)查對(duì)象,因?yàn)樘貏e在意調(diào)查結(jié)果對(duì)自己造成的影響,必然慎之又慎,再加上調(diào)查時(shí)的勞動(dòng)強(qiáng)度也無(wú)法和高考這類大規(guī)?荚囅嗵岵⒄。
  高考作文評(píng)閱存在的主要問(wèn)題是:
  (1) 投入少時(shí)間短,導(dǎo)致勞動(dòng)強(qiáng)度大
  時(shí)間過(guò)長(zhǎng)會(huì)增大誤差,但太短更會(huì)草菅人命.由于時(shí)間太短作文批改打保險(xiǎn)分的現(xiàn)象非常嚴(yán)重
  “《南方周末》曾對(duì)高考閱卷作過(guò)報(bào)道:近30萬(wàn)份作文,規(guī)定180位老師在10天內(nèi)改完,除去每天高溫休息一小時(shí),其余七小時(shí)不喝水不上廁所不與人說(shuō)話,在每篇作文上也只能停留70秒!保ɡ钊骸堉协h(huán)《關(guān)鍵是怎樣操作》《中學(xué)語(yǔ)文教學(xué)》2003,6)
  “集中全日閱卷,根據(jù)各試驗(yàn)省份的經(jīng)驗(yàn),以日平均90份左右為宜” (章熊<<中國(guó)當(dāng)代寫作與閱讀測(cè)試>>四川教育出版社2000, 10第二版265頁(yè)),實(shí)際的批閱數(shù)量若干倍于此.
 。2)趨中主義
  .評(píng)分既不高也不低,高度集中在中部偏上的狹小區(qū)間內(nèi),既能夠保證閱卷速度,又不容易讓復(fù)查人員抓住把柄.
  “據(jù)江西戴海崎、曹紹游就1987年高考試卷隨機(jī)抽取的2700人樣本統(tǒng)計(jì),二類卷和三類卷占總數(shù)的86%,一類卷和五類卷合起來(lái)僅占6.6%,四類卷占7.4%,成峰值極高的偏態(tài)分布…產(chǎn)生的原因大約有兩個(gè):一是‘打保險(xiǎn)分’,二是連續(xù)作戰(zhàn)統(tǒng)一疲勞,反應(yīng)的靈敏度降低,區(qū)分能力減弱.、據(jù)江西省1990年高考閱卷7月13日、14日和十六日三天的抽樣統(tǒng)計(jì)(樣本數(shù)一千左右),平均分從22.69分(滿分40分)上升為24.33分,標(biāo)準(zhǔn)差則從7.67降為5.97,說(shuō)明分?jǐn)?shù)的離散程度越來(lái)越小,趨中傾向越來(lái)越嚴(yán)重! (章熊<<中國(guó)當(dāng)代寫作與閱讀測(cè)試>>四川教育出版社2000, 10第二版67~68頁(yè))
 。3)思維定勢(shì):
  由于閱卷強(qiáng)度過(guò)大,所以文章的書寫、篇幅、謀篇( 開頭結(jié)尾的安排受到格外重視)等外在因素很大程度上決定了考生的得分。主要由這些因素構(gòu)成的第一印象一旦確立,就很難再改變.
  (4)責(zé)任心差
  很大原因歸咎于制度不全監(jiān)督不力.這兒既有閱卷老師的責(zé)任心問(wèn)題,也有復(fù)查領(lǐng)導(dǎo)的責(zé)任心問(wèn)題.
  “有的閱卷的研究生經(jīng)常遲到早退,‘一位女博士戴著隨身聽(tīng),一邊聽(tīng)音樂(lè)一邊改卷’;‘一高校的副研究員不知為什么年年來(lái)閱卷,它改作文判分一半有誤,有一次查他改的三篇作文,總誤差竟達(dá)三十多分’;一位老師30份作文錯(cuò)判十分以上的有三份(那一年是40分的大作文)…有一本30份的作文幾乎全 ……(未完,全文共23686字,當(dāng)前僅顯示4260字,請(qǐng)閱讀下面提示信息。收藏《高考語(yǔ)文測(cè)試?yán)砟钊笔轿觥?/FONT>