Gestandaardiseerde test

Een gestandaardiseerde test is een test die wordt toegediend en scoorde op een consistente, of "standaard", manier. Gestandaardiseerde tests zijn ontworpen op een zodanige wijze dat de gestelde voorwaarden voor het toedienen, scoringsprocedures en interpretaties zijn consistent en worden beheerd en gescoord op een vooraf bepaalde standaard manier.

Elke test waarbij dezelfde test wordt gegeven op dezelfde wijze voor alle geteste personen is een standaardtest. Gestandaardiseerde tests hoeven niet high-stakes testen, in de tijd beperkte testen, of multiple-choice toetsen. Het tegenovergestelde van een gestandaardiseerde test een niet-gestandaardiseerde test. Niet-gestandaardiseerde testen geeft significant verschillende tests om verschillende geteste personen of geeft dezelfde test onder sterk verschillende omstandigheden, of anders beoordeelt hen.

Gestandaardiseerde tests worden gezien als eerlijker dan niet-gestandaardiseerde tests. De consistentie maakt ook meer betrouwbare vergelijking van de resultaten in alle geteste personen.

Geschiedenis

China

Het vroegste bewijs van gestandaardiseerde testen was in China, waar de keizerlijke examens had betrekking op de Six Arts waarin muziek, boogschieten en horsemanship, rekenen, schrijven, en kennis van de rituelen en ceremonies van zowel publieke als private delen inbegrepen. Later hoofdstukken over militaire strategieën, burgerlijk recht, de inkomsten en belastingen, landbouw en geografie werden toegevoegd aan het testen. In deze vorm, werden de examens geïnstitutionaliseerd voor meer dan een millennium.

UK

Gestandaardiseerde testen werd in Europa geïntroduceerd in de vroege 19e eeuw, naar het voorbeeld van de Chinese mandarijn examens, door de voorspraak van de Britse koloniale bestuurders, de meest "hardnekkige" daarvan was consul van Groot-Brittannië in Guangzhou, China, Thomas Taylor Meadows. Meadows gewaarschuwd voor de ineenstorting van het Britse Rijk als gestandaardiseerde testen niet onmiddellijk ten uitvoer werd gelegd in het hele rijk.

Voorafgaand aan de goedkeuring, gestandaardiseerde testen was geen traditioneel een deel van West-pedagogiek; op basis van de sceptische en een open-ended traditie van het debat geërfd van het oude Griekenland, Westerse academische voorkeur niet-gestandaardiseerde assessments met essays geschreven door studenten. Dit is de reden dat de eerste Europese implementatie van gestandaardiseerde testen kwam niet in Europa goede, maar in Brits India. Geïnspireerd door de Chinese gebruik van gestandaardiseerde testen, in het begin van de 19e eeuw, de Britse "managers ingehuurd en gepromoot werknemers op basis van vergelijkende examens om corruptie en vriendjespolitiek te voorkomen." Deze praktijk van gestandaardiseerde testen werd later in de late 19e eeuw overgenomen door het Britse vasteland. De parlementaire debatten die volgde maakte veel verwijzingen naar de "Chinese mandarijn-systeem."

Het was uit Groot-Brittannië, dat gestandaardiseerde testen verspreid, niet alleen in het Britse Gemenebest, maar naar Europa en dan Amerika. De verspreiding ervan werd gevoed door de Industriële Revolutie. Gezien het grote aantal scholieren tijdens en na de Industriële Revolutie, toen de leerplicht wetten verhoogd student bevolking, open-end beoordeling van alle leerlingen afgenomen. Bovendien, het ontbreken van een gestandaardiseerd proces introduceert een aanzienlijke bron van meetfouten, zoals graders misschien vriendjespolitiek tonen of kunnen het niet eens met elkaar over de relatieve verdiensten van verschillende antwoorden.

Meer recent, het is gevormd voor een deel door het gemak en de lage kosten van het sorteren van multiple-choice toetsen door de computer. Indeling essays van de computer is moeilijker, maar wordt ook gedaan. In andere gevallen, essays en andere open-ended reacties worden gesorteerd volgens een vooraf bepaald assessment rubriek door getrainde graders.

Verenigde Staten

Het gebruik van gestandaardiseerde testen in de Verenigde Staten is een 20e-eeuws verschijnsel met zijn oorsprong in de Eerste Wereldoorlog en het leger Alpha en Beta testen ontwikkeld door Robert Yerkes en collega's. Bij te dragen aan de groei van de gestandaardiseerde tests in de Verenigde Staten in het midden van de jaren 1800 werd immigration.Standardized tests werden gebruikt bij immigratie toen mensen voor het eerst kwam naar sociale rollen te testen en vind sociale macht en status.

Een ander voorbeeld van gestandaardiseerde testen en hoe het begon in de Verenigde Staten was Everett Lindquist, een professor van de Universiteit van Iowa College van Onderwijs, die de ACT, dat is een zeer bekende gestandaardiseerde test gemaakt. De ACT bestaat uit 4 belangrijke afdelingen met meerkeuzevragen, deze secties behoren Engels, Wiskunde, Lezen en wetenschap, met een optionele schriftelijk gedeelte.

De behoefte aan de federale overheid om zinvolle vergelijkingen te maken over een sterk decentrale openbaar onderwijs heeft ook bijgedragen aan het debat over de gestandaardiseerde testen, met inbegrip van het basis- en secundair onderwijs Act van 1965 die gestandaardiseerde testen op openbare scholen verplicht. US Public Law 107-110, bekend als de No Child Left Behind Act van 2001, verdere banden openbare school financiering van gestandaardiseerde testen.

Gestandaardiseerde testen is een veel voorkomende manier van het bepalen van de intelligentie van een student in deze generatie. Sinds 2002, toen de No Child Left Behind Act werd ondertekend door George Bush, studenten hebben gekregen jaarlijks testen die gebruikt worden om de student intelligentie binnen een korte tijd te bepalen. Veel mensen niet eens met gestandaardiseerde testen. Deze mensen beweren dat gestandaardiseerde testen veroorzaakt extreem hoge druk / spanning om goed te doen. De ACT en / of SAT worden gebruikt in college opnames, zodat een student met de verwachtingen van het krijgen in de universiteit om de druk om goed te presteren op deze tests gevoel veroorzaakt. Het verschil van een paar nummers van zijn / haar score kan hij betekenen / zij is aanvaard, of was het niet. Een andere manier dat sommige mensen vonden dat gestandaardiseerde testen is niet handig is, is het feit dat veel leraren zijn meer gericht op het onderwijs aan de test dan zijn ze het onderwijzen van de leerlingen het materiaal echt nodig om te weten. Met een groep studenten niet goed op hun tests zal weerspiegelen alsof hij / zij is een goede leraar. Om te waarborgen dat de leerlingen goed presteren, zal de leraar een meerderheid van klasse tijd onderwijzen aan de test.

Ontwerp en scoren

Gestandaardiseerde testen kan bestaan ​​uit meerkeuzevragen, waar-onwaar vragen, open vragen, authentieke assessments, of bijna elke andere vorm van evaluatie. Multiple-choice en waar-onwaar items worden vaak gekozen omdat ze kunnen worden gegeven en scoorde goedkoop en snel door het scoren van speciale antwoordformulieren door de computer of via de computer-adaptieve testen. Sommige gestandaardiseerde tests hebben korte-antwoord of essay schrijven componenten die een score worden toegekend door onafhankelijke beoordelaars die rubrieken en de benchmark papier te gebruiken om de kwaliteit te bepalen moet worden gegeven aan een reactie. Niet alle gestandaardiseerde tests betrekken beantwoorden van vragen; een authentiek assessment voor atletische vaardigheden kan de vorm van het runnen van voor een bepaalde tijd of of dribbelen een bal voor een bepaalde afstand te nemen.

De meeste evaluaties worden echter niet gescoord door mensen; mensen worden gebruikt om items die niet in staat om gemakkelijk te worden gescoord door de computer zijn te scoren. Bijvoorbeeld, de Graduate Record Exam een ​​computer-adaptieve beoordeling die niet gescoord door mensen moet behalve het schrijven gedeelte.

Scoren kwesties

Human scoren is vaak variabele, dat is de reden waarom de computer scoring waar mogelijk de voorkeur. Bijvoorbeeld, sommige denken dat slecht betaalde werknemers testen slecht zal scoren. Overeenkomst tussen scorers kan variëren tussen 60-85 procent, afhankelijk van de test en de scoring sessie. Soms staat betalen om twee of meer scorers lees elke papier; als hun scores niet akkoord gaat, dan is het papier wordt doorgegeven aan extra scorers.

Onbepaalde componenten van tests zijn vaak slechts een klein deel van de test. Meestal een grote test omvat zowel menselijke-scoorden en computer scoorde secties. Deze belangrijke tests niet de totale vermogen van de student in het leren te meten.

Partituur

Er zijn twee soorten van gestandaardiseerde test score interpretaties: een norm waarnaar wordt verwezen score interpretatie of een criterium verwezen score interpretatie.

  • -Norm verwezen score interpretaties te vergelijken test takers om een ​​monster van de peers. Het doel is om leerlingen te rangschikken als beter of slechter dan andere studenten. -Norm verwezen test score interpretaties worden geassocieerd met het traditionele onderwijs. Leerlingen die beter presteren dan anderen aan de proef, en studenten die slechter presteren dan anderen falen van de test.
  • -Criterium verwezen score interpretaties te vergelijken test takers een criterium, ongeacht de scores van andere examinandi. Deze kunnen ook worden omschreven als op standaarden gebaseerde assessments, omdat ze zijn afgestemd op de op standaarden gebaseerde onderwijshervorming beweging. -Criterium verwezen score interpretaties zijn uitsluitend bezig met de vraag of dit bijzondere student antwoord juist en volledig is. Onder-criterium verwezen systemen, is het mogelijk voor alle studenten om de test te slagen, of voor alle studenten om de test mislukken.

Elk van deze systemen kan worden gebruikt gestandaardiseerde testen. Wat is belangrijk om gestandaardiseerde testen is of alle studenten gevraagd gelijkwaardig vragen, onder vergelijkbare omstandigheden, en even beoordeeld. In een gestandaardiseerde test, als een gegeven antwoord juist is voor een student, het juist voor alle studenten is. Klassers geen antwoord zo goed genoeg voor een leerling te accepteren, maar hetzelfde antwoord te weigeren als ontoereikend voor een andere student.

Standaarden

De overwegingen van de validiteit en betrouwbaarheid doorgaans worden gezien als essentiële elementen voor het bepalen van de kwaliteit van een gestandaardiseerde test. Echter, professionele en beoefenaar verenigingen vaak deze problemen binnen een bredere context geplaatst hebben bij de ontwikkeling van normen en het maken van de algehele oordeel over de kwaliteit van een gestandaardiseerde test als geheel binnen een bepaalde context.

Evaluatie normen

Op het gebied van de evaluatie, en in het bijzonder het onderwijs evaluatie, het Paritair Comité voor normen voor educatieve evaluatie heeft drie sets van normen gepubliceerd voor evaluaties. Het personeel Evaluation Standards werd gepubliceerd in 1988, werd de Program Evaluation Standards gepubliceerd in 1994, en de student evaluatie normen werd gepubliceerd in 2003.

Elke publicatie presenteert en werkt een set van normen voor gebruik in een verscheidenheid van educatieve instellingen. De normen geven richtlijnen voor het ontwerpen, implementeren, beoordelen en verbeteren van de geïdentificeerde vorm van evaluatie. Elk van de normen is in een van de vier fundamentele categorieën geplaatst educatieve evaluaties dat een goede, nuttige, haalbaar en nauwkeurig zijn te bevorderen. In deze sets van normen, zijn validiteit en betrouwbaarheid overwegingen vallen onder de nauwkeurigheid onderwerp. Bijvoorbeeld de juistheid student normen ervoor te zorgen dat student evaluaties geluid, nauwkeurige en betrouwbare informatie over het leren van studenten en de prestaties.

Testen normen

Op het gebied van psychometrie, de Normen voor Onderwijs en psychologische testen normen plaats over de validiteit en betrouwbaarheid, samen met meetfouten en kwesties in verband met de huisvesting van personen met een handicap. De derde en laatste belangrijke onderwerp omvat normen in verband met het testen van applicaties, credentialing, plus testen in evaluatie van het programma en de openbare orde.

Voordelen

Een van de belangrijkste voordelen van gestandaardiseerde testen is dat de resultaten empirisch gedocumenteerd; Derhalve, kan de test scores worden aangetoond dat een bepaalde mate van betrouwbaarheid en validiteit, evenals de resultaten die generaliseerbaar en herhaalbaar zijn hebben. Dit wordt vaak in contrast met cijfers op een school transcript, die worden toegekend door de individuele leerkrachten. Het kan moeilijk zijn om rekening te houden met verschillen in het onderwijs cultuur over scholen, moeilijkheidsgraad van het curriculum van een bepaalde leraar, verschillen in de stijl van lesgeven, en technieken en vooroordelen die indeling beïnvloeden. Dit maakt gestandaardiseerde tests nuttig voor opnames doeleinden in het hoger onderwijs, waarbij een school probeert leerlingen vergelijken uit het hele land of over de hele wereld.

Een ander voordeel is aggregatie. Een goed ontworpen gestandaardiseerde test biedt een overzicht van de beheersing van een domein van kennis of vaardigheden die op een bepaald aggregatieniveau nuttige informatie zal verstrekken van een individu. Dat wil zeggen, terwijl de individuele beoordelingen kan niet nauwkeurig genoeg voor praktische doeleinden, kan de gemiddelde scores van de klassen, scholen, takken van een bedrijf, of andere groepen en nuttige informatie als gevolg van de vermindering van de fout bereikt door het vergroten van de steekproefomvang.

Gestandaardiseerde tests, die per definitie te geven van alle geteste personen dezelfde test onder dezelfde voorwaarden, worden ook gezien als eerlijker dan evaluaties die verschillende vragen of andere voorwaarden voor studenten op basis van hun ras, sociaal-economische status, of andere overwegingen gebruiken.

Effecten

Verenigde Staten

Gestandaardiseerde tests worden gebruikt in elke school rond de Verenigde Staten in bijna elk grade niveau. Deze tests worden aangeduid als high stakes testen en komen met veel namen zoals Iowa Tests van basisvaardigheden, ACT en SAT; maar ze dienen allemaal hetzelfde doel. Alle testen gegeven op deze manier wordt gebruikt om de prestaties van de studenten van de naties beoordelen en bepalen hun vaardigheid onder hun leeftijdsgenoten. Leraren worden ook gemeten op basis van de resultaten van studenten op gestandaardiseerde tests. Als een student wordt gevonden om minder dan gemiddeld wordt gezegd te denken over de leraar en zijn / haar capaciteiten zijn. Het is met deze waarnemingen dat de Verenigde Staten zet haar studenten in gevaar. Het andere probleem met de SAT en ACT, is dat de tests niet mensen die getalenteerd in andere domeinen, zoals kunst, atletiek, creatief schrijven en vele anderen te testen.

Testen in scholen wordt gebruikt in een breed scala van mogelijkheden: het plaatsen van kinderen in leergroepen, ranking scholen onder andere in de regio, staat en natie, en het creëren van een visuele, waar de Verenigde Staten als geheel is post. Wat verbaast velen is gestandaardiseerde testen kan ook een manier scholen verdienste beloning voor leraren bepalen. Leraren in alle leerjaren worden aangemoedigd om hun klas rond de aanstaande proef vorm te geven in de hoop dat hun leerlingen beter presteren dan anderen. De effecten van deze vorm van onderwijs zijn niet gunstig voor iedereen, behalve eventueel de leraar wiens leerlingen goed doen. In het artikel "gestandaardiseerde testen en de slachtoffers" auteur Alfie Kohn staten, "Scholen in het hele land bezuinigen of zelfs elimineren van programma's in de kunsten, uitsparing voor jonge kinderen, keuzevakken voor hoge scholieren, klasse vergaderingen, discussies over actuele gebeurtenissen, de gebruik van de literatuur in de vroege rangen, en hele vakgebieden zoals de wetenschap ".

Bezuinigen op echte klas leren neemt zijn tol op leraren die oprecht geïnteresseerd in het bereiken van de jongeren en hen te helpen groeien waren. "Veel opvoeders zijn het verlaten van het gebied als gevolg van wat er wordt gedaan om de scholen in de naam van 'accountability' en 'strengere normen' '. Leraren worden steeds ontevreden met het veld en degenen die echt zorg over de groei student zijn afstand te doen van hun rol als opvoeders gewoon omdat het is uitgegroeid tot een verwrongen versie van wat het vroeger was. Aspirant-leerkrachten zijn nu tweede gissen de keuze van hun loopbaan als gevolg van de druk die op hen zal worden gezet om de hoge testscores dat de meeste van hun potentiële werkgevers toe te produceren.

Met alle stress leraren en bestuurders onder het zou onredelijk zijn te denken dat het niet afwrijven op de leerlingen zo goed. Sommige scholen zo ver gaan als het ophangen van een visueel hulpmiddel om te laten zien waar hun studenten vallen in vergelijking met hun klasgenoten. Dit laat de leerlingen zien welke van hun klasgenoten bedreven zijn, die pijnlijk voor studenten die onder de gegeven lijn vallen kan zijn. Leraren hebben veel kansen om hun verdienste loon te bereiken; een student kan slechts één kans om een ​​test waardoor ze naar het volgende leerjaar level te halen. Een enkele test kan de uitkomst van de hele schoolloopbaan van een leerling te bepalen, niet goed kan een nadeel voor hun gevoel van eigenwaarde. Een vierde egaliseermachine hoeft niet te voelen gedevalueerd vanwege een test worden ze nog steeds ontwikkelen in een onstabiele snelheid en denken ze allemaal in een nette categorie vaardigheidsniveau te vallen is eenvoudigweg onaanvaardbaar. "Vrijwel alle specialisten veroordelen de praktijk van het geven van gestandaardiseerde tests aan kinderen jonger dan 8 of 9 jaar oud."

Studenten voelen de druk op hen leggen op een heel andere manier dan een volwassene zou doen. Op de vraag of de studenten voelen de druk om hogere scores op gestandaardiseerde tests opvoeder, Ashley Grossman te bereiken, zegt: "Ik denk niet dat ze volledig te begrijpen. Ze voelen zich geïntimideerd en benadrukte rond testtijd, maar sommige van hen zijn als dat bij elke test ". Kinderen kunnen niet het gevoel onder druk voortdurend zonder dat dit een negatief effect op hun emotionele en potentieel fysieke toestand. Stress effecten kinderen veel hetzelfde als het kan een volwassene, soms ernstig. Volgens schrijver Josh Ska, "Symptomen van te veel stress zijn meestal zeer duidelijk bij kinderen, hoewel ze verward zijn opstandige of moeilijk zou kunnen zijn. Een kind dat regelmatig opblaast dan niets kunnen zijn problemen op school of thuis, die er de oorzaak van chronische stress. Een andere mogelijke teken van stress is gespannenheid of nervositeit en slechte concentratie, wat huiswerk kunnen beïnvloeden. Kinderen die gestrest kan ook stoppen met eten of ziek vaker. De constante adrenaline rush kunnen houden ze 's nachts wakker en je zou merken dat uw kind lijkt om slapeloosheid te hebben, hoewel ze is uitgeput. Buikpijn is een veel voorkomende klacht bij kinderen die lijden aan dit probleem, net als darmproblemen en hoofdpijn ".

Machines scoren tests niet verminderen van de vooringenomenheid van het testen in any way. Voor de multiple choice problemen is het een eenvoudige goed of fout; echter, zijn computers gebruikt om te scoren essay porties ook. Criterium is de naam van de indeling van software om de vaardigheid van het schrijven vaardigheden van een student te bepalen. De Universiteit van Californië overweegt het gebruik van deze software om te bepalen of de studenten kwamen in aanmerking voor een schrijven cursus, die de instructeur was tegen overslaan. Om zijn punt de instructeur, Andy Jones bewijzen, nam een ​​brief van aanbeveling dat hij had geschreven om het te scoren. Auteur Alain Jehlen merkt op: "vervangen door de naam van de student met een paar woorden uit een Criterion schrijven prompt en vervangen 'chimpansee' voor elke 'het.' Criterium hield het resultaat, noemde het 'overtuigende' en 'goed gearticuleerd'". Als het veranderen van een enkel woord en het creëren van een onzinnige papier werd zo goed gescoord, dan kan men alleen maar voorstellen wat voor soort van schrijven monsters deze machine werd doorlaten en bellen "geweldig."

Claims zijn tegen gestandaardiseerde tests bracht in de rechtbank als gevolg van vooringenomenheid. De wettigheid van een test is gebaseerd op zeven factoren: ongelijke gevolgen, validatie studies, staat interesse, kennis en implementatie, gerechtelijke eerbied, sanering en herkansingen, en als de test is zelfgemaakt. Met al deze dingen in aanmerking genomen zijn er nog een aantal gevallen waarin een test werd gevonden bevooroordeeld te zijn en werd onbetrouwbaar geregeerd door het rechtssysteem.

Debra P. v. Turlington is een gedocumenteerd geval waarin een gestandaardiseerde test werd uitgedaagd op basis van raciale vooroordelen. De SSAT II werd geclaimd ongrondwettelijk in de manier waarop het in staat was om de studenten die de test high school diploma's niet te ontkennen zijn. De studenten in kwestie werden verstrekt onvoldoende kennis van het afstuderen eisen en voldoende tijd om zich voor te bereiden voor de test niet gegeven. Shelly Mack constateert in haar onderzoek, "De rechtbank vond dat de SSAT II had een duidelijk disproportionele impact op Afrikaanse Amerikaanse studenten, en merkte op dat Florida bedoeld om discrimineren Afro-Amerikaanse kinderen tussen 1967-1971". De staat toegelaten tot wetens discrimineren deze kinderen, zodat ze niet zouden afstuderen.

Crump v. Gilmer Independent School District is een andere zaak waarin het afstuderen werd opknoping op een enkele test. Drie studenten hadden allemaal mislukt de Texas beoordeling van academische vaardigheden Onderzoek. Twee van deze leerlingen met succes afgerond alle andere eisen afstuderen, terwijl de derde student niet gehad. TAAS had alleen een vereiste afstuderen in 1991, twee jaar voordat dit geval werd gepresenteerd in de rechtbank te worden, waardoor het argument van de studenten had onvoldoende tijd voor te bereiden voor de test, volgens Debra P. v. Turlington verklaard dat er minstens vier tot zes jaar voorbereidingstijd van de bekendmaking voordat een nieuw proces kan worden uitgevoerd. De twee studenten die met succes alle andere eisen afstuderen had afgesloten werden toegekend hun diploma, terwijl de derde leerling was. Het werd geacht dat de derde student ontkenning was constitutionele omdat er leek geen inspanning van zijn kant vanuit een academisch oogpunt zijn.

Ondanks de vooroordelen van gestandaardiseerde testen de vraag blijft of deze tests blijkt zelfs eigenlijke leren of leerpotentieel van een student. Lijkt het antwoord een volmondig "nee" uit alle bronnen te zijn. Het aantal gissingen dat juist zijn gemarkeerd hoeft de student niet aan te geven is de vaardigheid in kwestie onder de knie; vaker wel dan niet hadden ze één kans op vier juistheid. Foute antwoorden correct worden gemeten, omdat de student duidelijk niet het materiaal kennen, maar de juiste antwoorden zijn niet indicatief van kennis. Een juist antwoord kan wijzen op twee andere mogelijkheden dan de beheersing van vaardigheden; "Een goed antwoord kan worden bereikt met behulp geheugenopslag zonder grondig inzicht in de onderliggende inhoud of conceptuele structuur van het gestelde probleem" of eenvoudig een blinde gok resulteert in een positief resultaat.

Er zijn echter positieve aspecten aan gestandaardiseerde tests; speciaal voor jonge kinderen. Het doel van gestandaardiseerde tests voor jonge kinderen is ontwikkelingsvertragingen identificeren en ontwikkelen van een jong kind te evalueren. De gestandaardiseerde tests die worden gebruikt voor jonge kinderen zijn screeningtests, diagnostische tests, taaltoetsen en prestatie testen. Een screeningstest wordt gebruikt om een ​​indicatie van een ontwikkelingsstoornis probleem identificeert als een probleem moet verder onderzocht detecteren. Een diagnostische test wordt gedaan als een kind heeft reeds scherm tests en geeft verdere evaluatie. Diagnostische tests zijn ontworpen om ontwikkelingsstoornissen problemen in verband met leerstoornissen te beoordelen. Een taaltoets wordt vaak toegediend aan studenten die worden beschouwd als at-risk. Taaltoetsen bepalen of een student zou profiteren van een taal verrijkingsprogramma. De prestatie test werd ontworpen voor kinderen in het Head Start programma en werd ingevoerd door de regering van George W. Bush. Globale gestandaardiseerde tests worden niet alleen gebruikt om jonge kinderen te beoordelen, maar is een geweldige manier om ontwikkelingsproblemen bij jonge kinderen op te sporen.

Een voorstander van gestandaardiseerde testen is de No Child Left Behind Act. Dit wetsvoorstel ondersteunt op standaarden gebaseerde hervorming van het onderwijs, "het geloof dat het instellen van hoge normen en tot vaststelling van meetbare doelen individuele resultaten kan verbeteren in het onderwijs". NCLB is wat stelt u het testen razernij van de Verenigde Staten in beweging. De rijksoverheid gaven aan dat de in te stappen en over te nemen, waar regeringen waren niet. Alle act leek te doen in werkelijkheid was het opzetten van een systeem van stimulansen voor opvoeders als testresultaten verbeterd. "Het systeem van prikkels en sancties stelt een sterke motivatie voor scholen, wijken, en staten om testresultaten te manipuleren. Zo hebben de scholen is aangetoond dat 'creatieve herindeling' drop-outs 'in dienst.

NCLB heeft aangemoedigd het "leren de test" methode steeds meer scholen hun plaats gezet, waardoor studenten niet correct interpreteren van de testmaterialen ondanks getraind voor hen. Leraren worden geleerd om te anticiperen op wat er zal worden op de test en leren de studenten alleen dat materiaal, wat leidt tot studenten die vage eventuele begrip van alle andere concepten die ze nodig hebben. "Veel docenten die de praktijk 'onderwijs op de proef' eigenlijk verkeerd interpreteren van de onderwijsresultaten van de tests zijn ontworpen om te meten. Op twee staat tests en de Nationale Beoordeling van Onderwijs Progress bijna tweederde van de achtste klassers miste wiskundige woord problemen die een toepassing van de stelling van Pythagoras die nodig is om de afstand tussen twee punten berekenen ".

Gestandaardiseerde testen is een nadeel voor de studenten, die hen psychisch, emotioneel en intellectueel. Hun gevoel van eigenwaarde wordt verlaagd als ze niet scores kunnen zij streven naar te ontvangen, of als ze niet zo goed als hun klasgenoten. Studenten worden onder onnodige stress te maken aan beter te presteren, gewoon omdat leraren onder druk worden gezet om ervoor te zorgen dat hun leerlingen goed doen. Belangrijke programma's worden langzaam uit scholen om zich te richten op "het onderwijs op de proef." Studenten moeten leren van de sociale en morele vaardigheden die komen met het zijn met name de buitenschoolse groepen of keuzevakken samen met hun fundamentele onderwerpen, maar met klaslokalen zijn testen gericht een aantal van de belangrijkste echte wereld vaardigheden worden ontnomen. Dit stuurt een zeer reële rode vlag voor de toekomst over de soorten mensen die zal worden uitgevoerd van de Verenigde Staten. Zij kunnen doelgericht zijn, maar het zijn mensen gericht is net zo belangrijk kwaliteit have.Part van de schuld valt op de opvoeders, beheerders, en stelt voor het niet uit te spreken, maar het grootste deel van de schuld ligt bij de regering voor het verhogen van de normen in een dat is ongezond.

Publiek beleid

Gestandaardiseerde testen wordt gebruikt als een strategie voor de openbare orde om sterker verantwoording maatregelen vast te stellen voor het openbaar onderwijs. Terwijl de National Assessment van Onderwijs Progress als een educatieve barometer voor zo'n dertig jaar heeft gediend door het toedienen van gestandaardiseerde tests op een regelmatige basis om willekeurige scholen in de Verenigde Staten, hebben de inspanningen van de afgelopen tien jaar op de staats-en federaal niveau jaarlijkse gestandaardiseerde test administratie opdracht voor alle openbare scholen in het hele country.The wetgeving aangenomen door het Congres in 2001, No Child Left Behind was bedoeld om de prestaties van leerlingen te versterken en zorgen voor financiële zekerheid voor scholen die met succes de in plaats door de staat normen te bereiken voordat de federale deadline wordt gehaald . Het doel van het federaal mandaat financiering is om ervoor te zorgen dat de jeugd van ons land leren verantwoording en studievoortgang en docenten succes) adequaat te meten. Echter, de wetgeving blijft critici, omdat het algemeen kan bieden onvoldoende financiering voor worstelende openbare school districten te bereiken en de in plaats van AYP normen te handhaven. De set voor scholen in Stephens County normen, Georgia is net als de meeste titel I schoolsystemen in de VS, Stephens County volgen toenemende-test normen, als een titel heb ik school mist AYP voor twee opeenvolgende jaren, wordt het label "moet worden verbeterd," en studenten kunnen overdragen naar een hoger presterende scholen in de wijk. Drie rechte dalende jaar en een school moet gratis begeleiding en andere aanvullende diensten aan te bieden aan studenten met problemen. Vier rechte en de school nodig heeft "corrigerende maatregelen", die enorme personeelsverloop, verhoogde klasse tijden en nieuwe curriculum zou kunnen betekenen. Vijf rechte jaar betekent dat de totale herstructurering van de school en zes rechte betekent dat de beperkende plan wordt uitgevoerd en kan resulteren in de school sluiting.

Het idee achter de gestandaardiseerde beweging testen beleid is dat het testen is de eerste stap naar de verbetering van scholen, het onderwijs de praktijk en pedagogische methoden door middel van het verzamelen van gegevens. Voorstanders beweren dat de door de gestandaardiseerde tests gegevens fungeren als een 'rapport' voor de gemeenschap, waaruit blijkt hoe goed lokale scholen presteren. Critici van de beweging, wijzen echter op verschillende afwijkingen die het gevolg zijn van de huidige stand gestandaardiseerde testen praktijken, waaronder problemen met de validiteit en betrouwbaarheid te testen en valse correlaties.

Critici beschuldiging dat gestandaardiseerde tests werd een verplichte curriculum geplaatst in scholen, zonder openbaar debat en zonder enige verantwoording maatregelen van zijn eigen. Velen voelen dit negeert fundamentele democratische principes in dat de controle van de leerplannen van scholen is verwijderd van de lokale schoolbesturen, die de nominale curriculaire autoriteit in de VS Terwijl sommigen beweren dat het beter om gewoon te introduceren verplichte nationale curricula zou zijn, anderen vinden dat de staat gemandateerde gestandaardiseerde testen moet helemaal stoppen, zodat scholen hun inspanningen kunnen richten op het instrueren van hun leerlingen als zij dat nodig achten.

Critici rekenen ook dat gestandaardiseerde tests aan te moedigen "onderwijs op de proef" ten koste van de creativiteit en diepgaande dekking van de onderwerpen die niet op de test. Multiple choice tests worden verweten om vaardigheden te beoordelen zoals schrijven. Bovendien is het succes student wordt bijgehouden aan de relatieve performance van een leraar, waardoor leraar vooruitgang afhankelijk van het succes van een leraar met de academische prestaties van een student. Ethische en economische vragen rijzen voor leraren wanneer zij worden geconfronteerd met duidelijk underperforrming of underskilled studenten en een gestandaardiseerde test.

Nadelen en kritiek

De geldigheid, doeltreffendheid en voorspellende kracht van gestandaardiseerde tests wordt betwist. Velen beweren dat overmatig gebruik en misbruik van deze tests Harms onderwijzen en leren door het verkleinen van het curriculum. Volgens de groep FairTest, wanneer gestandaardiseerde tests zijn de belangrijkste factor in de verantwoording, scholen gebruik maken van de tests om eng curriculum definiëren en focus instructie. FairTest zegt dat de negatieve gevolgen van de test verkeerd omvatten het verkleinen van het curriculum, het onderwijs op de proef gesteld, waardoor de studenten van school, het rijden leraren uit het vak, en ondermijnt student betrokkenheid en schoolklimaat. Critici zeggen dat 'het onderwijzen aan de test "disfavors hogere-orde leren. Hoewel het mogelijk is een gestandaardiseerde test te gebruiken zonder dat de inhoud vast programma en instructies, vaak, wat niet getest niet geleerd hoe het onderwerp getest wordt vaak model hoe het onderwerp leren.

Kritiekloos gebruik van gestandaardiseerde testscores om leraar en de school prestaties te evalueren ongepast is, omdat de studenten scores worden beïnvloed door drie dingen: wat de leerlingen leren op school, wat de leerlingen leren buiten de school en de leerlingen aangeboren intelligentie. De school heeft enige controle over deze drie factoren. Toegevoegde waarde modeling is voorgesteld om te gaan met deze kritiek door statistisch controleren voor aangeboren vermogen en out-of-scholen contextuele factoren. In een toegevoegde waarde systeem van de interpretatie van testscores, analisten schatten een verwachte score voor elke student, op basis van factoren zoals de student eigen eerdere test scores, primaire taal, of sociaal-economische status. Het verschil tussen de student verwachte score en de werkelijke score wordt geacht te zijn voornamelijk te wijten aan de inspanningen van de leerkracht.

Voorstanders van gestandaardiseerde testen antwoorden dat dit geen redenen om gestandaardiseerde testen te verlaten ten gunste van een van beide niet-gestandaardiseerde testen of geen aanslag op alle, maar de kritiek van slecht ontworpen testen regimes. Zij betogen dat het testen doet en moet educatieve middelen te concentreren op de belangrijkste aspecten van het onderwijs het meegeven van een vooraf gedefinieerde set van kennis en vaardigheden en dat andere aspecten zijn ofwel minder belangrijk is, of moet worden toegevoegd aan het testschema.

In haar boek, Now You See It, Cathy Davidson bekritiseert gestandaardiseerde tests. Ze beschrijft onze jeugd als "assemblagelijn kinderen op een assemblagelijn model," wat betekent dat het gebruik van gestandaardiseerde test als een onderdeel van een one-size-fits-all onderwijsmodel. Ze heeft ook kritiek op de beperktheid van vaardigheden worden getest en etikettering kinderen zonder deze vaardigheden als falen of studenten met een handicap. Wijdverbreid en georganiseerde bedrog heeft een groeiende cultuur in de huidige hervorming van de scholen geweest.

Onderwijs theoreticus Bill Ayers heeft gereageerd op de beperkingen van de gestandaardiseerde test, het schrijven van dat "Gestandaardiseerde tests kunnen initiatief, creativiteit, verbeelding, conceptueel denken, nieuwsgierigheid, inspanning, ironie, oordeel, toewijding, nuance, goede wil, ethische reflectie niet te meten, of een tal van andere waardevolle disposities en attributen. Wat ze kunnen meten en rekenen zijn geïsoleerde vaardigheden, de specifieke feiten en functie, inhoudelijke kennis, de minst interessante en minst belangrijke aspecten van leren. "

In een april 1995 "meta-analyse", gepubliceerd in het Journal of Educational en Psychologische Meting, Todd Morrison en Melanie Morrison onderzocht twee dozijn geldigheid onderzoeken van de test nodig is om in zowat elke Masters of PhD-programma in Amerika: de Graduate Record Examination . Deze studie omvatte meer dan 5000 geteste personen in de afgelopen 30 jaar. De auteurs vinden dat GRE scores goed voor slechts 6 procent van de variatie in de rangen in graduate school. De GRE lijkt te zijn "vrijwel nutteloos uit een voorspelling oogpunt", schreef de auteurs. Herhaalde studies van de Law School Admissions Test vinden hetzelfde. De SAT's maker, de Educational Testing Service, beweert nu de SAT is niet een "proeve van bekwaamheid" test, maar eerder een beoordeling van "ontwikkelde vaardigheden."

Een ander nadeel van gestandaardiseerde tests is de kostprijs. Vermeld is dat de Verenigde Staten jaarlijks uitgeeft ongeveer 1,7 miljard dollar aan deze testen.

Scoren informatie verlies

Area = 7,5 cm Basis = 5 cm; Hoogte = 3 cm
Area = / 2
= / 2
= 7,5 cm De eerste shows scoren verlies van informatie. De leraar weet of de student kreeg het juiste antwoord, maar weet niet hoe de student aangekomen bij het antwoord. Als het antwoord fout is, is de leraar niet weet of de student is gissen, maakte een eenvoudige fout, of fundamenteel verkeerd begrijpt het onderwerp.

Wanneer tests worden gescoord rechts-fout, heeft een belangrijke aanname gemaakt over het leren. Het aantal juiste antwoorden of de som van itemscores wordt aangenomen dat de passende en voldoende mate van de huidige prestaties status. Daarnaast wordt een tweede aanname dat er geen zinvolle informatie in de verkeerde antwoorden.

In de eerste plaats kan een juist antwoord worden bereikt met behulp geheugenopslag zonder grondig inzicht in de onderliggende inhoud of conceptuele structuur van het gestelde probleem. Ten tweede, wanneer meer dan een stap voor oplossing vereist, zijn er vaak verschillende benaderingen antwoordende die leidt tot een correct resultaat. Het feit dat het antwoord juist niet aangeeft welke van meerdere mogelijke procedures werden toegepast. Wanneer de student levert het antwoord op deze informatie is direct beschikbaar van de originele documenten.

Ten tweede, als de verkeerde antwoorden waren blind gissingen, zou er geen informatie te vinden onder deze antwoorden zijn. Anderzijds, als verkeerde antwoorden tijdens interpretatie afwijkingen van de verwachte ene deze antwoorden moeten een geordende verhouding tot wat de totale proef meet tonen. Deze afwijking moet afhankelijk van het niveau van psycholinguïstische looptijd van de student kiezen of het geven van het antwoord in de volkstaal waarin de test wordt geschreven zijn.

In het tweede geval moet het mogelijk zijn deze volgorde vanaf de reacties op de testonderdelen te extraheren. Dergelijke extractie processen, het Rasch model zijn bijvoorbeeld standaard praktijk voor punt ontwikkeling onder professionals. Echter, omdat de verkeerde antwoorden tijdens het scoren worden verwijderd, tracht de antwoorden op de informatie die zij kunnen bevatten is zelden uitgevoerd interpreteren.

Ten derde, hoewel thematische subtestscores soms worden verstrekt, de meest voorkomende praktijk is om de totale score of een geschaalde versie van dit te melden. Dit herschalen is bedoeld om deze scores te vergelijken met een standaard van een soort. Deze verdere ineenstorting van de testresultaten systematisch verwijdert alle informatie over die bepaalde items werden gemist.

Zo, het scoren van een test met de rechtermuisknop verkeerde verliest 1) hoe leerlingen hun juiste antwoorden bereikt, 2) Wat bracht hen op een dwaalspoor richting onaanvaardbaar antwoorden en 3), waar in het lichaam van de test deze afwijking van de verwachting opgetreden.

Dit commentaar suggereert dat de huidige scoringprocedure verbergt de dynamiek van de test nemen proces verduistert de mogelijkheden van de leerlingen beoordeeld. Huidige scoren praktijk te simpele deze gegevens in de eerste scoring stap. Het resultaat van deze vormfout is obscure van de diagnostische informatie die kan helpen docenten dienen hun leerlingen beter. Het voorkomt verdere die ijverig voorbereiden deze testen uit te kunnen de gegevens die anders zouden zijn gewaarschuwd voor de aanwezigheid van deze fout te observeren.

Een oplossing voor dit probleem, zogenaamde Response Spectrum evaluatie, wordt momenteel ontwikkeld die lijkt te kunnen recupereren alle drie de vormen van informatieverlies, terwijl toch een numerieke schaal huidige performance status vast te stellen en prestatiesverandering volgen.

Deze RSE benadering biedt een interpretatie van de denkprocessen achter elk antwoord dat leerkrachten hoe ze dachten voor elk antwoord bieden ze vertelt. Onder andere bevindingen, dit hoofdstuk meldt dat de realiseerbare informatie legt tussen twee en drie keer meer van de test variabiliteit dan overweegt alleen de juiste antwoorden. Deze enorme verlies van informatie kan worden verklaard door het feit dat de "verkeerde" antwoorden worden verwijderd uit de test informatie tijdens het scoren proces wordt verzameld en is niet langer beschikbaar voor de procedurele fout die inherent zijn aan de rechter ongelijk scoren onthullen. De werkwijze omzeilt de door lineaire afhankelijkheden inherente testgegevens beperkingen.

Testen vertekening ontstaat wanneer een test stelselmatig bevoordeelt de ene groep over de andere, hoewel beide groepen gelijk zijn aan de eigenschap van de test meet. Critici beweren die test makers en begeleiders hebben de neiging om een ​​middenklasse, witte achtergrond vertegenwoordigen. Critici beweren dat gestandaardiseerde testen overeenkomen met de waarden, gewoonten en taal van de test makers. Echter, is dat de meeste tests komen van een witte, middle-class achtergrond is het belangrijk op te merken dat de hoogst scorende groepen zijn geen mensen van die achtergrond, maar eerder de neiging om te komen van de Aziatische bevolking.

Niet alle tests zijn goed geschreven, die bijvoorbeeld multiple-choice vragen met dubbelzinnige antwoorden, of een slechte dekking van het gewenste curriculum. Sommige gestandaardiseerde tests omvatten open vragen, en sommige hebben de effectiviteit van de indelingsmethoden bekritiseerd. Onlangs heeft gedeeltelijke geautomatiseerde sortering van essays ingevoerd voor een aantal tests, die nog controversieel.

Educatieve beslissingen

Testscores zijn in sommige gevallen gebruikt als enige, verplichte of belangrijkste criterium voor toelating of certificatie. Bijvoorbeeld, sommige Amerikaanse staten vereisen middelbare school afstuderen examens. Voldoende scoort op deze exit examens zijn nodig voor de middelbare school afstuderen. De Algemene Onderwijsontwikkeling test wordt vaak gebruikt als een alternatief voor een middelbare school diploma.

Andere toepassingen zijn tracking en uitreiking beurzen. In de Verenigde Staten, veel hogescholen en universiteiten automatisch vertalen van scores op Advanced Placement testen in college credit, de tevredenheid van de eisen afstuderen, of plaatsing in meer gevorderde cursussen. Gegeneraliseerde tests zoals de SAT of GRE worden vaker gebruikt als een maatstaf tussen verschillende delen bij opnames beslissingen. Sommige openbare instellingen cutoff scores voor de SAT, GPA, of klasse rang, voor het creëren van klassen van de aanvragers om automatisch te accepteren of te weigeren.

Zware afhankelijkheid van gestandaardiseerde tests voor de besluitvorming is vaak omstreden, om de redenen die hierboven vermeld. Critici stellen vaak de nadruk op cumulatieve of zelfs niet-numerieke maatregelen, zoals de klas kwaliteiten of korte individuele beoordelingen van leraren. Voorstanders beweren dat testscores zorgen voor een duidelijke, objectieve norm dat het potentieel voor politieke invloed of vriendjespolitiek minimaliseert.

De National Academy of Sciences beveelt aan dat belangrijke educatieve beslissingen niet uitsluitend gebaseerd op een test score. Het gebruik van minimale cut-scores voor de ingang of afstuderen impliceert niet één standaard, omdat testscores worden bijna altijd gecombineerd met andere minimale criteria zoals het aantal studiepunten, voorwaarde cursussen, het bijwonen, etc. Test scores worden vaak gezien als de " enige criterium "simpelweg omdat ze het moeilijkst, of de naleving van andere criteria wordt automatisch aangenomen. Een uitzondering op deze regel is de GED, die heeft geleid veel mensen om hun vaardigheden erkend, hoewel zij niet aan de traditionele criteria.

(0)
(0)
Commentaren - 0
Geen commentaar

Voeg een reactie

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tekens over: 3000
captcha