fbpx

Evaluarea standardizată în științe exacte vs. științe umaniste

de Dragoș Iliescu, fondator Brio

Există foarte puține lucruri în domeniul cognitiv (cunoștințe, competențe, abilități, trăsături, motivație etc.) care să nu poată fi măsurate cu acuratețe. Domeniul măsurării psihologice și comportamentale a evoluat atât de mult din punct de vedere tehnic încât tot ce e necesar este un bun cadru de evaluare și suficiente resurse.

 

Cadrul de evaluare este cel care definește cu claritate ce anume trebuie evaluat, dar și componentele a ceea ce trebuie evaluat, atât din punct de vedere al structurii, cât și al competenței.

 

Să luăm un exemplu concret: trebuie să evaluăm competențele de matematică pentru clasa a cincea. 

 

Care sunt, specific, competențele? 

Pe baza căror conținuturi le vom evalua? Fracții, mulțimi, puteri, ecuații etc.? 

Evaluăm doar ușurința aritmetică sau și gândirea matematică? Adică doar capacitatea de rezolvare a unor probleme exprimate deja în limbaj matematic sau și capacitatea de a exprima în limbaj matematic probleme formulate în limbaj cotidian? 

 

Resursele sunt cele care definesc „sofisticarea” (complexitatea) pe care evaluarea o va avea: anumite componente definite în cadrul de evaluare pot fi măsurate mai ușor, în timp ce altele nu pot fi măsurate decât cu „sofisticare” tehnică superioară.

 

De exemplu, o componentă motivațională poate fi măsurată în multe feluri. O măsurare cu un grad mai mic de sofisticare tehnică ar fi auto-raportarea: întrebăm elevul dacă este sau nu este motivat de o anumită activitate.

 

O măsurare cu grad mai înalt de sofisticare tehnică ar fi generarea unei simulări, în care elevul este confruntat cu alegeri comportamentale multiple – trebuie să facă, efectiv, lucruri, iar aceste alegeri comportamentale sunt apoi analizate.

 

Evaluarea standardizată a competențelor academice diferă mult între științele exacte și științele umaniste, însă ambele se bazează pe aceleași două mari caracteristici: formularea obiectivă a cadrului de evaluare și resursele (sofisticarea necesară pentru o măsurare adecvată).

 

Dacă ne raportăm la capacitatea de a defini specific cadrele de evaluare, acest lucru este mult mai ușor de făcut în științele exacte decât în științele umaniste. Structura competențelor pentru matematică este mai clară decât structura competențelor pentru limba română.

De exemplu, în ceea ce privește utilizarea eficientă a limbajului într-un context dat, sunt evaluate, de fapt, și componente ale învățării trecute, formale sau non-formale: cunoștințe ale elevului, vocabular, construcții și argumente etc. 

 

În științele umaniste există, inevitabil, o parte consistentă de subiectivism: ce înseamnă construirea eficientă a unui argument, de exemplu? 

Soluția nu este niciodată unică și există multe căi către succes: unii elevi sunt mai elocvenți utilizând în argumentele lor emoții, dar un vocabular plat, iar alții utilizând un vocabular variat, dar o construcție prea rațională. Ambele abordări ar putea funcționa, iar frumusețea și eficiența rezultatului este privită subiectiv de evaluator – căci are întotdeauna și o componentă stilistică.

 

Așadar, în cazul științelor umaniste, evaluarea se face aproape exclusiv la nivel de componente. Este imposibil, de exemplu, să evaluăm construcția unui comentariu literar ca pe o problemă de matematică, dacă elevul a obținut răspunsul corect. 

În schimb, evaluăm felul în care a construit argumentul, felul în care a stăpânit informațiile, felul în care a legat acele informații din textul comentat de informații externe textului, de exemplu, despre autor, despre contextul scrierii operei, despre curentul literar din care opera face parte, despre probleme sociale sau de altă natură atacate de operă.

 

Este evaluată, așadar, și cultura sa generală, vocabularul și, evident, componenta stilistică amintită și anterior. Nimic din aceste aspecte nu poate fi evaluat automatizat, cu anumite excepții: cele în cazul cărora corectitudinea sau greșeala pot fi observate în mod obiectiv.

Vorbim aici despre gramatica limbii române, cunoștințele factuale despre conținutul unui text, definiții sau clasificări – acestea pot fi evaluate prin teste grile.

 

Capacitatea de a dezvolta un discurs pe o temă anume nu poate fi evaluată automat decât cu o sofisticare mult mai mare a metodelor. Au fost făcuți pași importanți spre dezvoltarea de soluții de procesare automată a textului, iar în teste de limbă precum TOEFL, eseurile scrise de persoanele testate sunt evaluate de computer pe baza unor modele de inteligență artificială (automated essay scoring). Dar dezvoltarea acestor metode implică costuri financiare mari, precum și un interval de timp consistent necesar dezvoltării.

 

Pentru științele exacte, aproape orice problemă este ușor de formulat în termeni de rezultat – rezultatul care trebuie obținut este unul singur. Acesta este și motivul pentru care testul grilă este metoda preferată în evaluare. Sunt (eventual) posibile punctaje intermediare, pentru diverse faze ale rezolvării problemei, dar chiar și aceste componente pot fi evaluate obiectiv și automat.

 

În concluzie, putem spune că evaluarea riguroasă și automată (computerizată) a competențelor academice este posibilă atât în științele exacte, cât și în științele umaniste. 

Pentru științele umaniste, însă, anumite componente sunt mult mai dificil de măsurat automat: necesită tehnologie avansată și resurse financiare și temporale mult mai mari pentru dezvoltarea acestor tehnologii.

 

Dragoș Iliescu va participa la webinarul ”Totul despre testarea standardizată”, care va avea loc joi, 20 aprilie. Înscrie-te și tu la webinar, aici: https://www.facebook.com/events/559088218777318/

Scrie un comentariu

Adresa ta de email nu va fi publicată.

Pagina data web este protejata cu reCAPTCHA care este in aplicarePolitica confidialitatii si Conditiile de service Google.