IL PROBLEMA DELLA VALUTAZIONE: ESPERIENZE SU PROVE OGGETTIVE DI CHIMICA

 

Sergio Anthoine-Dietrich, Ezio Cardani, Raffaele Pentimalli

 

Premessa generale

Il passaggio dalla misurazione con prove oggettive ad una valutazione espressa con il tradizionale voto, è complesso e ricco di implicazioni.  Questo non tanto per le particolari difficoltà tecniche implicate, quanto perché la valutazione è l’aspetto del processo educativo sul quale si sono concentrate l’attenzione e l’interesse dei critici della attuale scuola.  La valutazione tradizionale, si è detto, non fa che riprodurre le stratificazioni sociali esistenti: ad un buon livello socio-culturale corrisponde una buona prestazione scolastica, ad un basso livello una cattiva, le eccezioni rendono solamente più accettabile questo quadro complessivo.  La pratica tradizionale non fa che prendere atto delle differenze esistenti e non fornisce informazioni idonee a rimuovere le cause di questa discriminazione, almeno quelle che sono inerenti al processo educativo.  In relazione a questi giudizi sui procedimenti tradizionali di valutazione si sono diffusi comportamenti avalutativi che vanno dal rifiuto della funzione valutativa ad atteggiamenti di clemenza programmatica.  Il rimedio è forse peggiore del male.

 

Riteniamo infatti che la valutazione sia necessaria; essa deve essere frequente, ma deve anche essere una valutazione formativa, deve cioè fornire informazioni che consentono adeguate e tempestive strategie di recupero.  È infatti accertato in sede scientifica che almeno il 90% degli studenti può raggiungere obiettivi educativi impegnativi, come pure che la qualità delle prestazioni non è influenzata dal tempo impiegato per raggiungerla.  Parrebbe allora possibile, in rapporto a determinati obiettivi, passare da una distribuzione casuale delle prestazioni (curva a campana) ad una distribuzione diversa rappresentabile graficamente con una curva a J. [1]  Si tratterebbe allora di risolvere un problema in parte politico: come dotare la scuola delle competenze, delle risorse e dell’organizzazione necessarie ad un processo educativo durante il quale non si prenda semplicemente atto delle attitudini d’ingresso, ma si favorisca lo sviluppo delle capacità di tutti gli studenti.

 

Fatte queste considerazioni rimane, tuttavia, nella attuale scuola, il problema pratico del passaggio dalle misurazioni ai voti.  Presumibilmente tale problema si presenterà anche in una futura scuola rinnovata, per quei livelli scolastici nei quali occorrerà effettuare una certa selezione.  Ci pare perciò utile presentare alcune tecniche di passaggio dai punteggi grezzi delle prove oggettive ai voti, nel caso di una distribuzione gaussiana delle prestazioni.  Questo problema, inoltre, riveste una notevole importanza, dato che rappresenta la fase più delicata della valutazione, dove la ineliminabile soggettività può vanificare, in parte, gli sforzi tesi verso la maggiore oggettività possibile messi in atto nella fase di misurazione.  Il modo tradizionale di assegnare i voti, si è dimostrato molto impreciso e scarsamente riproducibile; lo stesso voto assume significati diversi non solo per diversi insegnanti, il che è già grave, ma anche per lo stesso insegnante in epoche diverse.  Di qui la necessità di ricorrere a metodi che, lasciando il minor spazio possibile alla soggettività, rendano univoco il significato del voto.  Le prove alle quali ci si riferisce in questo scritto, sono state effettuate al termine di unità didattiche di chimica che hanno richiesto un lavoro scolastico di 12-15 ore.

 

Le tecniche di valutazione

I dati statistici ricavabili dalla elaborazione dei punteggi grezzi sono quelli noti: [2]

 = media dei punteggi

s = scarto quadratico medio

= punti zeta

 

i punti zeta sono punti tipificati, cioè espressi in unità di sigma, in funzione della distribuzione statistica, ed hanno un significato univoco, tanto che molti autori ne raccomandano l’uso per esprimere in maniera corretta la valutazione.  Sta di fatto però che i punti zeta debbono essere trasformati in voto decimale.  Accanto a questi dati c’è anche la graduatoria degli allievi in ordine secondo il loro punteggio, dal migliore al peggiore.  È a partire da queste grandezze che si deve operare per valutare gli allievi; i metodi che esamineremo sono tre.  Il primo, poco usato nella scuola italiana, molto più in quella anglosassone consiste nell’utilizzare la graduatoria direttamente come valutazione.  Ogni allievo costituisce così un livello distinto e relativo agli altri.  Si rinuncia, in questo modo, a valutare le distanze tra i diversi livelli di profitto tenendo unicamente conto della posizione reciproca.  La possibilità di trasferire in voto il risultato è legata al confronto tra la distribuzione dei livelli e una scala prefissata di voti che faccia coincidere ogni livello con un voto [3].

 

Il vantaggio di questo sistema risiede nella possibilità che offre di evitare la trattazione statistica dei punteggi grezzi, con evidente risparmio di tempo e fatica.  Fissare a priori una scala di voti non ci pare corretto come pure non lo è non tener conto delle distanze relative, correndo il rischio di differenziare di un uguale voto risultati tra loro molto diversi.  La graduatoria rimane pur sempre un elemento di valutazione nello stabilire progressi o regressi degli allievi da una prova all’altra.  Il secondo metodo offre gli stessi vantaggi, tenendo però conto della distribuzione dei risultati.  Partendo dalla curva a campana dei risultati (la più frequente almeno nelle superiori) e sulla base di ricerche compiute [4] si dividono gli allievi in cinque gruppi di diversa consistenza numerica; riportiamo i valori che Gattullo riferisce come ottimali [5]

primo gruppo: 6-8% risultati >  + 3/2 s

secondo gruppo: 25-27% risultati compresi tra  + l/2 s e  + 3/2 s

terzo gruppo: 33-35% risultati compresi tra  + l/2 s e l/2 s

quarto gruppo: 25-27% risultati compresi tra  – l/2 s e 3/2 s

quinto gruppo: 6-8% risultati <  – 3/2 s

 

Una volta raggruppati gli allievi secondo il punteggio grezzo in questi cinque gruppi si passa ad assegnare i voti nell’ordine decrescente per ogni gruppo: 8, 7, 6, 5, 4.  In questo modo si stabilisce a priori che il 30% circa degli allievi è insufficiente (4° 5° gruppo).  Questo metodo all’apparenza grossolano, per campioni numerosi non si discosta molto dalla realtà della distribuzione dei risultati e quindi può essere adottato a prescindere dallo svolgimento dei calcoli sulla distribuzione.  Inoltre l’adozione di voti interi, senza troppe vie di mezzo, se da una parte appiattisce su pochi livelli, dall’altra ha il pregio della chiarezza che è invece tutta da scoprire nella serie dei mezzi, quarti, decimi di voto, così abbondanti nella nostra scuola.

 

Il terzo metodo consiste nel trasformare la distribuzione dei punteggi grezzi in una di voti decimali aventi media e sigma prefissati.  Gli studi di Calonghi in proposito [6] suggeriscono di utilizzare come valore medio di questa distribuzione un voto compreso tra il 5 e il 6 a secondo dell’andamento della prova oggettiva; prova difficile 6, prova facile 5.  Per il ciclo dell’obbligo si dovrebbe preferire il 6 in ogni caso perché si presuppone che il rendimento medio sia sufficiente.  Il sigma di questa distribuzione può realisticamente essere posto uguale all’unità.  La relazione che si viene a stabilire tra punteggi e voti è [7]:

 

Voto

La gamma dei voti ottenuti con questo metodo è più articolata della precedente ma ugualmente ristretta; raramente si hanno voti superiori all’8 o inferiori al 4.  Questo è senz’altro consigliabile se si tiene conto della difficoltà reale di compiere misurazioni raffinate che consentano di discriminare su gamme più ampie; d’altra parte già molti insegnanti si attengono a questa gamma.

 

Risultati ottenuti

Mettiamo ora a confronto il secondo e il terzo sistema, i più confacenti alla nostra realtà, applicandoli ai risultati di una prova oggettiva di Chimica, basata su quesiti a scelta multipla, somministrata a studenti di due scuole superiori di Savona nel corso dell’anno scolastico 80/81, nelle classi seconde.  Per il primo (ITC «P. Boselli») il campione è di 95 allievi per una prova di 18 quesiti, per la seconda (ITI «G. Ferraris») il campione è di 116 allievi per 20 quesiti.  (I due in più si giustificano con la differenza di approfondimento di certi punti del programma)  I punteggi grezzi sono stati assegnati con la formula di Ebel e altri riportata da Gattullo [8]

P = E + A/N

E = numero delle risposte esatte

A = numero delle astensioni

N = numero delle alternative (nel caso 4)

 

Nella tabella 1 sono riportati i dati riferiti all’ITC. Per attribuire i voti col terzo metodo si è usato un voto medio pari a 6. Nella tabella 2 i dati riferiti all’ITI con la stessa scelta di voto medio.

 

Frequenze

Punteggi grezzi

Voto metodo trasformazione

Voto metodo gruppi

Entità gruppo

1

15,75

9,75

 

 

1

12,25

8,13

 

 

1

11,75

7,90

8

6

3

11,00

7,56

 

 

 

 

 

 

 

2

10,75

7,44

 

 

1

10,50

7,32

 

 

2

10,25

7,21

 

 

4

10,00

7,09

 

 

2

9,75

6,98

 

 

4

9,50

6,86

7

24

3

9,25

6,75

 

 

3

9,00

6,63

 

 

3

8,75

6,25

 

 

 

 

 

 

 

3

8,50

6,40

 

 

8

8,25

6,29

 

 

2

8,00

6,17

 

 

1

7,75

6,06

6

33

3

7,50

5,94

 

 

6

7,25

5,83

 

 

4

7,00

5,71

 

 

6

6,75

5,60

 

 

 

 

 

 

 

6

6,50

5,48

 

 

1

6,25

5,37

 

 

2

6,00

5,25

 

 

2

5,75

5,14

5

27

6

5,50

5,02

 

 

4

5,25

4,91

 

 

4

5,00

4,79

 

 

2

4,75

4,68

 

 

 

 

 

 

 

3

4,25

4,45

 

 

1

4,00

4,33

4

4

1

2,50

3,64

 

 

Tab. 1.

 

La distribuzione dei punteggi grezzi ha  = 7,63 e s = 2,16.  I gruppi sono formati dal 6,31, 25,26, 34,73, 28,42, 4,21% di allievi, con un buon accordo sulle percentuali previste.

 

Frequenze

Punteggi grezzi

Voto metodo trasformazione

Voto metodo gruppi

Entità gruppo

1

17,25

8,50

 

 

1

17,00

8,41

 

 

1

16,50

8,25

8

6

1

15,50

7,91

 

 

1

15,00

7,75

 

 

1

14,75

7,66

 

 

 

 

 

 

 

2

14,00

7,41

 

 

1

13,75

7,33

 

 

2

13,50

7,25

 

 

3

13,25

7,16

 

 

2

13,00

7,08

7

26

3

12,50

6,91

 

 

3

12,25

6,83

 

 

3

12,00

6,75

 

 

2

11,75

6,66

 

 

5

11,50

6,58

 

 

 

 

 

 

 

6

11,25

6,50

 

 

4

11,00

6,41

 

 

2

10,75

6,33

 

 

4

10,50

6,25

 

 

3

10,25

6,16

 

 

5

10,00

6,08

6

49

2

9,75

6,00

 

 

7

9,50

5,92

 

 

5

9,25

5,84

 

 

1

9,00

5,75

 

 

7

8,75

5,66

 

 

1

8,50

5,58

 

 

2

8,25

5,50

 

 

 

 

 

 

 

4

8,00

5,41

 

 

3

7,75

5,33

 

 

3

7,50

5,25

 

 

7

7,25

5,16

 

 

4

7,00

5,08

 

 

2

6,75

5,00

5

27

1

6,50

4,91

 

 

1

6,00

4,75

 

 

1

5,75

4,66

 

 

1

5,50

4,58

 

 

 

 

 

 

 

1

4,50

4,25

 

 

1

4,25

4,16

4

5

2

4,00

4,08

 

 

1

3,25

3,83

 

 

 

La distribuzione dei punteggi grezzi ha  = 9,75 e s = 3,00.  I gruppi sono formati dal 5,17, 22,41, 42,24, 23,27, 4,31% di allievi accordo con le percentuali previste.

 

Conclusioni

Da un esame delle tabelle si può ricavare un sostanziale accordo tra le due scale di votazioni.  I voti assegnati con il metodo dei gruppi raccoglie gli allievi che con il metodo della trasformazione risultano compresi tra il mezzo punto inferiore e superiore; fanno eccezione le due estremità della scala.  Con il metodo a gruppi non si riescono a valutare i casi eccezionali in positivo e negativo, ma bisogna dire che sono molto rari.  L’accordo tra i due metodi non è altrettanto buono per campioni poco numerosi (una sola classe) perché a volte la distribuzione non è normale, e nel metodo dei gruppi questo è il presupposto base.  Il metodo della trasformazione consente inoltre uno screening migliore dei valori.  Bisogna dire che si ottengono però voti con cifre decimali; spetta agli insegnanti effettuare l’arrotondamento prefissando alcune regole.  Consigliamo di non suddividere un intervallo di un voto in più di quattro zone: es.: 5, 5 +, 5½, 6–.  In ogni caso è utile registrare anche i punti zeta per poi utilizzarli ai fini della valutazione quadrimestrale.  La possibilità di passare in generale dalla misurazione alla valutazione necessita di possedere prima tutti i punteggi grezzi.  Se questo è facile per prove oggettive e anche prove scritte o grafiche tradizionali, molto più difficile si presenta il compito per le interrogazioni o i colloqui orali.  Un suggerimento utile può essere quello di condurre le prove in modo analitico, preparando le domande, registrando per sommi capi le risposte, per assegnare punteggi grezzi che solo alla fine del turno sarà possibile trasformare in valutazione con i metodi citati.  Questo anche perché, per una corretta valutazione, è opportuno utilizzare tutte le forme di reattivo, anche quelli tradizionali, relazioni, ricerche, saggi, interrogazioni, il cui punteggio dovrà essere reso omogeneo con quello delle prove oggettive ai fini di una valutazione conclusiva, per la quale conviene tenere presenti i punti zeta, assegnando la sufficienza a chi abbia un zeta complessivo maggiore o uguale a 0. [9]

 

Bibliografia

1. Vertecchi B., Valutazione formativa, Torino, Loescher, 1976.

2. Anthoine Dietrich S., Cardani E., Pentimalli R., CnS, novembre 1980.

3. Gattullo M., Didattica e docimologia, Roma, Armando, 1979.

4. Calonghi L., Sussidi per la valutazione scolastica, PAS Verlag, Zurigo, 1961 pag. 213-216.

5. Gattullo M., op. cit. pag. 376.

6. Calonghi L., op. cit. pag. 213-216.

7. Gattullo M., op. cit. pag. 361.

8. idem pag. 287.

9. Grandi G., Misurazione e valutazione, Firenze, Nuova Italia 1978 pag. 81-83.

 

 

Pubblicato originariamente su La Chimica nella Scuola, 1982, 3 (1), 26-31.  Riprodotto con l’autorizzazione del Prof. Pierluigi Riani, direttore di CnS.