Porównywanie wyników egzaminów uczniów kończących kolejne etapy edukacji nie jest miarodajne, ponieważ nie uwzględnia różnic w poziomie trudności testów. Z badań przeprowadzonych przez IBE wynika, że choć sprawdziany wypadają słabiej, to poziom nauczania poprawia się.

Średnie wyniki sprawdzianu szóstoklasisty pokazują bardzo zróżnicowane wyniki. W 2002 roku uczniowie uzyskiwali średnio 29,5 punktu, a dwa lata późnej już 25,5. Najgorzej sprawdzian wypadł w 2009 roku. Wówczas przeciętny szóstoklasista zdobył niespełna 23 punkty. W kolejnych latach wyniki były coraz lepsze: w 2013 roku uczniowie uzyskiwali średnio 24 punkty, a rok później – 26.

Tak opisane wyniki sprawdzianu niewiele mówią o faktycznym poziomie szóstoklasistów. Porównanie wyników egzaminów ma sens dopiero, gdy zostanie uwzględniony poziom trudności testów.

Metody zrównywania najwcześniej rozwinęły się w USA. Od 1941 roku wykorzystywana jest metoda SAT, która polega na tym, że każda nowa wersja testu zawiera około 20 proc. pytań z poprzedniej edycji. Wyniki kolejnych edycji zrównywane są z poprzedniego roku do roku kolejnego. Drugim sposobem jest ACT (American College Testing. Aby przeprowadzić zrównanie dwóch testów z różnych lat, w przypadku ACT spośród wszystkich uczniów losowana jest reprezentatywna próba (jako próba zrównująca). Uczniowie należący do wylosowanej próby obok aktualnej edycji testu rozwiązują też nowe zadania, wcześniej nie publikowanych arkuszy egzaminacyjnych.

Instytut Badań Edukacyjnych przeprowadził porównanie zrównujące dla kolejnych roczników. Wynika z niego, że różnice między kolejnymi rocznikami wcale nie są tak duże, jak mogłoby wydawać się na pierwszy rzut oka.

Wspomniany sprawdzian szóstoklasisty na skali zrównującej różni się zaledwie o 1,5 punktu. Naprawdę najgorzej wypadł egzamin w 2003 i 2008 roku, kiedy to uczniowie uzyskali średnio po 22 punkty, a najlepiej w 2011 – 23,5 punktu.

- Zmiany w rozkładzie wyników egzaminów są przede wszystkim konsekwencją zmian w trudności poszczególnych arkuszy – w mniejszym stopniu umiejętności uczniów. Różnice między wszystkimi analizowanymi edycjami sprawdzianu nie wykraczają co do absolutnej wartości poza 1,6 punktu. Najwyższe wyniki przypadają w okolicach roku 2005 oraz 2011, a najniższe w okolicach 2003 oraz 2008. Zmiany nie są jednak na tyle dramatyczne jak sugerowałyby wyniki surowe – twierdzą autorzy analizy.

Podobnie wygląda sytuacja w przypadku egzaminu gimnazjalnego i maturalnego. Co ciekawe niezrównane wyniki egzaminacyjne z matury z matematyki pokazują, że najlepiej wypadł test w 2010 roku. Uczniowie uzyskali wówczas średnio 90,3 proc. W kolejnych latach było to: 82,1 proc., 88,8 proc., i 88,2 proc. Zrównane wyniki pokazują co innego. Najgorzej bowiem wypadł egzamin w 2010 roku (84,4 proc.), a najlepiej – 2012 (88,8 proc.).

- Sprawdzian, obie części egzaminu gimnazjalnego, matura z matematyki – niewielkie fluktuacje wyników, ale w dłuższej perspektywie czasowej wyniki tych egzaminów utrzymują się na podobnym poziomie. Dla matury z języka angielskiego obserwujemy niewielki wzrost wyników w latach 2010–2013 – podsumowują autorzy badania.