Ölçmede güvenirlik ve geçerlilik kavramları, ölçmenin en temel iki ilkesidir. Özellikle geçerlilik, yani yapılan sınavın amacına uygun olması, sınav hazırlayıcıların en önemli kaygılarından biridir. Eğer bir sınavın amacı, sınava giren örneklem üzerinden ilgili popülasyon hakkında veri sağlamaksa, ülkelerin sınava katılmak üzere sağladıkları örneklemlere müdahale etmenin bir anlamı bulunmamaktadır. Eğer sınav ciddi bir sıralama sınavı olsaydı (TYT, AYT, LGS benzeri), bu noktada örneklemler her ülke için daha ciddi bir şekilde kontrol edilirdi.
Türkiye’nin de içinde bulunduğu bazı ülkeler sınava 4. sınıflar yerine 5. sınıf seviyesinde katılmaktadır. Ek olarak, Türkiye’nin de dahil olduğu bazı ülkelerin sonuçları, her ne kadar sınavın adı “Trends in…” diye başlıyor olsa da geçmiş yıllarla karşılaştırılabilir değildir. Ülke sıralamaları tablolarında, ülkelerin yanlarında yazan küçük dipnot işaretleri, verinin nasıl okunması gerektiğini göstermektedir. Aşağıda yer alan matematik 4. sınıflar sıralama tablosunda (3), (2),5, + gibi işaretler raporu okurken dikkat etmeniz gereken detaylardır. Tabii, bunları MEB raporunda göremediğimiz gibi ciddi diyeceğimiz birçok kurumun raporlarında da göremedik.
Aslına bakarsanız, bu durum anormal de değil. Tüm ülkeler, durumlarını görebilmek için benzer şekillerde süreçlere müdahale ediyorlar. Sürece tamamen random (seçkisiz) örneklemlerle katılan ülke sayısı oldukça az. Bununla birlikte bizden farklı olarak bu ülkelerde sonuçlar politik tartışma konusu olmuyor. Amaç veri elde etmek ise bunda bir beis yok. Ancak amaç siyasi ve kişisel ikbal kazanmak olduğunda, seçilen örneklemin ne yönde seçildiği konusu daha önemli hale gelmektedir. Çünkü bu durumda tabloyu şöyle de okuyabiliriz: Türkiye, her ne kadar 5. sınıflar ile sınava katılmış olsa da Hong Kong, Japonya, Çin, Litvanya gibi ülkelerin 4. sınıf seviyesindeki öğrencilerini geçememiştir. :)
Ben hem X platformunda hem de Instagram’da paylaşımlarımı yaparken, bir hocamızın “Eğitimde gelişim olur, ancak sıçrama olmaz.” sözüne rastladım. Türkiye’nin sınavın 2023 döngüsünde göstermiş olduğu başarı, her ne kadar geçmiş yıllarla karşılaştırılamaz olsa da deprem nedeniyle (depremin yaşandığı yerler geneli itibarıyla akademik olarak İç Anadolu, Marmara, Akdeniz, Ege bölgelerine kıyasla daha alt seviyededir) popülasyonun yaklaşık yüzde yirmilik bir kısmının dahil edilmemiş olması, örneklem seçiminde tam seçkisiz bir yöntem izlenmemiş olması nedeniyle şu an itibarıyla tamamen yoruma açık bir şekilde havada kalmaktadır.