Để đánh giá, trong giáo dục có một số lý thuyết được công nhận rộng rãi về các tiêu chí của một đề thi hiệu quả, trong đó hai tiêu chí thường được đưa lên hàng đầu và lặp đi lặp lại trong các lý thuyết khác nhau là Validity và Reliability. Validity (tính hợp lệ) nghĩa là đề thi có thực hiện đúng chức năng của nó là đánh giá, phân loại không. Một đề thi Văn được khen "hay", "gây xúc động mạnh", nhưng không có khả năng đánh giá năng lực ngôn ngữ, văn học của học sinh thì dù được lòng dư luận tới cỡ nào, đó vẫn là một đề thi kém chất lượng, không dùng được cho mục đích đánh giá.
Reliability (mức độ tin cậy) phản ánh tính ổn định của đề. Ví dụ, các kỳ thi tiếng Anh quốc tế của tổ chức Cambridge English hay IELTS thường có cấu trúc (format) ổn định, độ dài của đề ổn định, lượng từ vựng và yêu cầu đối với thí sinh tương ứng với mức độ ngôn ngữ mục tiêu cần khảo sát, do vậy hiếm khi nào tạo ra may - rủi cho thí sinh đợt thi trước và đợt thi sau.
Kỳ thi tốt nghiệp phổ thông trung học là kỳ thi quốc gia với chức năng "hai trong một", vừa để xét công nhận tốt nghiệp, vừa làm cơ sở cho đầu vào đại học. Một học sinh cần đạt điểm 5 để tốt nghiệp thì đề thi phải đảm bảo một học sinh trung bình có thể làm bài được 5 điểm, và từ 6 đến 10 là mức điểm để phân hóa.
Đề thi không nên là một cuộc chơi may rủi vì nó cần đảm bảo công bằng cơ hội cho người học. Một số ý kiến tin rằng "khó thì khó đều", nhưng điều này chỉ đúng khi xét riêng biệt từng môn. Giả sử đề thi Toán, Tiếng Anh năm nay quá khó, thí sinh xét tuyển bằng tổ hợp Toán - Lý - Hóa, Toán - Hóa - Sinh sẽ được lợi hơn tổ hợp Toán - Văn - Anh. Hoặc thí sinh có điểm thi IELTS sẽ có lợi hơn thí sinh không có. Điều này dẫn tới sinh viên vào đại học có sức học không đều, có thí sinh vào trường nhờ sức học tốt, nhưng có những thí sinh kém hơn nhiều vẫn vào trường vì "gặp thời", và lấy mất chỗ của thí sinh xứng đáng hơn mình. Điều này làm phá vỡ nguyên tắc công bằng trong tuyển sinh.
Lấy đơn cử đề thi môn tiếng Anh, là môn tôi được đào tạo chuyên sâu để giảng dạy. Cộng đồng giáo viên cũng nhận ra đề thi có thể ở mức B2 - C1, đồng thời chịu các tác động bất lợi khác như thời gian ít hơn nhiều kỳ thi Cambridge English hay IELTS, font chữ trong đề nhỏ hơn, học sinh phải thi dồn dập trong nhiều ngày liên tiếp... Trình độ tiếng Anh C1 hiện nay (hay Bậc 5 khung năng lực ngoại ngữ quốc gia) là trình độ chuẩn của giáo viên ngoại ngữ chúng ta đang hướng tới mà đến năm 2030 chưa chắc đạt được, thì việc kiểm tra mức C1 với học sinh cần trình độ B1 là không phù hợp. Thông thường, nếu xác định mức độ mục tiêu của học sinh phổ thông là B1, thì đề thi rất hiếm khi đẩy lên mức vượt quá B2. Nếu đề thi bao gồm cả trình độ C1- C2 có thể đã trở thành đề thi học sinh giỏi.
Việc giải thích rằng đề thi "cần tạo ra yếu tố bất ngờ để học sinh không học theo lối cũ" là cách hiểu đầy bất cập. Các yêu cầu của đề thi, hình thức đề thi phải được minh bạch ngay từ đầu năm học để người học chuẩn bị. Cách bất ngờ "lật thuyền" xem ai biết bơi không phải là mục tiêu của kiểm tra, đánh giá.
Để đánh giá đề thi năm nay dễ, khó như thế nào sẽ cần nhìn vào phổ điểm, xem độ lệch giữa các môn, cũng như mức độ phân hóa của thí sinh trong từng môn. Giả sử chúng ta đang tin rằng chất lượng giáo dục phổ thông không đổi hoặc đang đi lên, mà tỷ lệ thí sinh năm nay đạt điểm dưới trung bình tăng cao bất thường, thì có hai giả thiết: hoặc là chất lượng giảng dạy ba năm phổ thông trung học thực ra không đạt yêu cầu cho tốt nghiệp, hoặc đề thi tốt nghiệp năm nay khó bất thường.
Một số chương trình giáo dục trên thế giới đã có những hướng xử lý hợp lý khi phân loại thí sinh, như cho phép thí sinh ngay từ đầu đăng ký thi theo trình độ chuẩn hay nâng cao, như vậy thí sinh sẽ có lựa chọn đặt trọng tâm vào việc chỉ cần tốt nghiệp, hay cần chứng tỏ năng lực để vào đại học. Hệ thống giáo dục Mỹ thậm chí không có kỳ thi tốt nghiệp phổ thông, mà sử dụng hệ thống tín chỉ, khi học đủ số môn, lấy đủ điểm thì tự động được tốt nghiệp. Còn muốn vào đại học phải chứng tỏ điểm trung bình học bạ (GPA) cao, kèm thêm điểm thi nâng cao AP.
Không nên nhìn nhận những phản hồi, thậm chí than phiền của người học về đề thi khó là tiêu cực, trái lại đó là cơ hội để nhìn lại độ "vênh" giữa học và thi, giữa thực tế dạy học với kết quả đầu ra, hay thậm chí cả những vấn đề tiềm ẩn như coi trọng ngoại ngữ mà coi nhẹ các môn khoa học nền tảng...
Đề thi có chất lượng cũng phải dựa vào các tiêu chí khoa học, chứ không dựa vào độ "hot", độ "hay" của đề. Vì đề thi là công cụ đánh giá, không phải là một sản phẩm truyền thông.
Bùi Khánh Nguyên