Cuộc cách mạng công nghệ Trí tuệ nhân tạo tạo sinh (Gen AI) đang đặt ra những thách thức chưa từng có đối với hệ thống kiểm tra – đánh giá trong giáo dục đại học. Vấn đề không còn nằm ở việc sinh viên có thể “quay cóp” hay không, mà là toàn bộ bản chất của việc đo lường năng lực học thuật đang bị đặt dấu hỏi. Nghiên cứu mới đây của các chuyên gia giáo dục cho thấy, thay vì chỉ ban hành thêm quy định cấm đoán, các trường đại học cần thực hiện cuộc “đại phẫu” toàn diện hệ thống đánh giá để thích ứng với kỷ nguyên AI.
Khi máy móc có thể “làm bài” thay con người
Sự bùng nổ của các nền tảng AI như ChatGPT, Claude, Gemini đang làm rung chuyển những nguyên tắc căn bản mà giáo dục đại học đã xây dựng trong nhiều thập kỷ. Điểm đáng lo ngại nhất không phải là việc công nghệ phát triển quá nhanh, mà là khả năng sinh viên có thể hoàn thành các bài kiểm tra, luận văn mà không cần vận dụng bất kỳ kiến thức thực tế nào đã được truyền tải trong giảng đường.
Hiện tượng này đã tạo ra một “khủng hoảng tính xác thực” trong đánh giá học thuật – khi không còn cách nào đảm bảo rằng kết quả kiểm tra phản ánh đúng năng lực thực sự của người học. Điều này không chỉ đe dọa uy tín của bằng cấp mà còn có thể làm suy giảm toàn bộ hệ thống đảm bảo chất lượng giáo dục.
Các giải pháp hiện tại: Chỉ là “bình mới rượu cũ”?
Trước tình thế này, nhiều trường đại học quốc tế đã nhanh chóng triển khai các biện pháp ứng phó. Phổ biến nhất là mô hình “đèn giao thông” – phân chia mức độ cho phép sử dụng AI theo ba cấp: đỏ (nghiêm cấm), vàng (hạn chế), xanh (khuyến khích). Một số cơ sở giáo dục khác áp dụng “Thang đo Đánh giá AI” (AI Assessment Scale) với nhiều mức độ chi tiết hơn, hoặc yêu cầu sinh viên “tự khai báo” việc sử dụng công cụ AI.
Tuy nhiên, theo phân tích của các chuyên gia, những biện pháp này chỉ mang tính “làm tròn chữ” mà thiếu đi sức mạnh thực thi. Chúng vẫn dựa vào ý thức tự giác của sinh viên – một yếu tố không thể đảm bảo tuyệt đối trong bối cảnh công nghệ AI ngày càng tinh vi và khó phát hiện.
Trong bối cảnh này, việc nâng cao chất lượng đội ngũ giảng viên trở nên cấp thiết hơn bao giờ hết. Cung cấp giáo viên nước ngoàichất lượng cao không chỉ giúp cải thiện phương pháp giảng dạy mà còn hỗ trợ thiết kế những bài đánh giá sáng tạo, khó có thể thay thế bằng AI. EIV Education, với đội ngũ giáo viên bản ngữ từ các nước Anh, Mỹ, Canada, Úc, New Zealand, đang tiên phong trong việc ứng dụng những phương pháp đánh giá tiên tiến, giúp các cơ sở giáo dục Việt Nam vượt qua thách thức của kỷ nguyên AI.
Từ “ngôn luận” đến “cấu trúc”: Cuộc cách mạng tư duy cần thiết
Nghiên cứu của Corbin và nhóm tác giả (2025) đã đưa ra một khái niệm phân biệt quan trọng giữa hai hướng tiếp cận trong cải cách đánh giá: thay đổi ngôn luận và thay đổi cấu trúc.
- Thay đổi ngôn luận là những điều chỉnh dựa trên việc bổ sung hướng dẫn, quy định về việc sử dụng AI – như việc ghi thêm dòng “cấm sử dụng trí tuệ nhân tạo” trong đề bài. Đây chính là những gì phần lớn các trường đại học đang áp dụng.
- Thay đổi cấu trúc, ngược lại, là những điều chỉnh có tính chất cơ chế – biến đổi bản chất, hình thức thực hiện bài kiểm tra sao cho việc sử dụng AI một cách không phù hợp trở nên bất khả thi. Ví dụ điển hình là thay thế bài luận làm ở nhà bằng bài viết trực tiếp tại lớp dưới sự giám sát, hoặc thiết kế chuỗi bài tập liên kết đòi hỏi sinh viên phải trình bày quá trình tư duy, tương tác trực tiếp với giảng viên qua các giai đoạn.
Thực trạng “ảo tưởng kiểm soát”
Một trong những phát hiện đáng chú ý nhất của nghiên cứu là việc cảnh báo về “ảo tưởng thực thi”. Các mô hình quản lý AI hiện tại có thể tạo ra cảm giác sai lầm rằng tình hình đã được kiểm soát, trong khi thực tế, mọi hành vi vi phạm vẫn có thể diễn ra một cách âm thầm.
Nguyên nhân chính là do các công cụ phát hiện AI hay watermark nội dung vẫn thiếu độ tin cậy. Khác với việc sao chép nội dung trực tiếp, AI có khả năng tạo ra văn bản “nguyên bản” mỗi lần sử dụng, khiến các phần mềm kiểm tra đạo văn truyền thống trở nên vô hiệu.
Hướng tới đánh giá “định hướng quá trình”
Giải pháp cốt lõi mà các chuyên gia đề xuất là thực hiện “sự chuyển dịch triệt để” từ việc đặt ra quy định về AI sang việc tái thiết kế căn bản các bài đánh giá. Điều này đòi hỏi một cuộc chuyển hướng từ đánh giá định hướng sản phẩm (product-based assessment) sang đánh giá định hướng quá trình (process-based assessment).
Thay vì chỉ tập trung vào bài nộp cuối cùng, hệ thống đánh giá mới cần theo dõi sự phát triển tư duy, kỹ năng và năng lực học thuật qua một chuỗi hoạt động có thể xác thực được. Điều này không chỉ giúp chống lại việc lạm dụng AI mà còn thúc đẩy việc học tập thực chất và phát triển năng lực tư duy phản biện.
Thách thức và cơ hội cho giáo dục đại học Việt Nam
Đối với hệ thống giáo dục đại học Việt Nam, cuộc cách mạng AI không chỉ là thách thức mà còn là cơ hội để thực hiện những cải cách mang tính đột phá. Thay vì chạy theo mô hình “kiểm soát hành vi”, các trường đại học Việt Nam có thể tiên phong trong việc “kiến tạo môi trường” – tạo ra những điều kiện đánh giá mà ở đó người học buộc phải vận dụng hiểu biết và kỹ năng cá nhân để hoàn thành nhiệm vụ học thuật.
Cuộc chuyển đổi này đòi hỏi không chỉ sự thay đổi trong quy chế mà còn cần một cuộc tái tư duy toàn diện về bản chất của việc đánh giá. Đây là lúc giáo dục đại học cần được xem như một “phòng thí nghiệm” để phát triển những mô hình đào tạo thực chất, khai phóng và có khả năng thích ứng trong thế giới được dẫn dắt bởi AI.
Những thay đổi cần thiết này không thể chỉ dừng lại ở việc điều chỉnh quy chế hành chính, mà cần bắt đầu từ việc tái thiết kế đánh giá như một trụ cột nền tảng trong chiến lược đảm bảo chất lượng và phát triển năng lực người học. Chỉ khi đó, giáo dục đại học mới có thể vượt qua “phép thử” của kỷ nguyên AI và tiếp tục duy trì vai trò quan trọng trong việc hình thành nguồn nhân lực chất lượng cao cho xã hội.
Tài liệu tham khảo:
- Corbin, T., Dawson, P., & Liu, D. (2025). Talk is cheap: why structural assessment changes are needed for a time of GenAI. Assessment & Evaluation in Higher Education, 1–11. https://doi.org/10.1080/02602938.2025.2503964
- Perkins, M., Furze, L., Roe, J., & MacVaugh, J. (2024b). The Artificial Intelligence Assessment Scale (AIAS): a framework for ethical integration of generative AI in educational assessment. Journal of University Teaching and Learning Practice, 21(06). https://doi.org/10.53761/q3azde36
- Perkins, M., J. Roe, B. H. Vu, D. Postma, D. Hickerson, J. McGaughran, & H. Q. Khuat (2024) GenAI Detection Tools, Adversarial Techniques and Implications for Inclusivity in Higher Education. arXiv Preprint arXiv:2403.19148.