[Research Contribution] Phân tích phản hồi sinh viên theo hướng tiếp cận học máy

11 Tháng Ba, 2025

Từ khóa: Phân tích phản hồi sinh viên, máy học, xử lý ngôn ngữ tự nhiên, trí tuệ nhân tạo, giáo dục thông minh

Phản hồi của sinh viên là nguồn dữ liệu quan trọng giúp các cơ sở giáo dục cải thiện chất lượng giảng dạy và môi trường học tập. Tuy nhiên, với khối lượng dữ liệu lớn và tính đa dạng của ngôn ngữ tự nhiên, việc phân tích phản hồi theo phương pháp truyền thống gặp nhiều hạn chế. Trong bối cảnh đó, học máy (Machine Learning) nổi lên như một giải pháp tiềm năng, giúp tự động hóa việc phân loại, đánh giá và trích xuất thông tin quan trọng từ phản hồi sinh viên. Vì thế, trong bài nghiên cứu này, nhóm tác giả thuộc Phân hiệu Đại học Kinh tế Thành phố Hồ Chí Minh tại tỉnh Vĩnh Long (UEH Mekong) đã chỉ ra các cách tiếp cận học máy trong phân tích phản hồi sinh viên trong và ngoài nước, xác định các xu hướng và hạn chế đang tồn tại để đưa ra những kiến nghị kịp thời nhằm cải thiện và định hướng các nghiên cứu tiếp theo trong lĩnh vực này.

#15 Hoc May Bg 1499x600

Bối cảnh nghiên cứu

Trong thời đại ngày nay, giáo dục đại học vừa là một ngành kinh tế, vừa là một ngành có nhiệm vụ đào tạo nhân lực trình độ cao cho các ngành kinh tế khác và cũng là trung tâm của đổi mới sáng tạo. Trong môi trường giáo dục năng động, đánh giá phản hồi sinh viên một cách hiệu quả là nền tảng cho sự cải thiện liên tục và nâng cao trải nghiệm học tập tổng thể.

Tuy nhiên, các phương pháp phân tích phản hồi truyền thống thường không đáp ứng được việc cung cấp thông tin chi tiết kịp thời và có tính chủ quan cao, đó cũng là đặc điểm vốn có của đánh giá thủ công. Hiệu quả của việc phân tích các quan điểm, tâm tư của sinh viên cũng sẽ không được tốt vì nguồn dữ liệu quá rộng lớn. Vì thế, sự phát triển của trí tuệ nhân tạo (AI), đặc biệt là học máy (Machine Learning), đã mở ra nhiều hướng tiếp cận mới trong xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP). Nhờ đó, các hệ thống có thể tự động nhận diện chủ đề, phân loại cảm xúc và trích xuất thông tin quan trọng từ phản hồi của sinh viên. Điều này giúp các cơ sở giáo dục đưa ra các quyết định chính xác, có thể nâng cao chất lượng giảng dạy và trải nghiệm học tập hơn.

Trong bối cảnh đó, nghiên cứu của tác giả thuộc UEH Mekong sẽ làm rõ những xu hướng đang được quan tâm trong lĩnh vực này, đồng thời chỉ ra những hạn chế và khoảng trống còn tồn tại trong các nghiên cứu hiện nay. Từ đó, đưa ra các kiến nghị cụ thể cho việc phát triển và ứng dụng phân tích phản hồi sinh viên bằng học máy tại Việt Nam trong tương lai.

Phản hồi sinh viên và học máy trong giáo dục

Phản hồi sinh viên: bao gồm các ý kiến, đánh giá về chất lượng, phương pháp giảng dạy, nội dung môn học và trải nghiệm học tập. Trong khi các phân tích truyền thống chủ yếu dựa vào số liệu thống kê, còn học máy cho phép khai thác dữ liệu phản hồi mở thông qua Xử lý ngôn ngữ tự nhiên (NLP), giúp tự động phân loại, nhận diện chủ đề và đo lường mức độ cảm xúc của sinh viên đối với từng khía cạnh giảng dạy.

Học máy (Machine Learning – ML): Là một nhánh của trí tuệ nhân tạo (AI), cho phép máy tính học từ dữ liệu và đưa ra dự đoán hoặc quyết định mà không cần lập trình rõ ràng. Thay vì tuân theo các quy tắc cố định do con người thiết lập, mô hình học máy tự cải thiện thông qua kinh nghiệm và dữ liệu đầu vào.

Trong đó, Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP) hỗ trợ nhiều tác vụ khác nhau, cho phép trích xuất từ khóa, nhận diện chủ đề và phân tích sắc thái cảm xúc trong phản hồi sinh viên. Và Học sâu (Deep Learning) sử dụng mạng nơ-ron – Là một phương pháp trong trí tuệ nhân tạo (AI) dạy máy tính xử lý dữ liệu theo cách lấy cảm hứng từ bộ não con người, sử dụng mạng nơ-ron để hiểu được ngữ cảnh, phát hiện xu hướng chung từ phản hồi sinh viên. 

Xu hướng nghiên cứu hiện đại trong phân tích phản hồi sinh viên

Một trong những xu hướng quan trọng trong nghiên cứu phân tích phản hồi sinh viên là phân loại văn bản, nhằm phân nhóm các ý kiến phản hồi theo các tiêu chí cụ thể, từ đó cung cấp thông tin hữu ích cho việc nâng cao chất lượng giảng dạy. Trong đó, phân tích cảm xúc là một tác vụ quan trọng, tập trung vào việc xác định trạng thái cảm xúc (tích cực, tiêu cực, trung lập) của sinh viên.

Hiện nay, phần lớn các nghiên cứu thực hiện phân tích cảm xúc ở cấp độ câu hoặc tài liệu, hướng đến việc đánh giá tổng thể cảm nhận của sinh viên về trải nghiệm học tập. Bên cạnh đó, xu hướng mới đang mở rộng phạm vi nghiên cứu, không chỉ dừng lại ở đánh giá tổng quát mà còn đi sâu vào phân tích thái độ học tập, chất lượng giảng dạy và nội dung khóa học. Việc khai thác chuyên sâu các phản hồi này giúp các cơ sở giáo dục cải thiện trải nghiệm học tập, tối ưu phương pháp giảng dạy và đề xuất các chính sách phù hợp với nhu cầu của sinh viên.

Bên cạnh đó, một xu hướng đáng chú ý khác là sự ưu tiên sử dụng các thuật toán học máy có giám sát trong phân tích phản hồi sinh viên. Điều này phản ánh nhu cầu trong lĩnh vực giáo dục khi cần các mô hình phân tích trả về kết quả chính xác và rõ ràng, là vấn đề mà các thuật toán không giám sát (Unsupervised Learning) khó đạt được và là động lực thúc đẩy việc sử dụng mô hình học có giám sát hoạt động, dựa trên tập dữ liệu đã được gán nhãn trước, giúp tối ưu hóa quá trình học và cải thiện khả năng dự đoán. Trong đó, các thuật toán học nông (Shallow Learning) được ưa chuộng nhất do khả năng dễ triển khai và tính chất đơn giản. Song song đó, một số nghiên cứu tiên phong đã bắt đầu khai thác tiềm năng của các mô hình học sâu (Deep Learning), bao gồm: Long Short-Term Memory (LSTM), Convolutional Neural Network (CNN) và Multi-layer Perceptron (MLP) nhằm nâng cao khả năng phân tích và nhận diện ngữ cảnh phản hồi sinh viên.

Mặc dù có sự đa dạng về phương pháp, các nguồn dữ liệu sử dụng trong nghiên cứu vẫn chủ yếu tập trung vào phản hồi từ các khảo sát. Phản hồi khảo sát có ưu điểm dễ kiểm soát và có độ tin cậy cao, giúp đảm bảo tính đồng nhất của dữ liệu, từ đó cải thiện độ chính xác của mô hình phân tích. Tuy nhiên, điều này cũng đồng nghĩa với việc các nghiên cứu còn hạn chế trong việc khai thác các nguồn dữ liệu phong phú hơn, chẳng hạn như: phản hồi từ các nền tảng học tập trực tuyến, mạng xã hội hoặc các nguồn phi truyền thống khác.

Những hạn chế tồn tại trong phân tích phản hồi sinh viên

Thứ nhất, nhiều mô hình phân tích chưa xử lý hiệu quả các ký tự đặc biệt như biểu tượng cảm xúc hay từ viết tắt – những yếu tố quan trọng giúp phản ánh thái độ, cảm xúc của sinh viên. Việc bỏ qua các yếu tố này làm giảm độ chính xác trong việc diễn giải phản hồi sinh viên, ảnh hưởng đến chất lượng phân tích.

Thứ hai, hầu hết nghiên cứu hiện nay sử dụng mô hình học máy có giám sát, phụ thuộc vào dữ liệu gắn nhãn thủ công trong một ngôn ngữ hoặc bối cảnh cụ thể. Điều này gây khó khăn khi áp dụng vào môi trường khác do hạn chế về khả năng mở rộng và tính ứng dụng thực tiễn.

Thứ ba, phần lớn nghiên cứu chỉ tập trung vào độ chính xác của mô hình mà chưa chú trọng đến các yếu tố quan trọng khác như: Khả năng chống mất cân bằng dữ liệu và tối ưu thời gian phản hồi. Đây là cách tiếp cận chưa hoàn chỉnh trong các nghiên cứu hiện tại.

Hàm ý chính sách về việc phân tích đánh giá sinh viên tại Việt Nam

Dựa trên thực trạng nghiên cứu trong nước và quốc tế, một số hàm ý chính sách quan trọng được đề xuất nhằm nâng cao hiệu quả phân tích phản hồi sinh viên tại Việt Nam:

Thứ nhất, đầu tư áp dụng các kỹ thuật hỗ trợ và tiền xử lý  phản hồi bằng tiếng Việt, bao gồm phát hiện và phân loại các nhãn mỉa mai, spam ý kiến. Việc áp dụng các mô hình phân tích đặc điểm văn bản như: dấu câu, sự thay đổi cảm xúc giúp diễn giải rõ hơn thái độ của sinh viên, từ đó nâng cao độ chính xác của mô hình phân tích.

Thứ hai, nâng cao mức độ chi tiết trong phân tích cảm xúc, tập trung vào các yếu tố cụ thể liên quan đến giáo dục. Trong đó, phân tích cảm xúc theo khía cạnh là một tác vụ quan trọng, yêu cầu sự hỗ trợ của các mô hình nhận diện thực thể đặt tên (NER) để trích xuất các yếu tố liên quan trong phản hồi. Do đặc thù ngôn ngữ tiếng Việt, các mô hình này cần được phát triển dựa trên dữ liệu phản hồi sinh viên nhằm cải thiện độ chính xác.

Thứ ba, mở rộng và chuẩn hóa bộ dữ liệu phản hồi sinh viên. UIT-VFSC hiện là bộ dữ liệu chuẩn duy nhất về phản hồi sinh viên tại Việt Nam. Tuy nhiên, cần bổ sung dữ liệu để cân bằng các nhãn có tần suất thấp, đồng thời xây dựng các tập dữ liệu từ nguồn trực tuyến và nền tảng học tập nhằm tăng tính đa dạng và ứng dụng thực tiễn của các mô hình phân tích.

Thứ tư, tối ưu hóa mô hình theo hướng khắc phục mất cân bằng dữ liệu và tối ưu thời gian phản hồi. Việc sử dụng các mô hình huấn luyện trước trong tiếng Việt có thể giúp giảm phụ thuộc vào dữ liệu gốc, đồng thời hạn chế tác động tiêu cực từ sự mất cân bằng dữ liệu. Đối với tối ưu thời gian phản hồi, phương pháp cắt tỉa mô hình có thể giúp loại bỏ các tham số ít quan trọng, giảm tải tính toán mà vẫn giữ được độ chính xác cần thiết.

Qua đó, nghiên cứu đã chỉ ra rằng việc áp dụng học máy trong phân tích phản hồi sinh viên là xu hướng quan trọng, với hai trọng tâm chính là phân loại văn bản và phân tích cảm xúc. Hiện tại, các thuật toán học máy có giám sát vẫn được ưa chuộng nhờ độ chính xác cao nhưng gặp khó khăn khi áp dụng vào môi trường đa ngữ cảnh. Trong khi đó, các mô hình học sâu hứa hẹn tiềm năng phân tích chuyên sâu nhưng chưa được triển khai rộng rãi do yêu cầu cao về dữ liệu và tài nguyên tính toán.

Dựa trên các xu hướng nghiên cứu quốc tế, nghiên cứu đề xuất các giải pháp như: phát hiện lời mỉa mai, xử lý ký tự đặc biệt, phân tích cảm xúc theo khía cạnh và mở rộng tập dữ liệu. Những định hướng này sẽ giúp các cơ sở giáo dục sử dụng kết quả phân tích một cách hiệu quả hơn để nâng cao chất lượng giảng dạy.

Nhìn chung, học máy đóng vai trò quan trọng trong việc hỗ trợ các cơ sở giáo dục phân tích phản hồi một cách chính xác và toàn diện, từ đó cải thiện trải nghiệm học tập của sinh viên. Để ứng dụng hiệu quả, các cơ sở giáo dục cần đầu tư vào hệ thống xử lý ngôn ngữ tự nhiên và phát triển các mô hình AI phù hợp với đặc thù tiếng Việt. Việc kết hợp công nghệ này không chỉ giúp tối ưu hóa quy trình quản lý giáo dục mà còn tạo ra môi trường học tập hiện đại, đáp ứng tốt hơn nhu cầu và kỳ vọng của sinh viên.

Xem toàn bộ bài nghiên cứu Phân tích phản hồi sinh viên theo hướng tiếp cận học máy TẠI ĐÂY.

Nhóm tác giả: ThS.Trần Sơn Nam, Nguyễn Nhã Yến – Đại học Kinh tế Thành phố Hồ Chí Minh.

Đây là bài viết nằm trong chuỗi bài lan tỏa nghiên cứu và kiến thức ứng dụng với thông điệp “For a More Sustainable Mekong – Vì một Đồng bằng sông Cửu Long bền vững”, thuộc chương trình “Research Contribution For All – Nghiên Cứu Vì Cộng Đồng” do UEH thực hiện. UEH trân trọng kính mời Quý độc giả cùng đón xem bản tin UEH Research Insights tiếp theo.

Tin, ảnh: Tác giả, Phòng Tuyển sinh – Truyền thông UEH Mekong, Ban Truyền thông và Phát triển đối tác UEH

Giọng đọc: Thanh Kiều

Chu kỳ giảm giá của đồng USD?

TS. Đinh Thị Thu Hồng và nhóm nghiên cứu

26 Tháng Sáu, 2021

Việt Nam cần kịch bản cho thương mại tương lai

ThS. Tô Công Nguyên Bảo

26 Tháng Sáu, 2021

Hệ thống tiền tệ tiếp theo như thế nào?

TS. Lê Đạt Chí và nhóm nghiên cứu

26 Tháng Sáu, 2021

Chuyển đổi số trong khu vực công tại Việt Nam

Khoa Quản lý nhà nước

26 Tháng Sáu, 2021

Cần đưa giao dịch công nghệ lên sàn chứng khoán

Bộ Khoa học và Công nghệ

5 Tháng Sáu, 2021

Thiết kế đô thị: tầm nhìn vững chắc cho đô thị bền vững

Viện Đô thị thông minh và Quản lý

5 Tháng Sáu, 2021

Phục hồi du lịch và nỗ lực thoát khỏi vòng xoáy ảnh hưởng bởi Covid-19

Viện Đô thị thông minh và Quản lý

5 Tháng Sáu, 2021

2021 sẽ là năm khởi đầu của chu kỳ tăng trưởng mới

PGS.TS Nguyễn Khắc Quốc Bảo

5 Tháng Sáu, 2021

Quỹ vaccine sẽ khả thi khi có người dân đóng góp

Phạm Khánh Nam, Việt Dũng

5 Tháng Sáu, 2021

Kích thích kinh tế, gia tăng vận tốc dòng tiền

Quách Doanh Nghiệp

5 Tháng Sáu, 2021

Đi tìm chiến lược hậu Covid-19 cho doanh nghiệp bảo hiểm Việt Nam

PGS TS Nguyễn Khắc Quốc Bảo, ThS Lê Văn

5 Tháng Sáu, 2021

Insurtech – Cơ hội và thách thức cho Startup Việt

Ths. Lê Thị Hồng Hoa

5 Tháng Sáu, 2021