[Research Contribution] Hướng tiếp cận mới cho IoT: Kết hợp học liên kết và chắt lọc tri thức trên dữ liệu đa phương thức

6 Tháng Mười Một, 2025

Từ khóa: Học liên kết, chắt lọc tri thức, học sâu, internet vạn vật, hệ số tương quan Pearson

Trong thời đại Internet vạn vật (IoT) bùng nổ, hàng tỷ thiết bị thông minh đang tạo ra lượng dữ liệu khổng lồ mỗi ngày. Tuy nhiên, việc huấn luyện mô hình học sâu hiệu quả trên những thiết bị có cấu hình yếu và không đồng nhất vẫn là bài toán nan giải. Nghiên cứu của nhóm tác giả thuộc UEH Mekong – Đại học Kinh tế Thành phố Hồ Chí Minh và Trường Đại học Sài Gòn đã đề xuất hướng tiếp cận mới đó là kết hợp học liên kết với chắt lọc tri thức, sử dụng hệ số tương quan Pearson để nâng cao hiệu quả huấn luyện và độ ổn định của mô hình toàn cầu.

Bg 1499x600

Bối cảnh nghiên cứu

Sự phát triển mạnh mẽ của Internet vạn vật (IoT) đã tạo ra khối lượng dữ liệu khổng lồ và đa dạng từ video, âm thanh đến các tín hiệu cảm biến như nhịp tim hay nồng độ CO₂. Việc xử lý và phân tích các luồng dữ liệu đa phương thức này trên các thiết bị biên (Edge Devices) – vốn có cấu hình phần cứng yếu, tài nguyên tính toán hạn chế và không đồng nhất, là một bài toán đầy thách thức. Đồng thời, quy định về bảo mật và quyền riêng tư dữ liệu ngày càng nghiêm ngặt khiến việc tập trung dữ liệu để huấn luyện mô hình AI theo cách truyền thống trở nên khó khả thi.

Trong bối cảnh đó, Học Liên kết (Federated Learning – FL) nổi lên như một giải pháp tiềm năng, cho phép huấn luyện mô hình một cách hợp tác trên dữ liệu cục bộ mà không cần chia sẻ dữ liệu thô. Tuy nhiên, trong môi trường dữ liệu đa phương thức và phi đồng nhất, các phương pháp Học Liên kết truyền thống như trung bình liên kết (FedAvg) thường cho kết quả kém ổn định, hội tụ chậm và dễ bị ảnh hưởng bởi các thiết bị có dữ liệu nhiễu hoặc kém chất lượng.

Hướng đến các kỹ sư AI phát triển ứng dụng trên thiết bị biên, các nhà nghiên cứu học máy phân tán và doanh nghiệp trong các lĩnh vực thành phố thông minh, chăm sóc sức khỏe, công nghiệp 4.0, nghiên cứu này đề xuất một khung mô hình học liên kết tiên tiến nhằm cải thiện hiệu suất, độ ổn định và khả năng tổng quát hóa của mô hình.

Cụ thể, khung đề xuất kết hợp 02 yếu tố trọng tâm:

  1. Mô hình Giáo viên đa cảm biến (Multi-sensing Teacher Model):Mô hình mạnh được đặt tại máy chủ trung tâm, có khả năng xử lý đồng thời dữ liệu video và cảm biến thông qua các lớp tích chập (CNN) và cơ chế chú ý (Attention Mechanism). Mô hình này đóng vai trò “giáo viên” lưu giữ tri thức tổng hợp và toàn diện.
  2. Mô hình Học sinh và cơ chế tổng hợp trọng số dựa trên hệ số tương quan Pearson:Mỗi thiết bị biên huấn luyện một mô hình “học sinh” nhỏ gọn trên dữ liệu cục bộ. Thay vì tổng hợp các mô hình bằng cách bình quân (FedAvg), máy chủ sẽ tính toán hệ số tương quan Pearson giữa trọng số của mô hình toàn cầu và từng mô hình cục bộ, từ đó gán trọng số cao hơn cho các thiết bị có mô hình tương quan lớn. Cách tiếp cận này giúp giảm ảnh hưởng của các thiết bị có dữ liệu sai lệch, cải thiện độ chính xác và tốc độ hội tụ.

Sau bước tổng hợp, mô hình toàn cầu tiếp tục được “truyền thụ tri thức” từ mô hình “giáo viên” thông qua chắt lọc tri thức (Knowledge Distillation – KD). Quá trình này cho phép mô hình toàn cầu học được những đặc trưng tinh tế và khái quát từ mô hình giáo viên, nhờ đó nâng cao hiệu suất và độ ổn định, ngay cả khi kích thước mô hình nhỏ gọn hơn.

Kết quả thực nghiệm

Nhóm nghiên cứu đã tiến hành kiểm chứng tính hiệu quả của khung mô hình đề xuất trên bộ dữ liệu đa phương thức thực tế do Viện Công nghệ Thông tin và Truyền thông Quốc gia Nhật Bản (NICT) cung cấp, bao gồm dữ liệu video và cảm biến (nhịp tim, nồng độ CO₂). Kết quả thu được cho thấy những cải thiện rõ rệt về hiệu suất, độ ổn định và tính khả thi của mô hình trong môi trường học liên kết.

  • Độ ổn định vượt trội:Phương pháp mới sử dụng hệ số tương quan Pearson giúp mô hình học ổn định hơn rõ rệt so với cách truyền thống. Trong quá trình huấn luyện, sai số giảm đều và ít dao động, cho thấy mô hình học một cách bền vững và đáng tin cậy hơn.
  • Hiệu suất cao:Cả hai phương pháp đều đạt độ chính xác 100% trên tập kiểm thử, tuy nhiên phương pháp mới cho thấy kết quả ổn định hơn, sai số thấp hơn liên tục qua các vòng huấn luyện. Điều này chứng tỏ mô hình không chỉ chính xác mà còn có khả năng hiểu và xử lý dữ liệu tốt hơn, giúp dự đoán hiệu quả hơn trong thực tế.
  • Tính khả thi:Mô hình “học sinh” nhỏ gọn (~13 triệu tham số) vẫn đạt hiệu suất ấn tượng khi kết hợp với mô hình “giáo viên” mạnh mẽ (~78 triệu tham số). Điều này cho thấy khả năng triển khai thực tế trên các thiết bị biên hạn chế tài nguyên, đồng thời tận dụng được tri thức của mô hình lớn đặt tại máy chủ trung tâm thông qua cơ chế chắt lọc tri thức (Knowledge Distillation).

Nghiên cứu không chỉ đóng góp về mặt học thuật thông qua đề xuất một cơ chế tổng hợp mới dựa trên hệ số tương quan Pearson trong Học Liên kết (Federated Learning – FL), mà còn mở ra một hướng tiếp cận thực tiễn và hiệu quả cho việc triển khai AI trong môi trường phi tập trung. Sự kết hợp linh hoạt giữa Học Liên kết (FL), Chắt lọc tri thức (Knowledge Distillation – KD), hệ số tương quan Pearson và xử lý dữ liệu đa phương thức đã tạo nên một khung mô hình vừa đảm bảo bảo mật dữ liệu, vừa tối ưu hiệu năng trong điều kiện thiết bị có cấu hình hạn chế.

Hàm ý chính sách

Kết quả này mang ý nghĩa ứng dụng to lớn trong việc phát triển các hệ thống AI phân tán thông minh, như:

  • Hệ thống giám sát an ninh tích hợp video và cảm biếnnhằm nâng cao năng lực phân tích, cảnh báo sớm và ra quyết định tự động;
  • Ứng dụng chăm sóc sức khỏe từ xa, giúp theo dõi bệnh nhân thông qua video và tín hiệu sinh học một cách bảo mật, liên tục và hiệu quả;
  • Mạng lưới thiết bị IoT thông minh trong thành phố và công nghiệp 4.0, hỗ trợ tối ưu vận hành, tiết kiệm năng lượng và nâng cao chất lượng dịch vụ.

Với hướng tiếp cận mới mẻ và khả năng ứng dụng cao, nghiên cứu đã mở ra một hướng đi tiên phong trong việc kết hợp trí tuệ nhân tạo và Internet vạn vật, góp phần thúc đẩy đổi mới sáng tạo và chuyển đổi số bền vững. Kết quả này không chỉ đóng góp vào nền tảng lý thuyết về học liên kết và chắt lọc tri thức mà còn mang giá trị thực tiễn quan trọng trong phát triển các hệ thống AI phân tán thông minh phục vụ đời sống và sản xuất.

Xem toàn bộ bài nghiên cứu: Kết hợp Hệ số tương quan và Chắt lọc tri thức cho Học máy Liên kết: Hướng tiếp cận mới cho IoT trên dữ liệu đa phương thức TẠI ĐÂY

Nhóm tác giả: ThS. Lê Duy Đồng, Huỳnh Duy Thanh, PGS.TS. Phạm Thế Bảo – Đại học Kinh tế Thành phố Hồ Chí Minh (UEH) và Trường Đại học Sài Gòn

Đây là bài viết nằm trong chuỗi bài lan tỏa nghiên cứu và kiến thức ứng dụng với thông điệp “For a More Sustainable Mekong – Vì một Đồng bằng sông Cửu Long bền vững”, thuộc chương trình “Research Contribution For All – Nghiên Cứu Vì Cộng Đồng” do UEH thực hiện. UEH trân trọng kính mời Quý độc giả cùng đón xem bản tin UEH Research Insights tiếp theo.

Tin, ảnh: Tác giả, Phòng Tuyển sinh – Truyền thông UEH Mekong, Ban Truyền thông và Phát triển đối tác UEH

Giọng đọc: Thanh Kiều

Chu kỳ giảm giá của đồng USD?

TS. Đinh Thị Thu Hồng và nhóm nghiên cứu

26 Tháng Sáu, 2021

Việt Nam cần kịch bản cho thương mại tương lai

ThS. Tô Công Nguyên Bảo

26 Tháng Sáu, 2021

Hệ thống tiền tệ tiếp theo như thế nào?

TS. Lê Đạt Chí và nhóm nghiên cứu

26 Tháng Sáu, 2021

Chuyển đổi số trong khu vực công tại Việt Nam

Khoa Quản lý nhà nước

26 Tháng Sáu, 2021

Cần đưa giao dịch công nghệ lên sàn chứng khoán

Bộ Khoa học và Công nghệ

5 Tháng Sáu, 2021

Thiết kế đô thị: tầm nhìn vững chắc cho đô thị bền vững

Viện Đô thị thông minh và Quản lý

5 Tháng Sáu, 2021

Phục hồi du lịch và nỗ lực thoát khỏi vòng xoáy ảnh hưởng bởi Covid-19

Viện Đô thị thông minh và Quản lý

5 Tháng Sáu, 2021

2021 sẽ là năm khởi đầu của chu kỳ tăng trưởng mới

PGS.TS Nguyễn Khắc Quốc Bảo

5 Tháng Sáu, 2021

Quỹ vaccine sẽ khả thi khi có người dân đóng góp

Phạm Khánh Nam, Việt Dũng

5 Tháng Sáu, 2021

Kích thích kinh tế, gia tăng vận tốc dòng tiền

Quách Doanh Nghiệp

5 Tháng Sáu, 2021

Đi tìm chiến lược hậu Covid-19 cho doanh nghiệp bảo hiểm Việt Nam

PGS TS Nguyễn Khắc Quốc Bảo, ThS Lê Văn

5 Tháng Sáu, 2021

Insurtech – Cơ hội và thách thức cho Startup Việt

Ths. Lê Thị Hồng Hoa

5 Tháng Sáu, 2021