[Research Contribution] Hướng tiếp cận mới cho IoT: Kết hợp học liên kết và chắt lọc tri thức trên dữ liệu đa phương thức
6 Tháng Mười Một, 2025
Từ khóa: Học liên kết, chắt lọc tri thức, học sâu, internet vạn vật, hệ số tương quan Pearson
Trong thời đại Internet vạn vật (IoT) bùng nổ, hàng tỷ thiết bị thông minh đang tạo ra lượng dữ liệu khổng lồ mỗi ngày. Tuy nhiên, việc huấn luyện mô hình học sâu hiệu quả trên những thiết bị có cấu hình yếu và không đồng nhất vẫn là bài toán nan giải. Nghiên cứu của nhóm tác giả thuộc UEH Mekong – Đại học Kinh tế Thành phố Hồ Chí Minh và Trường Đại học Sài Gòn đã đề xuất hướng tiếp cận mới đó là kết hợp học liên kết với chắt lọc tri thức, sử dụng hệ số tương quan Pearson để nâng cao hiệu quả huấn luyện và độ ổn định của mô hình toàn cầu.
Bối cảnh nghiên cứu
Sự phát triển mạnh mẽ của Internet vạn vật (IoT) đã tạo ra khối lượng dữ liệu khổng lồ và đa dạng từ video, âm thanh đến các tín hiệu cảm biến như nhịp tim hay nồng độ CO₂. Việc xử lý và phân tích các luồng dữ liệu đa phương thức này trên các thiết bị biên (Edge Devices) – vốn có cấu hình phần cứng yếu, tài nguyên tính toán hạn chế và không đồng nhất, là một bài toán đầy thách thức. Đồng thời, quy định về bảo mật và quyền riêng tư dữ liệu ngày càng nghiêm ngặt khiến việc tập trung dữ liệu để huấn luyện mô hình AI theo cách truyền thống trở nên khó khả thi.
Trong bối cảnh đó, Học Liên kết (Federated Learning – FL) nổi lên như một giải pháp tiềm năng, cho phép huấn luyện mô hình một cách hợp tác trên dữ liệu cục bộ mà không cần chia sẻ dữ liệu thô. Tuy nhiên, trong môi trường dữ liệu đa phương thức và phi đồng nhất, các phương pháp Học Liên kết truyền thống như trung bình liên kết (FedAvg) thường cho kết quả kém ổn định, hội tụ chậm và dễ bị ảnh hưởng bởi các thiết bị có dữ liệu nhiễu hoặc kém chất lượng.
Hướng đến các kỹ sư AI phát triển ứng dụng trên thiết bị biên, các nhà nghiên cứu học máy phân tán và doanh nghiệp trong các lĩnh vực thành phố thông minh, chăm sóc sức khỏe, công nghiệp 4.0, nghiên cứu này đề xuất một khung mô hình học liên kết tiên tiến nhằm cải thiện hiệu suất, độ ổn định và khả năng tổng quát hóa của mô hình.
Cụ thể, khung đề xuất kết hợp 02 yếu tố trọng tâm:
- Mô hình Giáo viên đa cảm biến (Multi-sensing Teacher Model):Mô hình mạnh được đặt tại máy chủ trung tâm, có khả năng xử lý đồng thời dữ liệu video và cảm biến thông qua các lớp tích chập (CNN) và cơ chế chú ý (Attention Mechanism). Mô hình này đóng vai trò “giáo viên” lưu giữ tri thức tổng hợp và toàn diện.
- Mô hình Học sinh và cơ chế tổng hợp trọng số dựa trên hệ số tương quan Pearson:Mỗi thiết bị biên huấn luyện một mô hình “học sinh” nhỏ gọn trên dữ liệu cục bộ. Thay vì tổng hợp các mô hình bằng cách bình quân (FedAvg), máy chủ sẽ tính toán hệ số tương quan Pearson giữa trọng số của mô hình toàn cầu và từng mô hình cục bộ, từ đó gán trọng số cao hơn cho các thiết bị có mô hình tương quan lớn. Cách tiếp cận này giúp giảm ảnh hưởng của các thiết bị có dữ liệu sai lệch, cải thiện độ chính xác và tốc độ hội tụ.
Sau bước tổng hợp, mô hình toàn cầu tiếp tục được “truyền thụ tri thức” từ mô hình “giáo viên” thông qua chắt lọc tri thức (Knowledge Distillation – KD). Quá trình này cho phép mô hình toàn cầu học được những đặc trưng tinh tế và khái quát từ mô hình giáo viên, nhờ đó nâng cao hiệu suất và độ ổn định, ngay cả khi kích thước mô hình nhỏ gọn hơn.
Kết quả thực nghiệm
Nhóm nghiên cứu đã tiến hành kiểm chứng tính hiệu quả của khung mô hình đề xuất trên bộ dữ liệu đa phương thức thực tế do Viện Công nghệ Thông tin và Truyền thông Quốc gia Nhật Bản (NICT) cung cấp, bao gồm dữ liệu video và cảm biến (nhịp tim, nồng độ CO₂). Kết quả thu được cho thấy những cải thiện rõ rệt về hiệu suất, độ ổn định và tính khả thi của mô hình trong môi trường học liên kết.
- Độ ổn định vượt trội:Phương pháp mới sử dụng hệ số tương quan Pearson giúp mô hình học ổn định hơn rõ rệt so với cách truyền thống. Trong quá trình huấn luyện, sai số giảm đều và ít dao động, cho thấy mô hình học một cách bền vững và đáng tin cậy hơn.
- Hiệu suất cao:Cả hai phương pháp đều đạt độ chính xác 100% trên tập kiểm thử, tuy nhiên phương pháp mới cho thấy kết quả ổn định hơn, sai số thấp hơn liên tục qua các vòng huấn luyện. Điều này chứng tỏ mô hình không chỉ chính xác mà còn có khả năng hiểu và xử lý dữ liệu tốt hơn, giúp dự đoán hiệu quả hơn trong thực tế.
- Tính khả thi:Mô hình “học sinh” nhỏ gọn (~13 triệu tham số) vẫn đạt hiệu suất ấn tượng khi kết hợp với mô hình “giáo viên” mạnh mẽ (~78 triệu tham số). Điều này cho thấy khả năng triển khai thực tế trên các thiết bị biên hạn chế tài nguyên, đồng thời tận dụng được tri thức của mô hình lớn đặt tại máy chủ trung tâm thông qua cơ chế chắt lọc tri thức (Knowledge Distillation).
Nghiên cứu không chỉ đóng góp về mặt học thuật thông qua đề xuất một cơ chế tổng hợp mới dựa trên hệ số tương quan Pearson trong Học Liên kết (Federated Learning – FL), mà còn mở ra một hướng tiếp cận thực tiễn và hiệu quả cho việc triển khai AI trong môi trường phi tập trung. Sự kết hợp linh hoạt giữa Học Liên kết (FL), Chắt lọc tri thức (Knowledge Distillation – KD), hệ số tương quan Pearson và xử lý dữ liệu đa phương thức đã tạo nên một khung mô hình vừa đảm bảo bảo mật dữ liệu, vừa tối ưu hiệu năng trong điều kiện thiết bị có cấu hình hạn chế.
Hàm ý chính sách
Kết quả này mang ý nghĩa ứng dụng to lớn trong việc phát triển các hệ thống AI phân tán thông minh, như:
- Hệ thống giám sát an ninh tích hợp video và cảm biếnnhằm nâng cao năng lực phân tích, cảnh báo sớm và ra quyết định tự động;
- Ứng dụng chăm sóc sức khỏe từ xa, giúp theo dõi bệnh nhân thông qua video và tín hiệu sinh học một cách bảo mật, liên tục và hiệu quả;
- Mạng lưới thiết bị IoT thông minh trong thành phố và công nghiệp 4.0, hỗ trợ tối ưu vận hành, tiết kiệm năng lượng và nâng cao chất lượng dịch vụ.
Với hướng tiếp cận mới mẻ và khả năng ứng dụng cao, nghiên cứu đã mở ra một hướng đi tiên phong trong việc kết hợp trí tuệ nhân tạo và Internet vạn vật, góp phần thúc đẩy đổi mới sáng tạo và chuyển đổi số bền vững. Kết quả này không chỉ đóng góp vào nền tảng lý thuyết về học liên kết và chắt lọc tri thức mà còn mang giá trị thực tiễn quan trọng trong phát triển các hệ thống AI phân tán thông minh phục vụ đời sống và sản xuất.
Xem toàn bộ bài nghiên cứu: Kết hợp Hệ số tương quan và Chắt lọc tri thức cho Học máy Liên kết: Hướng tiếp cận mới cho IoT trên dữ liệu đa phương thức TẠI ĐÂY
Nhóm tác giả: ThS. Lê Duy Đồng, Huỳnh Duy Thanh, PGS.TS. Phạm Thế Bảo – Đại học Kinh tế Thành phố Hồ Chí Minh (UEH) và Trường Đại học Sài Gòn
Đây là bài viết nằm trong chuỗi bài lan tỏa nghiên cứu và kiến thức ứng dụng với thông điệp “For a More Sustainable Mekong – Vì một Đồng bằng sông Cửu Long bền vững”, thuộc chương trình “Research Contribution For All – Nghiên Cứu Vì Cộng Đồng” do UEH thực hiện. UEH trân trọng kính mời Quý độc giả cùng đón xem bản tin UEH Research Insights tiếp theo.
Tin, ảnh: Tác giả, Phòng Tuyển sinh – Truyền thông UEH Mekong, Ban Truyền thông và Phát triển đối tác UEH
Giọng đọc: Thanh Kiều
[Research Contribution] Khám phá sự đối lập giữa nghiện thương hiệu và tình yêu thương hiệu
24 Tháng Mười Một, 2025
[Research Contribution] Phát triển bền vững – Góc nhìn đa chiều về hạnh phúc
8 Tháng Mười, 2025
[Research Contribution] Những góc nhìn mới về tương lai của thế giới ảo
16 Tháng Sáu, 2025
[Podcast] Góp ý giải pháp phát triển giáo dục Đại học
5 Tháng Hai, 2025
[Podcast] Các yếu tố ảnh hưởng đến động lực học tập của sinh viên
22 Tháng Một, 2025
[Podcast] “Mô hình Campus thích ứng – Giải pháp dành cho Mekong bền vững”
13 Tháng Một, 2025
[Podcast] Đào tạo nhân lực Mekong tương lai: Trao quyền hành động bền vững
30 Tháng Mười Hai, 2024
[Podcast] Dự án Phát triển khung công bằng giao thoa nhằm khuyến khích khả năng đi bộ
30 Tháng Mười Hai, 2024
[Podcast] Chiến lược thiết kế hậu kỹ thuật số trong nghệ thuật truyền thông
27 Tháng Mười Một, 2024
[Podcast] Đồng sáng tạo và xây dựng cộng đồng ArtTech hướng tới tương lai bền vững
26 Tháng Mười Một, 2024
[Podcast] Quản trị công nghệ trong kỷ nguyên 4.0: Tổng quan và nhu cầu thị trường
21 Tháng Mười Một, 2024
[Podcast] Công nghệ thông tin – truyền thông và sự ổn định của hệ thống ngân hàng
21 Tháng Mười Một, 2024
[Podcast] Vai trò của chính sách vĩ mô thận trọng đối với tăng trưởng tín dụng tại Việt Nam
21 Tháng Mười Một, 2024
[Podcast] Đề xuất hoàn thiện pháp luật về hoạt động môi giới chứng khoán tại Việt Nam
21 Tháng Mười Một, 2024
[Podcast] NFTs – Cuộc cách mạng nghệ thuật hay cơn sốt nhất thời?
18 Tháng Mười Một, 2024
[Podcast] CareFeeder – Giải pháp công nghệ hỗ trợ người già và bệnh nhân Parkinson tự ăn uống
11 Tháng Mười Một, 2024
[Podcast] Ứng dụng học máy trong phân tích dữ liệu quản trị nguồn nhân lực
11 Tháng Mười Một, 2024
[Podcast] Nghệ thuật dân gian thời 4.0: Múa rối nước tự động dựa trên nền tảng robot
7 Tháng Mười Một, 2024
[Podcast] Bứt phá hiệu suất sáng tạo nhân viên nhờ phản hồi mang tính phát triển
7 Tháng Mười Một, 2024
[Podcast] Giải pháp MPIA: Lối thoát tạm thời cho cuộc khủng hoảng thương mại quốc tế?
7 Tháng Mười Một, 2024
[Podcast] “Căn bệnh Hà Lan” trong việc nhận kiều hối và trường hợp Việt Nam
31 Tháng Mười, 2024
[Podcast] Giải pháp nâng cao hoạt động vận động cho sinh viên
9 Tháng Tám, 2024
[Podcast] Phong Cách Lãnh Đạo Đạo Đức Và Hành Vi Ngoài Vai Trò Của Công Chức
29 Tháng Bảy, 2024
[Podcast] Định Hình Chiến Lược Phát Triển Toàn Diện, Bền Vững Cho Đất Nước
25 Tháng Bảy, 2024
[Podcast] Mô Hình Đại Học Bền Vững Dành Cho Các Thị Trường Mới Nổi
19 Tháng Bảy, 2024
[Podcast] Những Tiếp Cận Mới Nhất Dành Cho Các Đại Học Bền Vững
11 Tháng Bảy, 2024
[Podcast] Tác Động Của Nguồn Nhân Lực Xanh Đến Các Mục Tiêu Về Môi Trường
24 Tháng Năm, 2024
Kinh Tế Xã Hội Và Sự Phát Thải CO2 Ở Việt Nam Giai Đoạn 1990 – 2018
23 Tháng Năm, 2024
Pháp Luật Dữ Liệu – Kỳ 1: Cần Một Cách Tiếp Cận Mới
15 Tháng Năm, 2024
[Podcast] Pháp Luật Dữ Liệu – Kỳ 1: Cần Một Cách Tiếp Cận Mới
14 Tháng Năm, 2024
Đánh Giá Quảng Cáo Trên Nền Tảng Tiktok
8 Tháng Năm, 2024
[Podcast] Đánh Giá Quảng Cáo Trên Nền Tảng Tiktok
7 Tháng Năm, 2024
[podcast] Phản Ứng Của Chính Sách Xã Hội Đối Với Đại Dịch Covid-19 Ở Một Số Quốc Gia (Kỳ 1)
8 Tháng Mười Hai, 2023
Promoting Learner Autonomy in English Language Learning (Part 2)
28 Tháng Mười Một, 2023
[Podcast] Ngoại giao kinh tế Việt Nam trong thời kỳ đổi mới và hội nhập quốc tế
10 Tháng Mười Một, 2023
ArtTech and sustainable development
27 Tháng Mười, 2023
Cộng đồng ArtTech đầu tiên tại Việt Nam – Một năm nhìn lại
9 Tháng Mười, 2023
ArtTech – Một xu hướng tương lai
5 Tháng Mười, 2023
ArtTech và phát triển bền vững
3 Tháng Mười, 2023
[Podcast] Máy Tính Và Công Nghệ “Không Đi Một Mình” – Phần 4
24 Tháng Bảy, 2023
[Podcast] Tác Động Của Đồng Tiền Kỹ Thuật Số Đến Tỷ Giá Hối Đoái
14 Tháng Mười Một, 2022
[Podcast] Chuyển Đổi Số Trong Ngành Du Lịch Việt Nam
5 Tháng Năm, 2022
[Podcast] Chuyển Đổi Số Trong Lĩnh Vực Y Tế Ở Việt Nam
25 Tháng Ba, 2022
[Podcast] Phân Tích Dữ Liệu Con Người Tại Việt Nam
18 Tháng Ba, 2022
[Podcast] Chuyển Đổi Số Trong Nông Nghiệp Ở Việt Nam
11 Tháng Ba, 2022
[Podcast] Mô Hình Kinh Tế Chia sẻ: Các Vấn Đề Quản Lý Ở Việt Nam
21 Tháng Một, 2022
[Podcast] Nâng Cao Trải Nghiệm Khách Hàng Trực Tuyến Trong Ngành Du Lịch
15 Tháng Một, 2022
[Podcast] Chính Sách Lao Động Việc Làm Cho TP. HCM Trong Giai Đoạn Sau Giãn Cách
28 Tháng Mười Hai, 2021
[Podcast] Xây Dựng Thị Trường Chứng Khoán Phi Tập Trung Dựa Trên Công Nghệ Blockchain
24 Tháng Mười Hai, 2021
[Podcast] Học Tập Suốt Đời Trong Thế Giới Số: Góc Nhìn Từ Nghề Nghiệp Kế Toán, Kiểm toán
21 Tháng Mười Hai, 2021
[Podcast] Học Tập Suốt Đời Tại UEH: Hướng Đến Đại Học Bền Vững
14 Tháng Mười Hai, 2021
[Podcast] Xu Hướng Kinh Doanh Bán Lẻ Trực Tuyến Thời Kỳ Covid
10 Tháng Mười Hai, 2021
[Podcast] Big Data Cho Mục Tiêu Phát Triển Bền Vững: Kinh Nghiệm Quốc Tế
7 Tháng Mười Hai, 2021
[Podcast] Cải Cách Luật Đất Đai Để Thúc Đẩy Phát Triển Kinh Tế
2 Tháng Mười Hai, 2021
[Podcast] Cuộc Cách Mạng Trong Kinh Tế Học Thực Nghiệm
30 Tháng Mười Một, 2021
[Podcast] Chỉ Số Giá Tiêu Dùng Từ Góc Nhìn Khai Thác Dữ Liệu Lớn (Big Data)
17 Tháng Mười Một, 2021
[Podcast] Toàn Cảnh Tiền Tệ Kỹ Thuật Số – Phần 5 : Tiền Ổn Định Tư Nhân Diem
5 Tháng Mười Một, 2021
Đứt gãy chuỗi cung ứng vùng trọng điểm phía Nam: 8 giải pháp
20 Tháng Mười, 2021
[Podcast]Toàn Cảnh Tiền Tệ Kỹ Thuật Số – Phần 2: Những Cột Mốc Phát Triển
19 Tháng Mười, 2021
[Podcast] Toàn cảnh tiền tệ kỹ thuật số – Phần 1: Xu thế của thời đại
15 Tháng Mười, 2021
NGÂN HÀNG BẮT TAY FINTECH (Phần 3): Các Giải Pháp Hỗ Trợ
8 Tháng Mười, 2021
UEH chủ trì thành công Hội thảo ICBF 2021
7 Tháng Mười, 2021
GRSD 2021- Hội thảo khoa học “Tăng trưởng xanh và phát triển bền vững”
6 Tháng Mười, 2021
NGÂN HÀNG BẮT TAY FINTECH (phần 2): Chọn đối tác theo tiêu chí nào?
4 Tháng Mười, 2021
‘Đổi mới giáo dục nghề nghiệp là động cơ tăng trưởng kinh tế’
30 Tháng Chín, 2021
Giải pháp “mở cửa” an toàn với các khu công nghiệp tại TP Hồ Chí Minh
27 Tháng Chín, 2021
Khi cuộc sống “bình thường mới”, nơi ở cho người lao động cần được quan tâm
9 Tháng Chín, 2021
Hướng phát triển mô hình đào tạo luân phiên (Dual Education) tại Việt Nam
6 Tháng Chín, 2021
Webinar: Tương lai ngành Thẩm định giá trong thập niên mới
17 Tháng Tám, 2021
Hãy là người dùng thông minh khi đón nhận và chia sẻ thông tin
9 Tháng Tám, 2021
Webinar: An toàn thông tin kế toán trong kỷ nguyên số
3 Tháng Tám, 2021
Có nên đưa lãi suất tiền gửi VND về 0 phần trăm?
20 Tháng Bảy, 2021
Chu kỳ giảm giá của đồng USD?
TS. Đinh Thị Thu Hồng và nhóm nghiên cứu
26 Tháng Sáu, 2021
Việt Nam cần kịch bản cho thương mại tương lai
ThS. Tô Công Nguyên Bảo
26 Tháng Sáu, 2021
Hệ thống tiền tệ tiếp theo như thế nào?
TS. Lê Đạt Chí và nhóm nghiên cứu
26 Tháng Sáu, 2021
Chuyển đổi số trong trường đại học: Dạy học trực tuyến sẽ trở thành xu hướng tất yếu
GS.TS. Nguyễn Trọng Hoài
26 Tháng Sáu, 2021
Tiền số ngân hàng Trung ương – Vận hành và thử nghiệm
Châu Văn Thành
26 Tháng Sáu, 2021
Chuyển đổi số trong khu vực công tại Việt Nam
Khoa Quản lý nhà nước
26 Tháng Sáu, 2021
“Cấp cứu” doanh nghiệp trước làn sóng COVID-19 thứ 4
23 Tháng Sáu, 2021
Chuyên gia UEH: Việt Nam nên kết hợp tiêm vaccine miễn phí và dịch vụ
23 Tháng Sáu, 2021
Hội thảo khoa học về Thị trường bảo hiểm Việt Nam (Conference on Vietnam’s Insurance Industry – CVII)
Khoa Toán – Thống Kê
7 Tháng Sáu, 2021
Muốn có trung tâm tài chính phải có chiến lược thích ứng
Khoa Tài chính
5 Tháng Sáu, 2021
Cần đưa giao dịch công nghệ lên sàn chứng khoán
Bộ Khoa học và Công nghệ
5 Tháng Sáu, 2021
Sự hữu ích của Lý thuyết trò chơi: Thảo luận về giải Nobel Kinh tế năm 2020
JABES
5 Tháng Sáu, 2021
Đoán định tư pháp: Xu thế mới trong hành nghề Luật
Khoa Luật
5 Tháng Sáu, 2021
Thiết kế đô thị: tầm nhìn vững chắc cho đô thị bền vững
Viện Đô thị thông minh và Quản lý
5 Tháng Sáu, 2021
Phục hồi du lịch và nỗ lực thoát khỏi vòng xoáy ảnh hưởng bởi Covid-19
Viện Đô thị thông minh và Quản lý
5 Tháng Sáu, 2021
Nghiên cứu Kinh tế học lao động trong sự biến động của thế giới
JABES
5 Tháng Sáu, 2021
Kết hợp Nghệ thuật và Công nghệ hướng đến Thành phố thông minh đáng sống
Viện Đô thị thông minh và Quản lý
5 Tháng Sáu, 2021
Chuỗi bài “The Basics of B2B”: Thị trường việc làm rộng mở nhiều sinh viên chuyên ngành Marketing đang bỏ quên
TS. Đinh Tiên Minh
5 Tháng Sáu, 2021
Môi trường không phải để nhà đầu tư xài miễn phí!
TS. Phạm Khánh Nam
5 Tháng Sáu, 2021
2021 sẽ là năm khởi đầu của chu kỳ tăng trưởng mới
PGS.TS Nguyễn Khắc Quốc Bảo
5 Tháng Sáu, 2021
Quỹ vaccine sẽ khả thi khi có người dân đóng góp
Phạm Khánh Nam, Việt Dũng
5 Tháng Sáu, 2021
Kích thích kinh tế, gia tăng vận tốc dòng tiền
Quách Doanh Nghiệp
5 Tháng Sáu, 2021
Đi tìm chiến lược hậu Covid-19 cho doanh nghiệp bảo hiểm Việt Nam
PGS TS Nguyễn Khắc Quốc Bảo, ThS Lê Văn
5 Tháng Sáu, 2021
Insurtech – Cơ hội và thách thức cho Startup Việt
Ths. Lê Thị Hồng Hoa
5 Tháng Sáu, 2021
