ĐỀ XUẤT CƠ CHẾ TRUYỀN THÔNG TRẠNG THÁI THÍCH NGHI DỰA TRÊN MỨC ĐỘ QUAN TRỌNG CHO BÀI TOÁN PHÂN TẢI TÁC VỤ ĐA TÁC TỬ TRONG ĐIỆN TOÁN BIÊN DI ĐỘNG
DOI:
https://doi.org/10.59266/houjs.2026.1151Keywords:
điện toán biên, học tăng cường đa tác tử, truyền thông hiệu quả, gán trọng số theo mức độ quan trọng, phân tải tác vụAbstract
Hiệu quả truyền thông là một yếu tố mang tính quyết định trong các hệ đa tác tử, đặc biệt trong môi trường điện toán biên (Mobile Edge Computing - MEC) nơi băng thông bị giới hạn. Bài báo này đề xuất cơ chế truyền thông trạng thái thích nghi dựa trên mức độ quan trọng (Adaptive Importance-Weighted State Communication - IWSC), một cơ chế truyền thông thông minh được tích hợp với thuật toán học tăng cường đa tác tử ( Multi-Agent Proximal Policy Optimization - MAPPO) nhằm tối ưu hóa quyết định chuyển tải tác vụ từ các thiết bị đến các máy chủ biên. Thay vì truyền toàn bộ trạng thái của tất cả tác tử, mô-đun IWSC học cách truyền có chọn lọc chỉ những chiều trạng thái quan trọng dựa trên điều kiện mạng thực tế. Thông qua các thí nghiệm với 3 hạt giống ngẫu nhiên và 500 tập huấn luyện, kết quả cho thấy Adaptive IWSC giảm 37% chi phí truyền thông, đồng thời duy trì thông lượng tác vụ tương đương và cải thiện lợi ích trung bình thêm 3,6% so với các đường cơ sở Full Communication. Các phát hiện này khẳng định rằng không phải mọi thông tin trạng thái đều cần thiết như nhau để đạt ra quyết định tối ưu; truyền thông thích ứng có thể mang lại mức tiết kiệm tài nguyên đáng kể mà không làm suy giảm hiệu năng.
References
Shahryari, O. K., et al. (2020). Energy-efficient and delay-guaranteed computation offloading for fog-based IoT networks. Computer Networks, 182, Article 107511. https://doi.org/10.1016/j.comnet.2020.107511
Andriulo, F. C., Fiore, M., Mongiello, M., Traversa, E., & Zizzo, V. (2024). Edge computing and cloud computing for internet of things: A review. Informatics, 11(4), Article 71. https://doi.org/10.3390/informatics11040071.
Zhu, C., Dastani, M., & Wang, S. (2024). A survey of multi-agent deep reinforcement learning with communication. Autonomous Agents and Multi-Agent Systems, 38, Article 4. https://doi.org/10.1007/s10458-023-09633-6.
Wang, X., Li, X., Shao, J., & Zhang, J. (2023). AC2C: Adaptively controlled two- hop communication for multi-agent reinforcement learning. arXiv. https://doi.org/10.48550/arXiv.2302.12515.
Liu, Z., Li, Y., Wang, J., et al. (2025). Robust and efficient communication in multi-agent reinforcement learning. arXiv. https://doi.org/10.48550/arXiv.2511.11393.
Tang, M., & Wong, V. W. S. (2020). Deep reinforcement learning for task offloading in mobile edge computing systems. IEEE Transactions on Mobile Computing, 21(6), 1985-1997. https://doi.org/10.1109/TMC.2020.3036871.
Yan, M., Zhang, L., Li, L., Lei, L., & Li, C. (2025). Energy-efficient task offloading optimization based on meta-learning in UAV-assisted edge computing networks. IEEE Vehicular Technology Conference (VTC Spring). https://doi.org/10.1109/VTC2025-Spring65109.2025.11174666.
Yu, C., Velu, A., Vinitsky, E., Gao, J., Wang, Y., Bayen, A., & Wu, Y. (2022). The surprising effectiveness of PPO in cooperative, multi-agent games. arXiv. https://doi.org/10.48550/arXiv.2103.01955.
Lowe, R., Wu, Y., Tamar, A., Harb, J., Abbeel, P., & Mordatch, I. (2017). Multi-agent actor-critic for mixed cooperative-competitive environments. arXiv. https://doi.org/10.48550/arXiv.1706.02275.
Zhou, M., Liu, Z., Sui, P., Li, Y., & Chung, Y. Y. (2020). Learning implicit credit assignment for cooperative multi-agent reinforcement learning. arXiv. https://doi.org/10.48550/arXiv.2007.02529.
Zhang, P., Wang, C., Jiang, C., & Han, Z. (2022). Deep reinforcement learning assisted federated learning algorithm for data management of IIoT. arXiv. https://doi.org/10.48550/arXiv.2202.03575.
Alhilali, A. H., & Montazerolghaem, A. (2023). Artificial intelligence based load balancing in SDN: A comprehensive survey. arXiv. https://doi.org/10.48550/arXiv.2308.02149.