PHƯƠNG PHÁP TRUY XUẤT ZERO-SHOT DỰA TRÊN QUAN HỆ CHO BÀI TOÁN KHÁM PHÁ TRÍCH DẪN KHOA HỌC
DOI:
https://doi.org/10.59266/houjs.2026.1169Keywords:
khám phá trích dẫn, trích xuất quan hệ, truy xuất văn bản, mô hình ngôn ngữ lớn, trí tuệ nhân tạo tạo sinhAbstract
Nhiệm vụ chia sẻ về khám phá trích dẫn tập trung vào việc dự đoán trích dẫn chính xác từ một tập hợp ứng viên cho một đoạn văn bản đầu vào. Những thách thức chính bắt nguồn từ độ dài của các đoạn tóm tắt và độ tương đồng cao giữa các ứng viên, gây khó khăn cho việc xác định chính xác bài báo cần trích dẫn. Để giải quyết vấn đề này, bài báo trình bày một hệ thống thực hiện truy xuất top-k bản tóm tắt tương đồng nhất dựa trên các đặc trưng quan hệ được trích xuất từ đoạn văn bản đã cho. Tận dụng mô hình ngôn ngữ lớn để xác định chính xác trích dẫn phù hợp nhất. Dùng để đánh giá khung hệ thống dựa trên tập dữ liệu chuẩn của bài toán, qua đó chứng minh tính hiệu quả của phương pháp trong việc dự đoán trích dẫn.
References
Ali, M. J., & Richardson, K. (2021). The impact of inaccurate citations in scientific writing: A systematic review. Journal of Academic Writing, 11(2), 45-58.
Hassan, S., Mahdi, M. N., & Al-Jumeily, D. (2023). Citation recommendation systems: A comprehensive survey and future trends. IEEE Access, 11, 10234- 10255.
Jones, K. S. (1972). A statistical interpretation of term specificity and its application in retrieval. Journal of Documentation, 28(1), 11-21.
Joulin, A., Grave, E., Bojanowski, P., & Mikolov, T. (2017). Bag of tricks for efficient text classification. In Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics (pp. 427-431).
Karpukhin, V., Oguz, B., Min, S., Lewis, P., Wu, L., Edunov, S., et al. (2020). Dense passage retrieval for open-domain question answering. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP).
Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., et al. (2020). Retrieval-augmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems, 33, 9459-9474.
Nan, G., Guo, Z., Sekulic, I., & Lu, W. (2020). Reasoning with latent structure refinement for document-level relation extraction. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (pp. 1546- 1557).
Ni, J., Qu, C., Lu, J., Dai, Z., Abrego, G. H., Ma, J., et al. (2021). Large dual encoders are generalizable retrievers. arXiv. https://arxiv.org/abs/2112.07899
Pennington, J., Socher, R., & Manning, C. D. (2014). GloVe: Global vectors for word representation. In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) (pp. 1532-1543).
Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., et al. (2020). Exploring the limits of transfer learning with a unified text-to-text transformer. Journal of Machine Learning Research, 21(140), 1-67.
Robertson, S., & Zaragoza, H. (2009). The probabilistic relevance framework: BM25 and beyond. Foundations and Trends® in Information Retrieval, 3(4), 333-389.
Rong, X. (2014). word2vec parameter learning explained. arXiv. https://arxiv.org/abs/1411.2738
Sun, C., Qiu, X., Xu, Y., & Huang, X. (2019). How to fine-tune BERT for text classification? In China National Conference on Chinese Computational Linguistics (pp. 194-206). Springer.
Thakur, N., Reimers, N., Rücklé, A., Srivastava, A., & Gurevych, I. (2021). BEIR: A heterogeneous benchmark for zero-shot information retrieval evaluation. arXiv. https://arxiv.org/abs/2104.08663
Turney, P. D., & Pantel, P. (2010). From frequency to meaning: Vector space models of semantics. Journal of Artificial Intelligence Research, 37, 141-188.
Zhang, N., Yao, Y., Deng, S., Chen, X., Tan, C., Huang, M., et al. (2023). Document- level relation extraction: A survey. ACM Transactions on Intelligent Systems and Technology.
Zhuang, L., Wayne, L., Ya, S., & Jun, Z. (2021). A robustly optimized BERT pre- training approach with post-training. In Proceedings of the 20th Chinese National Conference on Computational Linguistics (pp. 1218-1227).