Trích xuất thuật ngữ

Trích xuất thuật ngữ (tiếng Anh: terminology extraction) là một tác vụ con của trích xuất thông tin (information extraction). Mục đích của trích xuất thuật ngữ là tự động trích xuất các thuật ngữ tương đương từ một ngữ liệu đã cho.[1]

Trong kỷ nguyên mạng ngữ nghĩa, ngày càng nhiều cộng đồng và các doanh nghiệp có kết nối mạng bắt đầu truy cập và tương tác với nhau thông qua Internet. Việc mô hình hóa các cộng đồng này và nhu cầu thông tin tương ứng là quan trọng đối với một số ứng dụng web, như các web crawler theo chủ đề,[2] dịch vụ web,[3] hệ thống gợi ý,[4]... Sự phát triển của trích xuất thuật ngữ cũng rất cần thiết đối với ngành công nghiệp ngôn ngữ.

Xem thêm

Tham khảo

  1. ^ Alrehamy, Hassan H; Walker, Coral (2018). “SemCluster: Unsupervised Automatic Keyphrase Extraction Using Affinity Propagation”. Advances in Computational Intelligence Systems. Advances in Intelligent Systems and Computing. 650. tr. 222–235. doi:10.1007/978-3-319-66939-7_19. ISBN 978-3-319-66938-0.
  2. ^ Menczer F., Pant G. and Srinivasan P. Topic-Driven Crawlers: machine learning issues.
  3. ^ Fan J. and Kambhampati S. A Snapshot of Public Web Services, in ACM SIGMOD Record archive Volume 34, Issue 1 (March 2005).
  4. ^ Yan Zheng Wei, Luc Moreau, Nicholas R. Jennings. A market-based approach to recommender systems, in ACM Transactions on Information Systems (TOIS), 23(3), 2005.
  • x
  • t
  • s
Thuật ngữ chung
Khai thác văn bản
Tóm tắt tự động
Dịch tự động
Nhận dạng tự động
và thu thập dữ liệu
Mô hình chủ đề
Xem xét với
sự trợ giúp máy tính
Giao diện người dùng
ngôn ngữ tự nhiên
Bài viết này vẫn còn sơ khai. Bạn có thể giúp Wikipedia mở rộng nội dung để bài được hoàn chỉnh hơn.
  • x
  • t
  • s