Gán nhãn từ loại

Trong ngôn ngữ học ngữ liệu (corpus linguistics), gán nhãn từ loại (tiếng Anh: part-of-speech tagging, hay POS tagging, PoS tagging, POST, gán nhãn ngữ pháp) là qua trình đánh dấu một từ trong văn bản (ngữ liệu) tương ứng với một từ loại nào đó,[1] dựa theo định nghĩa và bối cảnh văn phạm của từ đó. Một hình thức đơn giản hóa của gán nhãn từ loại thường được dạy cho trẻ em ở độ tuổi đi học, đó là xác định các từ loại như danh từ, động từ, tính từ, trạng từ, vân vân.

Xem thêm

  • Semantic network
  • Nhập nhằng (xử lý ngôn ngữ tự nhiên)

Tham khảo

  1. ^ “POS tags”. Sketch Engine. Lexical Computing. ngày 27 tháng 3 năm 2018. Truy cập ngày 6 tháng 4 năm 2018.

Đọc thêm

  • Charniak, Eugene. 1997. "Statistical Techniques for Natural Language Parsing". AI Magazine 18(4):33–44.
  • Hans van Halteren, Jakub Zavrel, Walter Daelemans. 2001. Improving Accuracy in NLP Through Combination of Machine Learning Systems. Computational Linguistics. 27(2): 199–229. PDF
  • DeRose, Steven J. 1990. "Stochastic Methods for Resolution of Grammatical Category Ambiguity in Inflected and Uninflected Languages." Ph.D. Dissertation. Providence, RI: Brown University Department of Cognitive and Linguistic Sciences. Electronic Edition available at [1] Lưu trữ 2018-08-19 tại Wayback Machine
  • D.Q. Nguyen, D.Q. Nguyen, D.D. Pham and S.B. Pham (2016). "A Robust Transformation-Based Learning Approach Using Ripple Down Rules for Part-Of-Speech Tagging." AI Communications, vol. 29, no. 3, pages 409-422. [.pdf]
  • x
  • t
  • s
Thuật ngữ chung
Khai thác văn bản
Tóm tắt tự động
Dịch tự động
Nhận dạng tự động
và thu thập dữ liệu
Mô hình chủ đề
Xem xét với
sự trợ giúp máy tính
Giao diện người dùng
ngôn ngữ tự nhiên
Bài viết này vẫn còn sơ khai. Bạn có thể giúp Wikipedia mở rộng nội dung để bài được hoàn chỉnh hơn.
  • x
  • t
  • s