Natural Language Toolkit
Giao diện
Thiết kế bởi | Steven Bird, Edward Loper, Ewan Klein |
---|---|
Phát triển bởi | Nhóm NLTK |
Phát hành lần đầu | 2001[1] |
Phiên bản ổn định | 3.5
/ 13 tháng 4 năm 2020[2] |
Kho mã nguồn | |
Viết bằng | Python (ngôn ngữ lập trình) |
Thể loại | Xử lý ngôn ngữ tự nhiên |
Giấy phép | Giấy phép Apache[3] |
Website | www |
Natural Language Toolkit (tạm dịch là Bộ công cụ Ngôn ngữ Tự nhiên, hay viết tắt là NLTK) là một bộ thư viện và chương trình dành cho xử lý ngôn ngữ tự nhiên (NLP) thống kê và biểu tượng tiếng Anh, được xây dựng bằng ngôn ngữ Python. Steven Bird and Edward Loper là hai tác giả phát triển NLTK tại Khoa Khoa học Thông tin và Máy tính, đại học Pennsylvania.[4] NLTK bao gồm các minh họa đồ họa và dữ liệu mẫu, đi kèm một cuốn sách chứa các giải thích về khái niệm cơ bản đằng sau các tác vụ xử lý ngôn ngữ được hỗ trợ bởi bộ công cụ,[5] và một cuốn sách hướng dẫn.[6]
Thư viện nổi bật
[sửa | sửa mã nguồn]- Phân tích từ vựng: token hóa văn bản và từ chữ
- N-gram và cách kết hợp từ
- Gán nhãn từ loại (part-of-speech tagging)
- Mô hình câu và phân tích cú pháp nông (shallow parsing) văn bản
- Nhận dạng thực thể có tên
Xem thêm
[sửa | sửa mã nguồn]Tham khảo
[sửa | sửa mã nguồn]- ^ “Project site on SourceForge”. ngày 9 tháng 7 năm 2001.
- ^ “NLTK ChangeLog”. nltk.org. Truy cập ngày 13 tháng 4 năm 2020.
- ^ “NLTK License”. NLTK Project. Truy cập ngày 14 tháng 2 năm 2015.
- ^ “Preface”. www.nltk.org. Truy cập ngày 15 tháng 6 năm 2016.
- ^ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). “Multidisciplinary instruction with the Natural Language Toolkit” (PDF). Proceedings of the Third Workshop on Issues in Teaching Computational Linguistics, ACL. Bản gốc (PDF) lưu trữ ngày 2 tháng 9 năm 2011. Chú thích journal cần
|journal=
(trợ giúp) - ^ Perkins, Jacob (2010). Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing. ISBN 978-1849513609.