Trong trích xuất quan hệ (NLP), sự khác biệt giữa trích xuất quan hệ được giám sát, bán giám sát và không giám sát là gì?


Câu trả lời 1:

Trong học tập có giám sát, có một bộ dữ liệu lớn có mọi thứ mà người học có thể cần. Nó có tài liệu cùng với tất cả các mối quan hệ giữa các từ và văn bản bạn muốn. Người học cần học cách thực hiện nhiệm vụ này trên các tài liệu chưa xem.

Trong học tập bán giám sát, bạn có một bộ tài liệu lớn và đối với một tập hợp con nhỏ hơn trong số này, bạn có tất cả dữ liệu.

Trong học tập không giám sát, người học chỉ có tài liệu. Nó có thể tìm kiếm các mẫu thú vị làm nền tảng cho dữ liệu. Những mẫu này có thể có ý nghĩa, nhưng chúng cũng có thể là các tạo tác ngẫu nhiên. Khi có đủ dữ liệu, việc xác định các mẫu có ý nghĩa sẽ dễ dàng hơn. Tuy nhiên, nếu không có người giám sát nhìn vào các mẫu, thuật toán sẽ không thể đưa ra bất kỳ ý nghĩa nào cho nó. Ví dụ: có thể thấy rằng các từ 'tổng thống', 'Obama' và 'Barack' thường xảy ra hoặc xảy ra trong các tình huống thường được tìm thấy (một chỉ báo cho thấy chúng có thể là từ đồng nghĩa). Nói chung, nó không thể tìm thấy rằng điều này mô tả một người.