LATIHAN - metode JACCARD

1. Jika diketahui A={1,2,3,4}, B={1,2,4}, dan C={1,2,4,5}, berapakah Jaccard (A,B), Jaccard(B,C), dan Jaccard(A,C)?

     

2. Berikutnya untuk kasus query dan document. Misalnya kita punya:

query: ideas of march

doc1: caesar died in march

doc2: the long march

Cari Koefisien Jaccard antara query dengan doc1 dan doc2.



 






    3. Diketahui 3 dokumen :

d1: “Jack London traveled to Oakland”

d2: “Jack London traveled to the city of Oakland”

d3: “Jack traveled from Oakland to London”

Nilai dari Koefisian Jaccard J(d1, d2) dan J(d1, d3) jika dilakukan dengan n-gram analisis dengan n=2 (bigram) adalah:




Komentar

Postingan Populer