Recommender system

Đề thi kiểm tra lập trình Python căn bản

Thời gian 75 phút

Recommender System

Cho tập dữ liệu MoviesHistory.txt
UserId MovieId Rating
1 1 1
1 2 3
1 3 4
1 5 5
2 1 2
2 2 4
2 4 1
3 2 3
3 3 2
3 4 4
3 5 1
4 1 1
4 2 3
4 3 4
4 5 1

Viết chương trình làm theo từng bước sau:

Từ tập dữ liệu tạo ma trận (A) như sau

MovieId
12345
UserId113405
224010
303241
413401

Từ ma trận (A) tạo ma trận hệ số (B)

MovieId
12345
MovieId133212
234323
323313
412121
523313

Tìm vector (V) bằng cách tính tổng trên dòng hoặc trên cột từ ma trận (B)

12345
111512712

Tìm ma trận (C) = (A) * (B)

MovieId
12345
UserId13042381638
21924171217
31929221722
42230261226

Chuẩn hoá ma trận (C) bằng cách lấy (C) / (V)

MovieId
12345
UserId12.7272.8003.1672.2863.167
21.7271.6001.4171.7141.417
31.7271.9331.8332.4291.833
42.0002.0002.1671.7142.167

Nộp bài

gửi bài qua email refactortop@gmail.com