Learn practical skills, build real-world projects, and advance your career
5 years ago

基于邻域的算法是推荐系统中最基本的算法,该算法不仅在学术界得到了深入研究,而且在业界得到了广泛应用。

基于邻域的算法分为两大类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法

import csv
import pandas as pd
import random
import numpy as np
import math
import operator
a = set([1,2,3])
b = set([2,3,4])
a & b   # 交集
{2, 3}

M次实验,每次实验选取不同的 k ( 0 ≤ k ≤ M  1 )和相同的随机数种子 seed ,进行 M 次实验就可以得到 M 个不同的训练集和测试集,然后分别进行实验,用 M 次实验的平均值作为最后的评测指标