模型的求解 —— 损失函数
- 现在的问题是,怎样得到这样的分解方式 R̂=P×Q 呢?
- 矩阵分解得到的预测评分矩阵 R̂,与原评分矩阵 R 在已知的评分项上可能会有误差,我们的目标是找到一个最好的分解方式,让分解之后的预测评分矩阵总误差最小
损失函数
- 我们选择平方损失函数,并且加入正则化项,以防过拟合
- 其中λ∑1_u▒〖||P_u ||〗^2 +λ∑1_i▒〖||Q_i ||〗^2 是正则化项,λ 一般通过交叉验证得到
模型的求解算法 —— ALS
- 现在,矩阵因子分解的问题已经转化成了一个标准的优化问题,需要求解 P、Q,使目标损失函数取最小值
- 最小化过程的求解,一般采用随机梯度下降算法或者交替最小二乘法来实现
交替最小二乘法(Alternating Least Squares,ALS)
- ALS的思想是,由于两个矩阵P和Q都未知,且通过矩阵乘法耦合在一起,为了使它们解耦,可以先固定Q,把P当作变量,通过损失函数最小化求出P,这就是一个经典的最小二乘问题;再反过来固定求得的P,把Q当作变量,求解出Q:如此交替执行,直到误差满足阈值条件,或者到达迭代上限
想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。
上一篇: 大数据培训技术LFM 的进一步理解
下一篇: 大数据培训技术ALS 算法