大数据培训技术模型的求解 —损失函数

发布时间:2022年01月05日作者:atguigu浏览次数:376

模型的求解 —— 损失函数

  • 现在的问题是,怎样得到这样的分解方式 R̂=P×Q 呢?
  • 矩阵分解得到的预测评分矩阵 R̂,与原评分矩阵 R 在已知的评分项上可能会有误差,我们的目标是找到一个最好的分解方式,让分解之后的预测评分矩阵总误差最小

损失函数

  • 我们选择平方损失函数,并且加入正则化项,以防过拟合

大数据培训技术模型的求解 —损失函数

  • 其中λ∑1_u▒〖||P_u ||〗^2 +λ∑1_i▒〖||Q_i ||〗^2 是正则化项,λ 一般通过交叉验证得到

模型的求解算法 —— ALS

  • 现在,矩阵因子分解的问题已经转化成了一个标准的优化问题,需要求解 P、Q,使目标损失函数取最小值
  • 最小化过程的求解,一般采用随机梯度下降算法或者交替最小二乘法来实现

交替最小二乘法(Alternating Least Squares,ALS)

  • ALS的思想是,由于两个矩阵P和Q都未知,且通过矩阵乘法耦合在一起,为了使它们解耦,可以先固定Q,把P当作变量,通过损失函数最小化求出P,这就是一个经典的最小二乘问题;再反过来固定求得的P,把Q当作变量,求解出Q:如此交替执行,直到误差满足阈值条件,或者到达迭代上限

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。


上一篇:
下一篇:
相关课程

java培训 大数据培训 前端培训

关于尚硅谷
教育理念
名师团队
学员心声
资源下载
视频下载
资料下载
工具下载
加入我们
招聘岗位
岗位介绍
招贤纳师
联系我们
全国统一咨询电话:010-56253825
地址:北京市昌平区宏福科技园2号楼3层(北京校区)

深圳市宝安区西部硅谷大厦B座C区一层(深圳校区)

上海市松江区谷阳北路166号大江商厦3层(上海校区)

武汉市东湖高新开发区东湖网谷(武汉校区)

西安市雁塔区和发智能大厦B座3层(西安校区)

成都市成华区北辰星拱青创园综合楼3层(成都校区)