新版搜索下载系统内测,不限量免费下载(免费至7月1日)(点击打开新版

基于聚类的协同过滤个性化推荐算法研究

资料来自用户(Matias)上传,若本站收录的文献无意侵犯了您的著作版权,请点击版权申明
导师姓名
张大斌
学科专业
管理科学与工程
文献出处
华中师范大学   2014年
关键词
推荐系统论文  协同过滤论文  聚类论文  用户特征论文  项目属性论文
论文摘要

随着信息技术和互联网的快速发展,信息资源成指数级别增长,面对严重过载的信息,用户很难快速定位到对自己有用的信息资源,从而耗费大量的时间搜寻自己想要的内容。这使得推荐系统应运而生,它能够根据不同用户的喜好来有针对性地为其提供个性化推荐服务。目前,在众多的个性化推荐技术中,协同过滤算法表现出其独有的优势,以致它被广泛的应用,特别在电子商务领域取得了相当大的成功,但是传统的协同过滤算法存在数据稀疏性、冷启动、实时性等问题,如果能有效的克服,不仅能够提高用户满意度,同时还提高销售利润。本文以推荐系统为基础,以推荐技术为主线,研究了个性化推荐系统,个性化推荐算法及相关技术,并进行比较分析;接着针对目前应用较好的协同过滤算法的问题,引入了项目属性和用户特征来构建项目属性矩阵和用户特征矩阵,提出基于用户相关相似性和基于项目相关相似性计算方法;另外,对聚类技术进行了相关研究,利用Kruskal算法对传统K-means聚类进行改进,实现自动确定初始聚类中心;最后对基于用户和项目方向的聚类进行了相关研究,提出将基于项目属性聚类的初始预测结合基于用户特征聚类的最终预测来做出推荐。主要在如下几个方面做了研究工作:第一,针对传统协同过滤算法过度依赖于用户—项目评分矩阵会面临严重的数据稀疏性问题、冷启动问题,本文将用户特征信息和项目属性信息有效利用,避免出现“相似而不相同”的现象的同时也克服了新项目和新用户问题,提出了分别基于项目属性和基于用户特征相关的相似性计算方法;第二,对传统K-means聚类进行了深入研究,针对其初始聚类中心人为随机选择敏感的问题,提出了一种能够自动生成相对比较均匀分布的K个初始聚类中心的改进聚类算法;第三,为有效的降低了协同过滤算法中近邻查询空间,同时在项目属性和用户特征矩阵上分别采用改进后的聚类算法进行聚类,明显能降低计算维度,提高推荐效率;第四,针对用户评分稀疏性问题,结合基于项目聚类的邻居查找结果和原始评分矩阵做基于项目的初始预测填充原始评分矩阵。其中,缺乏评分的新用户或新项目用本文前面改进的相关相似性计算方法代替传统评分相似性查找邻居,克服了冷启动问题;最后,将基于用户聚类的邻居查找结果结合填充完好的评分矩阵做基于用户的最终评分预测,使推荐精度较高。第五,为了验证本文提出的改进算法的有效性,在所选MovieLens数据集上分别将该改进的协同过滤算法与一些传统的协同过滤算法进行了分析和对比实验。实验结果表明该方法最终推荐质量优于其他传统推荐算法。

论文目录
关闭目录

摘要

Abstract

目录

1 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 个性化推荐的研究现状

1.2.2 协同过滤的研究现状

1.2.3 面临的主要问题和挑战

1.3 本文研究内容与结构安排

1.3.1 研究目的及内容

1.3.2 论文结构安排

2 个性化推荐系统及相关算法

2.1 个性化推荐系统

2.1.1 个性化推荐系统概述

2.1.2 个性化推荐系统分类

2.1.3 推荐系统的框架和工作流程

2.2 个性化推荐相关技术

2.2.1 信息检索和过滤技术

2.2.2 数据挖掘技术

2.3 个性化推荐算法及其比较

2.3.1 个性化推荐算法

2.3.2 个性化推荐算法的比较

2.4 本章小结

3 协同过滤推荐和K-MEANS聚类算法的研究

3.1 协同过滤推荐技术概述

3.1.1 协同过滤推荐技术描述

3.1.2 协同过滤推荐算法工作流程

3.2 协同过滤算法分类

3.2.1 基于内存推荐方法

3.2.2 基于模型的协同过滤

3.2.3 基于混合的协同过滤

3.3 协同过滤算法主要问题及对策

3.3.1 稀疏性问题

3.3.2 冷启动问题

3.3.3 扩展性问题

3.3.4 准确性问题

3.4 K-MEANS聚类算法

3.4.1 K-means聚类算法原理

3.4.2 K-means算法的优缺点

3.4.3 K-means算法现有改进方法

3.5 基于聚类的协同过滤推荐算法

3.5.1 基于用户聚类的协同过滤推荐算法

3.5.2 基于项目聚类的协同过滤推荐算法

3.6 本章小结

4 基于KRUSKAL改进聚类的协同过滤推荐算法

4.1 改进推荐算法出发点

4.2 改进的相似性计算方法

4.2.1 基于属性相关的项目相似性

4.2.2 基于特征相关的用户相似性

4.3 基于KRUSKAL算法改进的K-MEANS聚类算法

4.3.1 改进的K-Means聚类算法

4.3.2 改进的K-Means聚类算法设计

4.4 双向聚类预测

4.4.1 基于项目方向聚类的平滑预测

4.4.2 基于用户方向聚类的最终预测

4.5 预测推荐算法流程

4.6 本章小结

5 实验验证

5.1 实验环境和数据

5.1.1 实验环境

5.1.2 实验数据

5.2 实验评估标准

5.3 实验设计、结果与分析

5.4 本章小结

6 结论

6.1 总结

6.2 对未来工作的展望

参考文献

在校期间发表论文和科研成果

致谢

全文下载
全文下载