From cd9091a8202588c1587d9525b14732199a3848f6 Mon Sep 17 00:00:00 2001 From: Yao544303 Date: Thu, 20 Sep 2018 13:38:05 +0800 Subject: [PATCH] update readme --- README.md | 46 +++++++++++++++++++++++++++++++++++++++++----- 1 file changed, 41 insertions(+), 5 deletions(-) diff --git a/README.md b/README.md index 0c3f9f6..ace2c62 100644 --- a/README.md +++ b/README.md @@ -1,9 +1,45 @@ -# Spark 推荐系统 +# 项目介绍 +项亮的[《推荐系统实践》](https://book.douban.com/subject/10769749/)堪称是推荐系统的经典书籍。 +但因其成书时间较早,当时大数据相关技术并未如当下一样流行,故而书中使用的demo 代码,并不具备在大规模数据集上运行的条件。 +于是萌生了使用Spark,实现相关内容的念头。 + +# 目录规划 +data 测试用数据集合 +standalone 相关实践的单机实现版本(主要为python实现) +spark 相关实践的spark版本(主要为scala实现) + +# 推荐算法实现(计划) +## 基于用户行为数据的 +ItemCF +UserCF +关联规则 +LFM +Graph +ALS + +## 利用用户标签数据 +LDA +TFIDF +TagCF + +## 探索性研究(各个paper的实现) +Markov Chain +社交网络 +.... + +# 推荐系统架构实现 +## 外围架构 +### 用户行为日志存储系统 +### 日志系统 +### UI + +## 功能模块 +### 数据录入模块 +### 用户特征生成模块 +### 推荐模块 +### 过滤模块 +### 排名模块 -## 离线 -## 实时 -## 总结 -## 算法 -- GitLab