以下为《数据预处理总结》的无排版文字预览,完整内容请下载
数据预处理:
电影聚类:
利用LDA主题模型对movies.csv文件进行处理,得到文件形式如图1 LDA movie.csv所示。然后对其进行聚类得到movies_0.c 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 csv将电影的七维特征直接放到对应评分电影的ID后面。如图1所示:
图1 用户聚类文件生成过程
然后根据电影七维特征对用户进行聚类,具有12个类。
用户画像的构建
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《数据预处理总结》的无排版文字预览,完整内容请下载
数据预处理总结由用户“bz2007best”分享发布,转载请注明出处