以下为《外专大作业 《Big Data Analytics and Social Media》》的无排版文字预览,完整内容请下载
郑州轻工业大学
《Big Data Analytics and Social Media》
实验报告
实验名称:
Big Data Analytics and Social Media
学生姓名:
闫震
专业班级:
IEC数据科学1908
学 期:
2021-2022(二)
指导老师:
Bela Stantic,陈某某,马某某
日 期:
2022年6月11日
成 绩:
首先,导入需要的包,以及数据源
/
数据探索
从Twitter上收集艺人/乐队的数据,从可用数据集列表中,列出对艺人/乐队最有影响力的5个用户。
/
最有影响的5个用户为:billboard updatearianabr BestArianaPics_ grandeupdte updtgagabr,使用sort()函数,进行一个影响力的基本降序排序
1.2)列出与你的艺人/乐队相关的关键字一起出现的最重要的10个术语。
解释结果。
/
这十个术语分别为 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 e(),betweenness(),closeness()既得
机器学习模型
2.2)使用情绪和情绪分析来确定公众对与你的艺术家/乐队相关的事件和/或话题的反应。
提供公众意见(情绪、反应)的摘要。
/
/
根据text文本信息,得到文本表达的情绪反应,并统计出不同情绪占比
/
2.3)使用k-means聚类对用户的好友(关注者)和关注者进行分类。
你必须确定一个与你的艺人/乐队相关的有影响力的用户。
解释为什么他/她是一个有影响力的用户。
解释结果。
/
/
/
如图,横轴与纵轴表示了不同歌手或乐队的friends和 followers,不同的颜色表示不同的分组,由图可知,4组的friends和followers数都是最高的,2组的friends和followers数都是最低的
2.4)使用LDA主题建模来识别一些与你的艺术家/乐队密切相关的术语。
找出至少3组对你的分析有意义的词。
解释你的发现。
/
/
3.1)在Gephi中可视化你的Twitter参与者和语义网络,节点大小由该节点的连接数决定。
你能从可视化中提取出什么见解?
/
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《外专大作业 《Big Data Analytics and Social Media》》的无排版文字预览,完整内容请下载
外专大作业 《Big Data Analytics and Social Media》由用户“zzbzzb3732”分享发布,转载请注明出处