以下为《第2次课堂作业《商业数据分析工具》》的无排版文字预览,完整内容请下载
《商业数据分析工具》
第2次课堂作业要求
题目:计算河海、南大和南***院长致辞的关键词和相互之间的相似度。
作业要求与算法提示:
1、从本地文件读取院长致辞(文件的读取)。
2、计算每篇致辞的20个关键词。(用TF-IDF公式计算)
/
/
/
TF*IDF,从高到低,取前20名作为关键词。
3、三篇致辞计算相似度 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 、计算每个词的TF-IDF。
6、可以将词向量构造为numpy矩阵,利用numpy的对位运算,可以大大简化相似度的计算。
希望每一位同学都能够自己动手,尝试去编写上述计算过程,可以先用伪代码将流程和结构写出来,然后再编写实际代码并调试。
本次作业的截止时间:11点25分,发到我邮箱:
***39@qq.com
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《第2次课堂作业《商业数据分析工具》》的无排版文字预览,完整内容请下载
第2次课堂作业《商业数据分析工具》由用户“lidahui102”分享发布,转载请注明出处