中文题名: | 网络新闻热点识别与追踪方法的研究与实现 |
姓名: | |
学生类型: | 学士 |
学位名称: | 工学学士 |
学校: | 中国人民大学 |
院系: | |
专业: | |
第一导师姓名: | |
完成日期: | 2015 |
中文关键词: | |
中文摘要: |
互联网的发展,极大的促进了信息的传播。在信息的传播中,传播方式的改变尤为重要,其中网络媒体已经成为人们日常生活中必不可少的一个获取信息的环节。人们在面对这一媒体工具时,感受到了和之前的媒体不一样的感受,同时也产生了一些问题。由于信息的爆炸式增长,以及大量新颖的词语的出现,对于人们获取信息造成了一定的影响,所以,如何分辨出每一个新闻报道中,更适用于它的新颖的词语,以及通过自动的算法为人们总结一个类别的新闻,这个研究方向是很有意义的。
本文在已有的技术基础上,结合所学过的统计学的知识,将互信息的理念与TF-IDF的思想有机的结合在了一起,通过这两个方法的组合,试图去分解新闻报道中产生的,数据库字典中并不存在的词语,并将这些词语,根据其对于新闻的重要性排序后,以关键词的形式展现给人们。同时利用向量空间的相关思想,对处理后的新闻数据集合进行归类划分,方便人们查看他们感兴趣的话题。
﹀
|
开放日期: | 2016-03-21 |