- 无标题文档
查看论文信息

中文题名:

 网络新闻热点识别与追踪方法的研究与实现    

姓名:

 曾连宇    

学生类型:

 学士    

学位名称:

 工学学士    

学校:

 中国人民大学    

院系:

 信息学院    

专业:

 计算机科学与技术    

第一导师姓名:

 杨小平    

完成日期:

 2015    

中文关键词:

 中文分词 话题识别 统计学    

中文摘要:
互联网的发展,极大的促进了信息的传播。在信息的传播中,传播方式的改变尤为重要,其中网络媒体已经成为人们日常生活中必不可少的一个获取信息的环节。人们在面对这一媒体工具时,感受到了和之前的媒体不一样的感受,同时也产生了一些问题。由于信息的爆炸式增长,以及大量新颖的词语的出现,对于人们获取信息造成了一定的影响,所以,如何分辨出每一个新闻报道中,更适用于它的新颖的词语,以及通过自动的算法为人们总结一个类别的新闻,这个研究方向是很有意义的。 本文在已有的技术基础上,结合所学过的统计学的知识,将互信息的理念与TF-IDF的思想有机的结合在了一起,通过这两个方法的组合,试图去分解新闻报道中产生的,数据库字典中并不存在的词语,并将这些词语,根据其对于新闻的重要性排序后,以关键词的形式展现给人们。同时利用向量空间的相关思想,对处理后的新闻数据集合进行归类划分,方便人们查看他们感兴趣的话题。
开放日期:

 2016-03-21    

无标题文档

   建议浏览器: 谷歌 火狐 360请用极速模式,双核浏览器请用极速模式