中文题名: | 基于深度学习的网络新闻热度预测研究 |
姓名: | |
学生类型: | 学士 |
学位名称: | 理学学士 |
学校: | 中国人民大学 |
院系: | |
专业: | |
第一导师姓名: | |
完成日期: | 2015 |
中文关键词: | |
中文摘要: |
本文针对网络新闻的热度预测问题,提出了一种基于深度学习和随机森林分类器的模型。该模型利用以深度学习为基础的word2vec实现对新闻标题的向量化表示,旨在将非结构化的文本数据转换为计算机可以处理的结构化数值数据。利用随机森林分类器拟合标题向量与新闻热度的关系,最终实现新闻热度的预测。本文讨论了该模型的定义和原理,并通过试错法确定了模型的重要参数。实证研究中,本文利用爬取的新闻数据完成模型训练,针对词语用法对新闻热度的影响以及不同领域新闻的热度结构这两方面问题进行了分析。
﹀
|
开放日期: | 2016-03-21 |