- 无标题文档
查看论文信息

中文题名:

 基于HDFS的索引技术研究与实现    

姓名:

 张诗晨    

学生类型:

 学士    

学位名称:

 工学学士    

学校:

 中国人民大学    

院系:

 信息学院    

专业:

 计算机科学与技术    

第一导师姓名:

 陈晋川    

完成日期:

 2015    

中文摘要:
Hadoop是目前主流的分布式框架,适用于海量数据的存储与分析,然而其点查询的效率并不高。为此,Jens Dittrich教授提出了Hadoop++这一解决方案,Hadoop++是一种非侵入式的、基于HDFS的索引建立和使用的方法,它包括Trojan Index和Trojan Join两种通过提供合适的UDFs实现的优化。 本文研究探讨了Hadoop++文献中提出的建立和使用索引的方案,并在Hadoop平台和Presto平台上加以实现,对未使用索引与使用索引的数据进行了对比实验,以研究其中查询效率的差别。
开放日期:

 2016-03-21    

无标题文档

   建议浏览器: 谷歌 火狐 360请用极速模式,双核浏览器请用极速模式