中文题名: | 基于HDFS的索引技术研究与实现 |
姓名: | |
学生类型: | 学士 |
学位名称: | 工学学士 |
学校: | 中国人民大学 |
院系: | |
专业: | |
第一导师姓名: | |
完成日期: | 2015 |
中文摘要: |
Hadoop是目前主流的分布式框架,适用于海量数据的存储与分析,然而其点查询的效率并不高。为此,Jens Dittrich教授提出了Hadoop++这一解决方案,Hadoop++是一种非侵入式的、基于HDFS的索引建立和使用的方法,它包括Trojan Index和Trojan Join两种通过提供合适的UDFs实现的优化。
本文研究探讨了Hadoop++文献中提出的建立和使用索引的方案,并在Hadoop平台和Presto平台上加以实现,对未使用索引与使用索引的数据进行了对比实验,以研究其中查询效率的差别。
﹀
|
开放日期: | 2016-03-21 |