Aapche Drill:一款分布式查询引擎
Aapche Drill 是什么?
Apache Drill™ is a distributed MPP query layer that supports SQL and alternative query languages against NoSQL and Hadoop data storage systems. It was inspired in part by Google’s Dremel.
优缺点
优势
- 支持自定义的嵌套数据结构
- 兼容 Hive(包括 Hive 的 UDF,且支持自定义 UDF)
- 高性能、低延迟的 SQL 查询
- 支持多数据源(插件化,包括 Apache Kafka、Apache HBase、Apache Hive、OpenTSDB、S3 等)
UDF(User Defined Funcation):用户定义普通函数,只作用于单行记录
UDAF(User Defined Aggregation Funcation):用户定义聚合函数,只作用于多行记录
UDTF(User Defined Table Generating Funcation):用户定义表生成函数,可以输入一行记录输出多行记录
劣势
- 与标准 SQL 略有不同
- 外部依赖较多(基于 Apache ZooKeeper 实现分布式、基于 Apache Calcite 实现 SQL 解析)
- 比较小众,相关资料缺乏