Presto 是什么?
Presto™ (PrestoDB™) is an open source distributed SQL query engine for running interactive analytic queries against data sources of all sizes ranging from gigabytes to petabytes.
Presto™ (PrestoSQL™, a.k.a. Trino™) is a high performance, distributed SQL query engine for big data.
下文将详细介绍二者的区别
基本概念
组件
Coordinator
负责管理 Worker 和 MetaStore 节点,以及接受客户端查询请求,并进行 SQL 的语法解析(Parser)、执行计划生成与优化(Planner)和查询任务的调度(Scheduler)
Coordinator 通过 RESTful 接口与 Client 和 Worker 交互
Worker
负责具体的查询计算和数据读写
Discovery Server
负责发现集群的各个节点,用于节点间心跳监控
一般 Discovery Server 混布在 Coordinator 节点上,也支持单独部署