转:SQL 查询的分布式执行与调度
OLAP 是大数据分析应用非常重要的组成部分。这篇文章是介绍 OLAP 任务在并发/分布式环境下执行和调度的算法和模型的。我们将从最简单的 Volcano 模型开始讲起,逐步引出分布式环境下执行 OLAP 查询操作的一些挑战和经典的解决方案。
DuckDB—用于分析的 SQLite
DuckDB 是一个非常有趣的项目,旨在成为一个专注于 OLAP(在线分析处理)的 SQLite 风格的数据库。OLAP 通常与分析相关联,因为它的设计适合对大型数据集的长时间运行查询或对具有大量数据的多个表的连接进行聚合。