Presto------分布式SQL查询引擎
Presto是一个开源的分布式SQL查询引擎,主要用于快速,交互式地查询大型数据集。Presto可以处理不同种类的数据源,包括Hive,Cassandra,关系数据库等。
以下是一个简单的Presto查询示例,假设我们有一个名为example
的Hive表,它有两列:id
和name
。
-- 连接到Presto CLI
presto --server localhost:8080
-- 执行一个简单的查询
SELECT * FROM example LIMIT 10;
在这个例子中,我们使用Presto CLI连接到运行在localhost
的8080端口的Presto服务器,然后执行一个查询来从example
表中选择前10行数据。
如果你需要进行更复杂的查询,比如连接多个数据源或者使用特定的函数,Presto同样可以处理。
-- 连接多个数据源
SELECT * FROM hive.default.example e
JOIN cassandra.keyspace.table c ON e.id = c.id;
-- 使用特定的函数
SELECT count(DISTINCT id), lower(name) FROM example WHERE id > 100;
在这个例子中,我们展示了如何使用Presto来连接Hive和Cassandra数据源,并且执行了一个包含内连接和外部查询的复杂查询。
评论已关闭