本篇内容介绍了“Presto有哪些特征”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
Presto 旨在与现有数据生态系统无缝集成,无需对正在进行的系统进行任何修改。这就像使用额外的更快的数据访问接口为您现有的堆栈增压。
Presto 提供额外的计算层以加快分析速度。它不存储数据,这使它具有能够根据需求向上和向下扩展查询资源的巨大优势。
这种计算和存储分离使 Presto 查询引擎非常适合云环境。大多数云部署利用对象存储,它已经从计算层中分离出来,并自动扩展以优化资源成本。
SQL 是迄今为止最古老、使用最广泛的数据分析语言。分析师、数据工程师和数据科学家使用 SQL 来探索数据、构建仪表板并通过 Jupyter 和 Zeppelin 等笔记本或 Tableau、PowerBI 和 Looker 等 BI 工具来测试假设。
Presto 是一个联合查询引擎,它不仅能够从分布式文件系统中查询数据,还能够从其他来源查询数据,例如 Cassandra、Elasticsearch 和 RDBMS 等 NoSQL 存储,甚至是 Kafka 等消息队列。
Facebook 团队开发 Presto 是因为 Apache Hive 不适合交互式查询。Hive 的下划线架构通过执行多个 MapReduce 和 Tez 作业来执行查询,非常适合大型复杂作业,但不适用于低延迟查询。Hive 项目最近使用 Hive LLAP 引入了内存缓存;然而,它适用于某些类型的查询,但它也使 Hive 更加资源密集。
同样,Apache Spark 非常适合使用内存计算的大型复杂作业。但是,它不如 Presto 交互式 BI 查询有效。
Presto 专为高性能而打造,具有多项关键功能和优化,例如代码生成、内存中处理和流水线执行。Presto 查询在工作节点上共享一个长期存在的 Java 虚拟机 (JVM) 进程,从而避免了产生新 JVM 容器的开销。
Presto 提供了一个统一的 SQL 方言,可以抽象出所有支持的数据源。这是一项强大的功能,用户无需了解底层系统的连接和 SQL 方言。
Presto 将存储和计算分开运行的基本设计使其在云环境中操作极其方便。由于 Presto 集群不存储任何数据,因此可以根据负载自动扩展,而不会造成任何数据丢失。
如您所见,Presto 为交互式即席查询提供了许多优势。难怪数据平台团队越来越多地使用 Presto 作为事实上的 SQL 查询引擎,在不需要移动数据的情况下跨数据源运行分析。
“Presto有哪些特征”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。