GPDB基于Postgresql 8.2开发,通过psql命令行工具可以访问GPDB数据库的所有功能,另外支持JDBC、ODBC等访问方式,产品接口层只需要进行少量的适配即可使用GPDB提供服务。 GPDB支持基于资源队列的管理,可以为不同类型工作负载创建资源独立的队列,并且有效的控制用户的查询以避免系统超负荷运行。比如,可以为VIP用户,ETL生产,任性和adhoc等创建不同的资源队列。同时,支持优先级的设置,在并发争用资源时,高优先级队列的语句将可以获得比低优先级资源队列语句更多的资源。 最近在对GPDB做调研和测试,过程中用TPCH做性能的测试,通过和网络上其他服务的对比发现在5个节点的情况下已经有了很高的查询速度,但是由于测试环境服务器问题,具体的性能数据还要在接下来的新环境中得出,不过GPDB基于postgresql开发,天生支持丰富的统计函数,支持横向的线性扩展,内部容错机制,有很多功能强大的运维管理命令和代码,相比impala而言,显然在SQL的支持、实时性和稳定性上更胜一筹。 本文只是对Greenplum的初窥,接下来更深入的剖析以及在工作中的实践经验分享也请关注DA的wiki。更多的关于Greenplum基本的语法和特性,也可以参考PostgreSQL的官方文档。 本文参考:Pivotal Greenplum® Database 4.3.9.1 Documentation SDCC 2017?上海站将于2017年3月17-19日登陆申城,运维、数据库和架构三大技术峰会,汇聚国内知名互联网公司的CTO、架构师、技术总监等,均是一线的实践案例,不容错过的技术人充电时刻,5人以上团购立减1500元,报名点击阅读原文。 (责任编辑:本港台直播) |