今天(2019年3月20日),所有關(guān)注開(kāi)源大數(shù)據(jù)平臺(tái)Greenplum的用戶(hù)和開(kāi)發(fā)人員都會(huì)發(fā)現(xiàn):Greenplum的github代碼庫(kù)里面出現(xiàn)了一個(gè)新的分支–“6X_STABLE”。這標(biāo)志著Greenplum大數(shù)據(jù)平臺(tái)進(jìn)入了6.0的時(shí)代。


這是繼2017年9月 Greenplum 發(fā)布5.0版以來(lái),Greenplum 的又一次大版本升級(jí)。此次新版本更新了17125的文件,代碼和相關(guān)測(cè)試修改量更是達(dá)到了200余萬(wàn)行(git diff –stat 5X_STABLE…6X_STABLE)。 Greenplum 新版本在功能和性能上都實(shí)現(xiàn)大幅度的提升,大量測(cè)試自動(dòng)運(yùn)行保證產(chǎn)品質(zhì)量,可以更好的幫助客戶(hù)在公有云或私有云中進(jìn)行出色的集成數(shù)據(jù)分析,使客戶(hù)得以快速構(gòu)建現(xiàn)代的、基于云的AI(人工智能)應(yīng)用。
Greenplum 6.0重要特性:
1. 內(nèi)核升級(jí)
Greenplum 6.0的內(nèi)核升級(jí)到PostgreSQL 9.4.20,與Greenplum 5.x的內(nèi)核(PostgreSQL 8.3)相比,內(nèi)核版本提升了6個(gè)大的版本,集成了來(lái)自于PostgreSQL社區(qū)的約14000次代碼提交,大量PostgreSQL新特性被移植到Greenplum 6.0中,包括:
1.JSONB
2.安全性、權(quán)限管理增強(qiáng)
3. Lateral 語(yǔ)法(部分支持)
4.Range數(shù)據(jù)類(lèi)型
5.GIN索引、SP-GiST索引
6.并行Vacuum
7.FDW外部表
8.邏輯解碼
9.CTE (Common Table Expression)
等等
2. HTAP (OLAP + OLTP)性能大幅提升
Greenplum 6.0 引入了新的全局死鎖檢查機(jī)制,新的機(jī)制會(huì)動(dòng)態(tài)的收集和分析鎖的信息來(lái)檢查和解除全局死鎖?;诖?,HEAP表的更新修改操作可以只借助細(xì)粒度行鎖完成,支持大并發(fā)的更改刪除查詢(xún),從而提高整個(gè)系統(tǒng)的并發(fā)度和吞吐量。Greenplum 6.0 還對(duì)事務(wù)鎖進(jìn)行了優(yōu)化,減少了開(kāi)始事務(wù)和結(jié)束事務(wù)時(shí)的鎖競(jìng)爭(zhēng)。對(duì)分區(qū)表的插入操作的優(yōu)化,減少了對(duì)其他分區(qū)的干擾。結(jié)合PostgreSQL合并帶來(lái)的其他鎖優(yōu)化(例如fastpath),Greenplum 6.0的并發(fā)性得到顯著改進(jìn),OLTP型和混合負(fù)載業(yè)務(wù)尤其受益。
3. 支持復(fù)制表(Replicated Table)
復(fù)制表(Replicated Table)是Greenplum 6.0支持的一個(gè)新的表類(lèi)型。與普通表不同,復(fù)制表會(huì)在每個(gè)segment節(jié)點(diǎn)保存一份全量數(shù)據(jù),這樣當(dāng)一個(gè)復(fù)制表和其他表關(guān)聯(lián)時(shí),將完全不需要segment節(jié)點(diǎn)間的數(shù)據(jù)移動(dòng),快速本地完成查詢(xún)。
4. 在線擴(kuò)容(Online expand)和一致性哈希(Jump Consistent Hash)
在Greenplum 6.0之前,擴(kuò)容節(jié)點(diǎn)需要短暫停機(jī)并將哈希表改為隨機(jī)表,在6.0中,這兩個(gè)約束都被消除,集群可以持續(xù)在線擴(kuò)容。一致性哈希的引入,可以極大減少節(jié)點(diǎn)間的數(shù)據(jù)移動(dòng),降低擴(kuò)容期間網(wǎng)絡(luò)IO和整個(gè)系統(tǒng)的負(fù)載。
5. 磁盤(pán)配額(Disk Quota)
磁盤(pán)額度(Disk Quota)支持在數(shù)據(jù)庫(kù)的User和Schema級(jí)別設(shè)置磁盤(pán)額度,可以極大的提高對(duì)磁盤(pán)管理的能力和靈活性。本特性將包括在 GA 版本中。
6. 支持Zstandard壓縮算法
Greenplum 6.0添加了對(duì)Zstandard壓縮算法的支持,壓縮比和性能更突出,CPU使用率大幅降低。
7. 靈活數(shù)據(jù)分布
允許用戶(hù)自定義operator class,并在創(chuàng)建表時(shí)給分布列指定operator class, 借助這些功能擴(kuò)展,用戶(hù)可以靈活的控制數(shù)據(jù)分布。
8. 基于流復(fù)制的全新高可用機(jī)制
Greenplum 6.0 重新設(shè)計(jì)了高可用機(jī)制,新機(jī)制不再使用傳統(tǒng)的基于文件IO的 filerep 技術(shù),而是采用了 PostgreSQL 內(nèi)建的日志流復(fù)制技術(shù)。這不僅大大提高了 Greenplum 的高可用能力,降低了和 PostgreSQL 代碼的分歧程度,提高了代碼的可維護(hù)性,更是為期待的重量級(jí)特性鋪平了道路,譬如CDC和DR。
Greenplum 數(shù)據(jù)庫(kù)相關(guān)產(chǎn)品如備份恢復(fù)、機(jī)器學(xué)習(xí)算法庫(kù) MADLib、文本分析產(chǎn)品GPText(閉源)、監(jiān)控管理平臺(tái)GPCC(閉源)、Greenplum-Kafka 連接器(閉源)、Hadoop 連接器PXF、Greenplum for Kubernetes (閉源)等也有大量新特性更新。
Greenplum社區(qū)將用更多博文詳細(xì)介紹6.0的更多技術(shù)細(xì)節(jié)和應(yīng)用案例,歡迎大家的持續(xù)關(guān)注!
Greenplum大數(shù)據(jù)平臺(tái)簡(jiǎn)介
Greenplum 大數(shù)據(jù)平臺(tái)基于MPP(大規(guī)模并行處理)架構(gòu),具有良好的彈性和線性擴(kuò)展能力,內(nèi)置并行存儲(chǔ)、并行通訊、并行計(jì)算和優(yōu)化技術(shù),兼容 SQL 標(biāo)準(zhǔn),具備強(qiáng)大、高效、安全的PB級(jí)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)、處理和實(shí)時(shí)分析能力,同時(shí)支持涵蓋OLTP型業(yè)務(wù)的混合負(fù)載,為客戶(hù)打通業(yè)務(wù)-數(shù)據(jù)-洞見(jiàn)-業(yè)務(wù)的閉環(huán),可部署于企業(yè)裸機(jī)、容器、私有云和公有云中,支撐著全球金融、證券、電信、政府、制造、交通運(yùn)輸?shù)雀餍袠I(yè)的大量核心生產(chǎn)系統(tǒng)。
Greenplum 大數(shù)據(jù)平臺(tái)為全球各行各業(yè)提供具備實(shí)時(shí)處理、彈性擴(kuò)容、彈性計(jì)算、混合負(fù)載、云原生和集成數(shù)據(jù)分析能力的強(qiáng)大的大數(shù)據(jù)引擎,目前廣泛的應(yīng)用于包括金融、保險(xiǎn)、證券、通信、航空、物流、零售、媒體、政府、醫(yī)療、制造、能源等行業(yè)。
京ICP備09015132號(hào)-996 | 違法和不良信息舉報(bào)電話(huà):4006561155
© Copyright 2000-2026 北京哲想軟件有限公司版權(quán)所有 | 地址:北京市海淀區(qū)西三環(huán)北路50號(hào)豪柏大廈C2座11層1105室
北京哲想軟件集團(tuán)旗下網(wǎng)站:哲想軟件 | 哲想動(dòng)畫(huà)