PB級(jí)數(shù)據(jù)秒級(jí)響應(yīng)!火山引擎ByteHouse云數(shù)倉(cāng)版有什么“秘密武器”?
“敏捷是企業(yè)在移動(dòng)互聯(lián)網(wǎng)時(shí)代的重要競(jìng)爭(zhēng)力?!?/p>
在12月2日舉辦的2021火山引擎云產(chǎn)品發(fā)布會(huì)上,字節(jié)跳動(dòng)副總裁楊震原反復(fù)強(qiáng)調(diào),字節(jié)跳動(dòng)以敏捷為核心目標(biāo)構(gòu)建了云原生架構(gòu),支撐著公司業(yè)務(wù)快速創(chuàng)新、快速迭代。
的確,或許沒有哪家公司比字節(jié)跳動(dòng)更理解“敏捷”的意義。從央視春晚紅包27天備戰(zhàn),到數(shù)據(jù)中心每天兩萬(wàn)次的線上變更,這些“敏捷迭代”和創(chuàng)新背后,都離不開字節(jié)跳動(dòng)的“云”以及一系列云產(chǎn)品。
以算法起家,字節(jié)在超大規(guī)模數(shù)據(jù)明細(xì)查詢工具上積累了大量的實(shí)踐經(jīng)驗(yàn),本次發(fā)布會(huì)上,字節(jié)跳動(dòng)旗下的技術(shù)服務(wù)平臺(tái)火山引擎發(fā)布的ByteHouse云數(shù)倉(cāng)版便是集大成者。
在講ByteHouse的故事之前,我們先來看一組火山引擎發(fā)布的數(shù)據(jù):作為目前國(guó)內(nèi)幾乎是ClickHouse最大集群的使用客戶,字節(jié)內(nèi)部的ClickHouse節(jié)點(diǎn)總臺(tái)數(shù)達(dá)15,000臺(tái),單集群最大規(guī)模約2400臺(tái),管理數(shù)據(jù)量達(dá)到600Pb,日均查詢量7500萬(wàn)。
這些數(shù)字量背后,勾勒的是一個(gè)超大規(guī)模數(shù)據(jù)分析服務(wù)領(lǐng)域的完美測(cè)試場(chǎng)景。能在高速增長(zhǎng)的業(yè)務(wù)現(xiàn)況下,通過技術(shù)優(yōu)化讓集群規(guī)模不再跟著業(yè)務(wù)增長(zhǎng)而增長(zhǎng)——是ByteHouse誕生時(shí)要解的問題。
從2018年著手,到2021年產(chǎn)品成熟,經(jīng)過4年打磨和積累,字節(jié)將這些能力和實(shí)踐全都集成到了ByteHouse的產(chǎn)品功能里。如今,ByteHouse在字節(jié)內(nèi)部,已支持80%的分析應(yīng)用,包括廣告業(yè)務(wù)、用戶增長(zhǎng)、A/B測(cè)試、算法模型優(yōu)化等等。
應(yīng)對(duì)企業(yè)紛繁多樣的需求,云原生是統(tǒng)一解法
憑借著設(shè)計(jì)優(yōu)勢(shì)、極致的速度性能與靈活可擴(kuò)展性,ClickHouse在短時(shí)間內(nèi)迅速躥紅。
但越來越多人在使用中發(fā)現(xiàn),隨著節(jié)點(diǎn)數(shù)的增加,只依賴于原生引擎必然會(huì)導(dǎo)致更多的人力介入和更高的運(yùn)維成本。同時(shí),傳統(tǒng)存儲(chǔ)和OLAP技術(shù)架構(gòu)誕生了一系列復(fù)雜問題和挑戰(zhàn):無(wú)法支撐實(shí)時(shí)分析需求,資源利用率偏低,啟動(dòng)門檻和成本偏高等問題。
針對(duì)業(yè)界此類痛點(diǎn),火山引擎提出了自己的解決方案——發(fā)力云原生,推出ByteHouse云數(shù)倉(cāng)版。
在12月2日的火山引擎云產(chǎn)品發(fā)布會(huì)上,ByteHouse云數(shù)倉(cāng)版重磅亮相。據(jù)悉,云數(shù)倉(cāng)版已經(jīng)實(shí)現(xiàn)了“四個(gè)零”的突破——零分析時(shí)延、零啟動(dòng)門檻、零運(yùn)維成本和零廠商依賴。
以此為契機(jī),ByteHouse云數(shù)倉(cāng)版也將作為字節(jié)跳動(dòng)“敏捷開發(fā)”和“數(shù)據(jù)驅(qū)動(dòng)”的對(duì)外輸出,服務(wù)更多用戶。
從架構(gòu)層面入手,存算分離,PB級(jí)數(shù)據(jù)秒級(jí)響應(yīng)
作為下一代OLAP引擎,ByteHouse云數(shù)倉(cāng)版將目光對(duì)準(zhǔn)了架構(gòu)層面。通過采用存算分離的架構(gòu),將存儲(chǔ)層和計(jì)算層解耦,以實(shí)現(xiàn)分別無(wú)縫擴(kuò)展存儲(chǔ)資源和計(jì)算資源,面對(duì)PB級(jí)海量數(shù)據(jù)也能高效分析,秒級(jí)響應(yīng)。
ByteHouse云數(shù)倉(cāng)版產(chǎn)品架構(gòu)
資源層面,ByteHouse云數(shù)倉(cāng)版能做到更好的資源隔離。在新一代架構(gòu)里,ByteHouse引入了多租戶,這也是很多大型****的剛性需求。針對(duì)不同的租戶、不同的數(shù)據(jù),可以分配不同的計(jì)算資源,一方面保證性能可控,另一方面可以清楚地看到不同部門和用戶的數(shù)據(jù)與資源使用情況。
這背后是ByteHouse對(duì)于云原生的理解——產(chǎn)品云化僅僅是云市場(chǎng)化的一個(gè)表象,更深層的邏輯還是要落腳到云原生上,而云原生的本質(zhì)便是降低用戶的使用成本,和提升用戶的使用體驗(yàn),這其中包括了運(yùn)維、付費(fèi)和啟動(dòng)等一系列要素。
例如在啟動(dòng)門檻上,基于純SaaS的OLAP體驗(yàn)和標(biāo)準(zhǔn)SQL,ByteHouse云數(shù)倉(cāng)版能在無(wú)需關(guān)注部署配置的基礎(chǔ)上,實(shí)現(xiàn)1分鐘注冊(cè)即可使用,方便業(yè)務(wù)用戶自助分析,同時(shí)還支持按需啟用計(jì)算組,并支持按照分鐘級(jí)粒度即用即付,pay as you go。
ByteHouse云數(shù)倉(cāng)版的接入流程
不斷內(nèi)外兼容,多角度支持?jǐn)?shù)據(jù)安全
解決市面上現(xiàn)有的開源引擎多年來面臨的問題,然后將這些經(jīng)驗(yàn)和實(shí)踐變成更好用的產(chǎn)品,這是火山引擎的第一步。但這還遠(yuǎn)遠(yuǎn)不止,ByteHouse技術(shù)負(fù)責(zé)人表示,他們接下來還想通過云原生的升級(jí),逐步迭代和發(fā)展技術(shù),從而幫助更多客戶。
在云產(chǎn)品的兼容上,ByteHouse也表示會(huì)就上下游的數(shù)據(jù)產(chǎn)品和工具進(jìn)行更進(jìn)一步的兼容,比如Tableau等BI工具。針對(duì)私有云部署,ByteHouse也會(huì)根據(jù)金融等行業(yè)客戶的需求,針對(duì)特有的環(huán)境做出兼容和適配,以復(fù)用客戶的虛擬機(jī)、K8S和存儲(chǔ)等資源。
在未來實(shí)現(xiàn)較好的兼容性后,怎樣降低用戶遷移業(yè)務(wù)的成本,這也是需要兼顧的。針對(duì)此,火山引擎也會(huì)為客戶準(zhǔn)備遷移方案,以降低客戶的使用和遷移成本。
在近年來備受關(guān)注的數(shù)據(jù)安全問題上,ByteHouse云數(shù)倉(cāng)版也有一套自己的解決方案。
首先在用戶訪問層面,通過支持RBAC的用戶訪問方式,以更好地實(shí)現(xiàn)賬號(hào)管理和權(quán)限控制。在更底層的層面上,文件層面也做了數(shù)據(jù)的加密,只有通過密鑰的形式才能解碼其中的一些文件。甚至也有客戶會(huì)提出通信層面的要求,在分布式過程中存在不同的節(jié)點(diǎn),通過SSL的協(xié)議來保障通信的安全。同時(shí),在對(duì)接云廠商時(shí),ByteHouse也會(huì)兼容云廠商本身提供的一些安全機(jī)制。
在12月2日的發(fā)布會(huì)上,火山引擎總經(jīng)理譚待表示,為了建設(shè)開放的云生態(tài),火山引擎的目標(biāo)是在未來3年聯(lián)合一千家合作伙伴、助力十萬(wàn)家客戶實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。
作為這一“萬(wàn)有計(jì)劃”的重要組成部分,ByteHouse云數(shù)倉(cāng)版也在進(jìn)行著充分的準(zhǔn)備。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。
c++相關(guān)文章:c++教程