從 Hadoop 到 Snowflake,2023 年數據平臺路在何方? 世界最新
時間:2023-06-24 07:10:49
作者 | 流縈
策劃 | 張俊寶
【資料圖】
隨著大數據技術的融合發展,企業對數據平臺的要求越發多元:不僅要能夠整合集成、存儲、管理海量的多源異構數據,還要能夠提供連通業務的多樣化數據服務能力,并且能夠支持不同應用、不同場景中的落地。從 Hadoop 到 Snowflake ,數據平臺的發展呈現出清晰的路徑,在與云的結合上也探索了豐富的技術實踐。
那么,數據平臺的下一次“潮涌”何時到來?中國版 Snowflake 何時出現?為了探討問題的答案,我們策劃了《極客有約》特別版——《再談數據架構》系列直播。第一期,我們邀請到了云器科技聯合創始人 & CTO 關濤、Bolt 高級技術副總裁 Xiao Guo 和 RisingWave 創始人 & CEO 吳英駿博士,分別從平臺服務商、用戶以及投資方的不同視角分享各自的觀點。
InfoQ:數據平臺經歷了一個怎樣的發展過程?
關濤 :大數據大概是從 2003 年開始發展的,開始的標志是《MapReduce》《GFS》《BigTable》三篇 paper 的發表。如果從時間維度上對比來看, 數據庫從七十年代起步,至今大概是 50 年的歷史;大數據至今的歷史是 20 年;深度學習是 2013 年左右開始發展的,至今剛好 10 年 。
大數據技術的發展是個典型的“ 規模帶來突破 ”的例子。如果你把兩個數量級以上的數據,以相對低的成本計算起來,形成的效果可能跟以前完全不一樣。這種突破是“跳變型”突破。這種模式非常多見,比如最近特別流行的大語言模型, 其本質上也屬于“海量數據加海量模型規模“組成的一個跳變。
我通常會把大數據的發展分成 3 個階段:孕育期、發展期和普惠期 。
第一階段,從 2003 年到 2013 年是孕育期。大家只聽過一些耳熟能詳的大廠在做大數據相關的建設,比如谷歌做搜索引擎后臺數據處理。2006 年,我加入微軟做的微軟第一代 KV 系統,也是為了支持搜索業務。
第二階段,之后 8-10 年的時間是發展期(2013-2023)。發展期有兩個關鍵事項推動了大數據的發展:其一是以 Hadoop 為核心的開源技術;其二是云計算。云計算相關技術的發展極大程度上降低了大數據平臺的建設門檻。所以,大家可以看到目前主流的大數據平臺都是在 2012 年前后開始發展的,比如說剛才提到的 Redshift 是云上數倉的典型代表,Snowflake 在那時候成立,阿里巴巴大概那個時候開始做阿里云和飛天大數據平臺等。
第三個階段,我個人將其稱作普惠期。普惠期的特點有兩個:其一是千帆競發后,大部分企業被淘汰,少數企業通過競爭最終占領市場,然后逐步形成規模;其二從技術角度來看,部分技術的發展趨于成熟,如批計算、流計算和分析的一些范式被固定并廣泛應用。同時,一些外延的技術比如跟 AI 相關技術的會持續發展。
我認為,美國市場可能在普惠期的早期(Snowflake 等核心廠商仍然保持高速增長,年化增長率 60% 以上);中國的市場已經到了發展期向普惠期轉換的階段 。
吳英駿 :數據平臺是從數據庫演化出來的。
上個世紀六七十年代有了數據庫后,大家自然而言會考慮怎么用這些數據進行分析?比如 IBM 的 DB2 是不是能夠變成一個可以做分析的平臺?最早一批數據平臺都是這樣慢慢發展過來的。當時相對獨立的數據倉庫有 Teradata,它是全球最大的數據倉庫公司之一,在上個世紀七八十年代就已經開始做了。
我覺得數據平臺發展的一個核心標志是 Google 在 2004 年發表的 MapReduce 這篇文章。這篇文章發表之后,大家對這個領域非常關注。每個公司內部都有大量的閑置機器,那么,能不能使用這些閑置的機器、大量的閑置計算資源去做大規模的數據分析?2010 年前后,很多創業公司因此想做 MapReduce。另一方面,MapReduce 是 Google 做的一個產品,這個產品在 Uber 等公司是沒有辦法用的。那怎么辦?開源。所以當時就有幾個非常火的項目,如 Hadoop、Hive、Impala、Spark。2010 年之后,云時代來了。Snowflake 也是在云時代火起來的。因此,我覺得數據平臺在美國的發展,是從單機時代開始,往上一點點發展到 MapReduce,再發展到開源,然后再發展到云上的一個過程。
Xiao Guo :我主要從應用層面說一下我的一些見解。
第一, 現在自建數據中心的公司比較少 。Bolt 使用的數據倉庫是 Google BigQuery。以前 LinkedIn,Uber 早期的時候還要自建數據中心,現在基本都上云了。 現在大部分公司都是用的這三家的數據倉庫,即:Amazon Redshift、Google BigQuery、Snowflake 。
第二, 實時數據分析對應用層面來說非常重要 。通常來說我們會把線上數據庫中的數據 Stream Replication 到數據倉庫里面,使用統一的數據倉庫便于進行實時數據分析。有時候我們還需要工程師在數據倉庫進行人工排錯等等。因為這樣就能不影響線上運行,成本也相對比較低。
第三, AI 和 Machine Learning。現在大部分的公司都會或多或少做一些 AI 和 Machine Learning 的應用, 這就要求 data platform 要考慮到 AI 和 Machine Learning platform 的集成 。
第四, Experimentation Platform。企業做增長、做應用要不停地進行實驗,不停地嘗試。在這種情況下, data platform 跟 experimentage platform 能否很好地集成非常關鍵 。
第五,數據的運營。我們有個機構專門投數據相關的早期的 a 輪公司。在與眾多創業公司的交流中,我們發現持續的數據一體化和高質量交付越來越受到企業重視。雖然行業內在這方面還處在比較早期的階段,但我們的確看到了一些嘗試。
InfoQ:普惠的意義就是大家在做技術方案選型的時候,不管是大企業、中型企業還是小企業,都有一套可以選的技術路線方案,并且門檻不太高。那么,目前行業內有哪些不同的數據平臺技術路線或者說發展方向?
關濤 :從企業客戶視角看,目前行業內的技術路線有 開源組裝自建 和 購買商業化服務 ,分別代表著兩類技術方向。技術路線的選擇也是企業客戶在技術方案選型時面臨的選擇題。
開源自建的技術路線,指的是用不同的開源組件拼接在一起,形成一個完整的生態。開源組件可以隨業務需求修改,定制化程度高。
購買商業服務的技術路線,通常意味著企業希望數據平臺做到一體化、更簡單、免運維。這條技術路線比較典型的技術產品就是 Snowflake。Snowflake 統一管理企業所有的數據,提供所有通用的功能,給用戶一體化的體驗,對于實現降低門檻做普惠非常關鍵。
Xiao Guo :我所在 Bolt 這種獨角獸的公司,一般來說都是比較傾向于第二條路線,即購買 SaaS 平臺的服務。對于 小型公司 而言 ,SaaS 平臺是比較理想的一個選擇。 因為這樣的平臺比較好用,可能很快地部署。企業可以做自己想做的產品,還不需要花費很多資源深度定制、維護平臺。
隨著公司增大,定制需求越來越多,一些大公司可能更傾向于自己開源,然后自己組裝,這樣的話會更加方便控制。
吳英駿 :在 Uber 那個年代成立的公司選擇自建的一個很重要的原因是,那時候技術還沒有很成熟。在那個年代,他們選擇自建數據平臺成本很高。最近十年成立的公司,尤其 2015 年之后成立公司,已經很少選擇自建數據平臺了。一方面,技術已經更加成熟;另一方面,市場環境的原因導致自建成本不可控了。在這樣的情況下,企業怎么會選擇每年花幾百萬美元還都不確定能做出什么東西,而不是去買一個市面上已經有的成熟產品呢?
InfoQ:企業對數據平臺的需求及需求的演進是怎樣的?
Xiao Guo :首先,過去一年,美國整個經濟比較疲軟,所以大部分企業的業務重心從不惜一切代價求發展變成了更關注收入和成本控制。所有的公司都在要求削減成本。公司技術負責人需要看人力成本和軟件成本,其中軟件成本對大部分的創業公司而言,指的是云上的成本、data platform 或者 data warehouse 成本。
其次,削減成本是 bottom line,增加收入 top line 相較而言更重要。企業在選擇項目時的標準是不能天馬行空、不能在幾年之后才會產生營收,必須要聚焦、要關注接下來的 12 個月左右能夠看到營收。
再次,現在 AI 和大模型都非常非常火,大家對 AI 有非常大的興趣。我們看到大公司比如 Amazon,他們在用大模型技術提高、優化現有的一些模型、一些業務。小公司像我們還沒有完全用上大模型,不過也在考慮這件事情了。小公司一般不會建設自己的 machine learning platform,而是會采購已有產品。
最后,美國企業對于數據的安全性和隱私的關注度是越來越高的。
吳英駿 :我們分 技術層面 和 商業化層面 來講。
從技術層面來講,大數據已經發展挺久了,我認為并不存在什么真的難點。
從商業化角度來講,我覺得現在一個很大的發展方向是效率,企業需要更加高效。高效的標志有多種,比如企業不需要自己建機房、買機器、聯機調試等,只需要付錢買服務立刻就能用,方便快捷是高效;隨著技術發展,原本昂貴的服務、較差的性能逐漸優化,價格便宜的同時性能越來越好,性價比高是高效;實時服務也是高效的一個標志;所有的數據平臺都在往 SQL 方向發展進而提升開發效率。
總的來說,我認為目前技術層面很多問題都已經被解答了;從商業化層面,或者說從市場發展規律來講的話,未來肯定是往效率方向去講這個故事。
關濤 :數據平臺的技術從孕育期到發展期再到開始進入普惠期,這三個階段的變化跟客戶的變化也是相輔相成的。技術發展分成三個階段,客戶也分成三大類。
在 孕育期 ,客戶通常是 early-adopter,不一定是大公司,而是技術能夠做到極致的玩家,人數很少,可以稱作是金字塔塔尖上的那一群人。他們有很高的技術水平和動手能力,能修改開源代碼,能推動技術做迭代,這是 early-adopter。
到 發展期 ,我們把客戶歸類為 Early majority。技術理念初步深入人心,市場上一大批對新技術有渴望的人會把這個技術用起來,然后會催生很多技術型的平臺服務提供商。
然后是 普惠期 ,我們把客戶歸類為 late majority。大家覺得用這個技術已經是一個公認的事情了。
客戶需求就像一個金字塔,從最頂尖的客戶需求開始向下一層一層地擴展。最開始的 adopter 側重于 0-1,要滿足從來沒見過的新場景,要通過技術帶來競爭的獨特的差異化優勢,要構建競爭門檻,所以那些技術的創新和變化是非常非常多的。在這種變化里面,開源的眾籌迭代模式很重要。
再往下一點,模式就會變得固定一些,大家都這么用,然后 形成了最佳實踐。最佳實踐累積沉淀成平臺,然后平臺慢慢就打磨起來,能滿足多樣的客戶需求,讓更多企業能用起來這些平臺 。
結合我之前的經驗,我們會更細致地把客戶大概分成四類。
第一類,我們叫做 一線大型科技公司 ,在過去通常是互聯網公司為主。比如市值排名前 30 的企業通常有很大的規模,有很強的技術創新的訴求,會有很多定制化的需求。 這些企業一般會去選擇自建 。
第二類,我們叫做 digital native,就是數據原生的公司 ,這種類型的公司通常規模中等,可能在 100-1000 臺物理服務器的這樣的一個規模。這些企業我們能看到他們越來越不考慮自建了,他們會覺得自建反而不劃算。舉個例子,之前國內有一家公司 A,大概需要 100 臺 物理服務器做數據平臺,硬件成本年化大約 300 萬 / 年,如果選擇自建的方式,企業要把一整套數據體系做起來大概需要 10 個模塊組件,需要 4-5 人的團隊來維護,人力成本大概也需要 300 萬元一年。如果購買 SaaS 服務,含硬件成本也就 400 萬。企業發現自建人力成本幾乎和硬件成本一樣高,所以 這類企業慢慢開始轉向購買平臺服務 。
第三類,我們叫做 有技術能力的傳統企業 ,典型代表比如說銀行、保險,現在包括新制造比如造車企業,他們有很多的數據需求。他們技術能力很強,也有很強的付費意愿。 這類型客戶大部分選擇購買數據平臺 ,像銀行通常不太會選擇自建數據平臺,一定會選擇購買,因為覺得買來的商業化產品可能從安全性、穩定性的角度是有廠商負責的,有人兜底的,這個對他們很重要。
第四類企業,我們叫做 傳統企業 ,還有數字政府類的,這些企業通常是個純粹的使用者,他們甚至都不具備構建數據平臺的能力。不同類型的客戶要的不一樣。 第一類,可能是自建和極致的定制化,中間兩類的可能會購買平臺型的服務。最后一類,可能他不會買平臺,也不會建平臺,要的是個解決方案 。
InfoQ:在需求這方面,中美之間有差異嗎?
吳英駿 :我覺得肯定是有差異的。美國企業可能更加 care 的是易用性方面,而中國企業看重的是性能。
還有另外一個點是,中國的用戶更加偏向于大一統的系統需求,可能是需要用一套架構解決所有問題。比如我們用微信的時候,我可能不太想希望去跳到其他平臺,微信小程序就類似于轉化系統;但美國由于產品實在太多了,而且它產品分工非常明確、非常細,所以對于美國來說最優的解決辦法是去把這些東西拼裝起來,只要你能給我一個非常簡單的拼裝方式,我就非常滿意了。
關濤 :先說技術,技術上中國和美國幾乎拉平的,得益于非常頻繁的技術交流,比如說今天這樣的一個圓桌。
在商業生態上,國內跟美國,不同的企業可能不一樣,大概有 3-7 年的差別,美國的商業生態上更關注的事情,國內可能要再晚幾年才會關注到,比如安全和隱私保護,這是我個人的視角。
除此之外,中美還有 幾個差異點 :
第一點是 付費意愿 的問題,美國企業更愿意為知識、為軟件來付費。在國內你會發現很多小公司愿意開源自建,原因就在于軟件的費用就省掉了。當然,后來大家越來越明白,可能人力資源的那部分成本比一般軟件還要貴。
第二點是 遷移方向 的問題。剛才嘉賓舉了個例子,大家覺得 Snowflake 太貴了,然后轉移到自建上去,我這看到正好相反,我這邊看到的在國內的特點是說,國內大多數公司把自建平臺轉向了 SaaS 托管化的平臺,這件事的核心是公司要削減成本,公司會把那些維護這個平臺的人轉移到業務上去。
第三點不同是對 安全 的要求不相同。美國對數據隱私安全合規的要求要高一點。
第四點,我個人認為國內公司的 技術好奇心 更強,也更開放。你跟他談一些新技術,給他一些新的產品,他非常愿意嘗試,并能快速迭代給你。但國外可能門檻要高一點,你不達到一些成熟的標準,比如說不達到合規和穩定性的標準,很多美國的企業一定打不進去。這也是國內的技術生態發展迭代快的一個因素。
InfoQ:Snowflake 現在在大數據里面做得非常成功,這個平臺它這么受歡迎的原因是什么?
Xiao Guo :作為用戶,我覺得它最好的一點就是你用它的時候不用去特別去想它背后的細節。它可以提供很多功能,能幫助企業進行基礎設施的復雜管理和優化。
并且,Snowflake 也是 SQL based。engineer,product,manager,product analyst 甚至 customer,所有人都可以用 Snowflake 很簡單地去查詢想要的內容,看到業務數據的一些表現。同時它可以支持任何云廠商,企業不用擔心自己因為在哪個云平臺上而得到有限的服務。
Snowflake 也會有一些安全的標準,在數據的加密上做得很好。再就是查詢響應速度。作為一個用戶來說,我最關心的是一個 query 能不能很快反饋,能不能支持很多用戶同時訪問等。總而言之,作為一個終端的客戶,我更關注的是我自己的產品,而不是去花很多時間去想數據平臺如何構建。如果一個平臺讓你不用去想它就能用,能讓你有更多時間專注于做對自己公司而言重要的事情,還能滿足公司需求,就是一個很好的平臺。
吳英駿 :我們經過長期訪談發現,用戶用 Snowflake 是越用越爽的。用戶一開始沒有想付那么多錢,但是這個平臺實在太好用了,所以他就一直發 query,就導致這個平臺越用越貴,賬單才會越來越高。但是如果要去問用戶說,Snowflake 到底好在哪?他們都說不清。另外,Snowflake 的用戶模型,或者說它的收費模式也非常好,好處在于說你不用去選機器,你只要告訴我你選的一個 T-shirt Size,其他東西都幫你搞定了。Snowflake 現在在往 DataCloud 方向改良,集成了相當多的東西,這些東西能讓客戶使用產品時一鍵搞定所有事情。
關濤 :前面嘉賓提了很多形容詞,我用一個詞來形容它,叫 一體化 。
Snowflake 的一體化的能力其實做得非常好,使得它很容易能被很多人用起來。如果一個公司的平臺建設完,但這個平臺只有數據開發的那幾個同學能用起來,別人要用的時候都要經過這幾個人,整體效率就很低。Snowflake 的一個好處就在于也許你不是特別懂系統,也許你只是會寫 SQL,你也可以把它很好地用起來。剛才說的擴展性的問題、調優的問題都被系統屏蔽到系統底層之下,你不需要管它。
這種 一體化的能力,是提升業務效率,降低使用門檻的關鍵 。讓那些并不太懂技術的人,也能夠很好地使用數據平臺,就是 Snowflake 成功的第一個關鍵點。
多云或者叫云中立是 Snowflake 成功的第二個點 。很多客戶、特別是大客戶特別看重數據平臺是否會綁定在一家云上。
第三個關鍵點是 Snowflake 面向云原生彈性的收費能力。 對于小企業來講, Snowflake 起步非常便宜。
所以讓我總結 Snowflake 這個平臺受歡迎的點,一個是一體化的能力,一個系統解決大多數問題;第二個是多云和云中立;第三個是彈性的收費能力降低了用戶使用的門檻。
InfoQ:從投資人的角度,你如何看待數據平臺技術的發展?
Xiao Guo :目前我們在看一些生成式 AI 的項目,因為我們覺得 數據是接下來十年或者更長久的一個巨大的最本質的推動力 。大家都說接下來的十年 AI、生成式 AI 會為社會的生產力帶來極大提升,而 驅動 AI 最底層的就是數據 。所以我覺得在接下來的十年之內,數據還有 AI 都是非常大的一個浪潮。
InfoQ:一家初創公司需要具備什么樣的特性,你才會考慮投資?
Xiao Guo :很多方面。
早期公司我們很看重創始人的背景 ,因為我們投的就是偏技術的公司,創始人及創始團隊需要有很強的技術實力。
第二,看 產品是不是能解決市場上的一些痛點 。要么企業自身已經有用戶,要么市場上跟他同類型的不同階段的公司已經有用戶。初創企業,就看他們有沒有愿意付費的人;比較后期的話,我們就看他有多少付費的用戶。公司產品是否能解決具體的問題,擁有哪些具體的客戶,對我們來說很重要。
第三,我們還要看 這個賽道有多大,這個市場有多大 。有的企業不僅面向科技企業推薦產品,還會向一些傳統企業推銷產品。隨著對數據的需求不斷增加,傳統企業也會增加軟件的采購需求。我們投資的時候,一般除了跟這個團隊聊,我們也會跟他們的客戶聊,問客戶的使用的體驗,對整個產品有什么反饋等。
InfoQ:不管是從使用方的角度,還是從創業者的角度,行業內對中國版 Snowflake 的呼聲從未停止。各位嘉賓怎么看這樣的一個浪潮呢?
吳英駿 :這個我覺得應該說是叫眾望所歸。
現在大家都可以看到國內有很多云平臺,比如說像阿里云、騰訊云、華為云包括像天翼云,包括像其他一些各種各樣云平臺,有這么多云平臺。但是 中國似乎沒有一家類似于像 Snowflake 這樣的獨立的云平臺 。我相信這個賽道有很多玩家,但是我們沒有見到過一家有 Snowflake 這種影響力,或者說有很多人認可的獨立第三方的公司,現在目前沒有。
在跟國內用戶聊的時候,我發現 國內用戶他們都希望用多云,他們不太希望被一家云綁定 。他們甚至會自己做一些遷移,就是為了防止被一家云綁定。
所以,如果這時候出現一個第三方的產品,足夠好用,價格相對來說比較合理,一定有其存在的合理性。
關濤 :我聽到的呼聲蠻多的,從我在阿里云做阿里云平臺的數據平臺產品的時候就能聽到。主要原因大概我覺得可能分成三類。
第一,快速發展的中國云市場,帶來更多需求 。中國是個大市場,有很多的用戶和海量數據,但是中國的云規模相對不大,中國的云跟美國的云從營收層面比,大概有 1:7 的一個比例,這個跟中國整個經濟的體量并不太匹配。從這個層面,我們剛才提到的數據發展三階段,就是從這個孕育期到發展期到普惠期,云本身也是在發展期后期到普惠期的前期。中國的云市場還有很大的發展空間。
第二,中國缺乏多云獨立的數據平臺服務 。中國云生態很分散,大家提到美國就是三朵云了,幾乎沒有第四。中國除了剛才提到的阿里、騰訊、華為以外,還有像天翼、字節等等。中國的云發展的生態更分散,這個也是技術發展期的一個特征,就是百花齊放的一個樣子。這種百花齊放對用戶來講確實是個問題,他希望不被鎖定。
第三,從對標廠商層面看。美國三大云數倉 + 兩個獨立數據平臺(Snowflake,Databricks) 的數據平臺格局已經形成。相比起來, 國內做原創數據平臺技術的公司并不多,市場整體還是偏空白的狀態 。
InfoQ:如果出現一家中國版的 Snowflake,那這家企業應該具備什么樣的特質?
吳英駿 :我相信它肯定不是一個單純的 copy ,肯定是需要去做本地化。在中國市場做本地化,跟在美國市場有非常多的不同。
首先, 生態方面的差異 。整個大數據的生態兩者是不一樣的,比如說美國市場是像亞馬遜云科技、GCP 這些生態,在國內可能是阿里云、騰訊云這樣的生態。
其次, 用戶需求的差異 。從國內用戶的角度來去考慮的話,他們相比于美國用戶,對性能相信是有更高要求的。國內企業的業務量非常大且獨特,像雙 11 這種業務場景的流量和獨特性肯定是秒殺美國黑五的。如果你做中國版 Snowfalke 只是去 copy 的話,可能意義不是特別大。
最后, 用戶文化的差異 。在美國文化中,美國用戶能夠接受企業做拼裝融合多種產品需求,但在中國不一樣,它希望最好能做成微信的樣子,一家全部能做了。
回到話題本身,我相信 如果要是中國做一家 Snowflake,它需要在本土化上面做得非常強,肯定不是去 copy to China 這樣的一個模式 。
關濤 :如果與 Snowflake 對標起來,我覺得有五個標準:
第一,它應該是 多云 的。
第二,它是 一體化 的,能用一套系統能解決用戶的很多數據的問題。或許不一定解決所有問題,但它至少應該是一個高內聚、低耦合的系統。
第三,我覺得關鍵的是 原創的技術 。如果今天拿開源的技術組裝成一個系統,它很難做到非常好一體化。無數的案例已經證明了這一點。Snowflake 好就好在它是一個一體化的東西,是非常耦合一體化的東西。
第四,我很同意嘉賓剛才提到的,就是 不能照搬 ,就是如果今天照抄 Snowflake 的技術,那是 8 年前的技術。Snowflake 起步大概在八九年前,讓它火起來的技術在當年是創新但在現在已經不是了。所以中國版 Snowflake 要有原創能力和面向新一代的技術的創新,要比 Snowflake 做得更好才可以。
第五, 好的 To B 能力或者說本土化。 好的 To B 能力指的是基礎設施產品。除了技術以外,你要有很好的產品的包裝能力,讓用戶用起來很“爽”;要有很好的商業服務能力,包括現場實施、安全性合規等,能夠服務好客戶。
所以總結下來, 中國版的 Snowflake 應該有五個特征:多云、一體化、原創的技術、比 Snowflake 更新一代的創新、好的 ToB 能力 。
我覺得目前國內還沒有一家公司可以做到這些五點,并且已經形成影響力。我們云器希望構建這樣的一些服務,這也是我們的一個目標。
InfoQ:關濤老師的公司云器科技在 的時候有一個發布會,能不能請關濤老師給我們提前劇透一下?
關濤 :前面大家已經聊了很多,我談下我們為什么要做這樣的一家創業公司?
在美國數據平臺領域,三家核心云廠商都有原創的“主力”數據平臺,還有兩個獨立的數據平臺(Snowflake、Databricks),形成 3+2 的格局。在國內,真正做原創的數據平臺技術的公司并沒有那么多,目前也沒有一個成規模能像 Snowflake 一樣的多云平臺獨立提供商。 所以,我們希望能夠做一個多云和一體化體驗的數據平臺,能夠普惠國內的用戶。所以,我們做了云器科技 。
商業模式上,我們跟 Snowflake 很像,是 多云獨立設計、一體化極簡的架構 。在技術上,我們提出基于 SingleEngine 理念的湖倉平臺,很多能力會超越 Snowflake 。
我們在 7 月 20 號舉辦首發發布會,會正式推出我們的 Lakehouse 平臺,同時會有實際的客戶案例展示出來。大家想要關注我們的話,可以搜索云器科技,能看到我們的官網的頁面。
7 月 20 日,云器科技將首次對外舉辦新品發布會。云器首創以“Single-Engine”為核心理念的湖倉平臺,目前已經完成了數億元融資!為什么云器可以在當下的市場環境中獲得投資方和企業客戶的青睞?點擊“報名”立刻報名發布會一探究竟!
相關稿件
從 Hadoop 到 Snowflake,2023 年數據平臺路在何方? 世界最新
湖人官宣季前賽賽程!兩戰勇士成焦點 詹姆斯杜蘭特有望上演對決_焦點關注
銀行定期存款有“講究”?內部員工不建議存3年定期,原因揭曉_焦點精選
阿富汗地震一周年丨重建艱難 美國單邊制裁加劇民眾痛苦 環球播資訊
天天快資訊丨C++面試八股文:std::vector了解嗎?
下月初,快樂一半,悲傷一半,3星座相愛卻停不下來,無法自拔-環球觀焦點
內江城區夜空首次無人機組團特技表演盡顯藝術與科技的魅力 資訊
全球視訊!【端午近郊游】喜歡蜂糖李的友友千萬別錯過這個地方!
派對必備!超可愛的兒童萬圣節工藝品送給女性好友,更是生日禮物的首選! 前沿資訊
意甲:米蘭不看好門將永達爾的未來,決定讓其免費加盟赫塔菲-重點聚焦
當前速遞!國內唯一沒有規劃高鐵的省會:不僅成本高難度更大,風景倒是絕美