作者 | 金旺
來源 | 科技行者
預計2027年,云數據庫將占據整個數據庫市場份額的70%。
這是Gartner在2019年給出的預測數據,從Gartner最新的統計數據來看,截至2023年年底,云數據庫在整個數據庫市場中占比已經高達61%,這時的云數據庫已經成為大勢所趨。
與此同時,人工智能技術的驟變,開始影響數據庫產業,數據庫再次成為人工智能從技術到商業化的一個關鍵平臺。
Gartner高級研究總監顧星宇指出,“到2028年,80%的生成式AI業務應用將在企業現有的數據管理平臺上開發,從而將實施復雜性和交付時間縮短50%。”
作為云數據庫的堅實擁躉,阿里云智能集團副總裁、阿里云智能數據庫產品事業部負責人李飛飛則斷言,“第一波人工智能浪潮是由Native AI群體掀起,但在人工智能進入下半場后,本質上已經回歸到系統領域,回到了工程化問題上。”
也是在這時,阿里云PolarDB看到了他們的機會,進行了又一次產品迭代,也面向人工智能推出了PolarDB-Model as an Operator。
01 千機集群打出一個世界紀錄
2月26日,在2025阿里云PolarDB開發者大會上,阿里云官宣,PolarDB登頂全球數據庫性能及性價比排行榜, 并刷新了TPC-C性能和性價比雙榜的世界紀錄。
TPC-C測試,是由國際數據庫事務處理性能委員會(TPC)組織制定的模擬電商訂單服務場景,針對數據庫在線事務處理(OLTP)系統性能的一場長達40小時的極限基準測試。
其中,數據庫系統需要在極限壓力下運行8小時以上,在這期間,tpmC的波動率不能超過2%,還要保證數據正確率為100%,與此同時,測試模型還會模擬各種硬件故障情況,參與測試的產品需要確保數據不丟失,并能快速恢復正常性能。
這一基準測試歷來也有著數據庫領域“奧林匹克”之稱。
正是在這樣一個極為嚴苛的數據庫測試中,阿里云PolarDB團隊在2025年1月27日用1170臺物理機搭建了一個PolarDB集群,這個集群擁有2340個PolarDB主節點和2340個PolarDB從節點,最終支撐1.6億家商店、16億用戶跑出了每分鐘20.55億筆交易(tpmC),刷新了TPC-C性能排行榜,打破了世界紀錄。
在這次TPC-C測試過程中,阿里云PolarDB數據庫還刷新了另外三項成績:
第一,使用物理機數量相較于此前紀錄保持者(1650臺)少了三分之一;
第二,單虛擬核性能達到了18297tpmC,是此前紀錄保持者的1.8倍;
第三,單位成本0.8元(price/tpmC),是此前紀錄保持者的60%。
為什么PolarDB能在這場全行業矚目的基準測試中打出這樣的成績?
這其中的原因之一是PolarDB集群網絡部署從去年的25G Lossless RDMA升級到了100G Lossy高性能RDMA網絡,基于這樣的RDMA網絡,PolarDB團隊可以搭建連接數千臺,乃至上萬臺物理機的集群,并實現了高性能事務一致性執行能力,多節點復制能力也由此提升了1倍。
具體到TPC-C測試中,這樣的高性能RDMA網絡帶來的一個變化是,PolarDB的上千臺物理機集群跨機業務對性能的影響得以被控制到7%以內。
據阿里云智能集團數據庫產品事業部PolarDB MySQL及PostgreSQL負責人楊辛軍在發布會上透露,“PolarDB這次打榜最終達到的20.55億tpmC成績并不是我們的極限,實際上,PolarDB可以跑得更好。”
TPC-C是一個相當真實的情景模擬,它會模擬用戶在電商進行購買操作,這其中,每個商店能夠支持的客戶人數和交易速度都有限制,每個商店僅支持10個虛擬用戶同時進行交易,商品數量也有一定限制,因此,最終交易性能與商品數量相關。
據楊辛軍介紹,“我們打榜后發現,我們的限制并不是單機性能,而是存儲,由于我們當時并沒有購買足夠的存儲資源,如果當時我們購買了更更存儲資源,我們打出的成績理論上可以再提升,在相同物理機和節點數量下一直可以提升到28億tpmC。”
而之所以會有這次打榜,楊辛軍告訴我們,“這其實相當于是一次檢閱,在PolarDB的新升級的硬件上線給所有用戶用之前進行的一次檢閱,而這些硬件在打榜后,最終將會進入商用市場,為用戶提供服務。”
一并在這次發布會上發布的,不只有隨PolarDB打破世界紀錄并將進入市場的數據庫集群,還有阿里云第一個CXL Switch內存池數據庫。
02 打破“內存墻”,CXL-Powered PolarDB亮相
作為新一代云原生數據庫,PolarDB的獨特之處在哪里?
李飛飛給出的解釋是:
“PolarDB通過三層解耦架構,在數據中心規模上實現了馮諾依曼架構,將擁有成千上萬臺服務器的數據中心變成一臺實現了計算、內存、存儲三層解構的云原生計算機。”
基于這樣的技術架構,PolarDB此次正式對外預發布了第一臺基于CXL Switch的數據庫專屬機型。
什么是CXL?
CXL是基于PCIe一種新型高速互聯技術,旨在解決計算系統中數據處理延遲、速度減慢和可擴展性問題,提供更高的數據吞吐量和更低的延時的接口標準,可以連接CPU、GPU、DRAM、存儲設備,解決CPU與設備、設備與設備之間的內存鴻溝。
在當下大模型時代,內存發展與算力增長速度的不匹配導致了“內存墻”問題的出現,基于CXL Switch的數據庫專屬機型在硬件上契合了PolarDB的三層解耦架構,并為解決大模型的“內存墻”問題提供了解決思路。
據楊辛軍介紹,“以配備單根256GB內存、連接7臺物理機的CXL Switch內存池的PolarDB數據庫為例,一個機柜可以支持16TB的內存容量,這時,每臺物理機都可以使用這16TB內存容量。”
PolarDB通過使用CXL技術構建三層分離數據庫,部署在遠端的數據庫并沒有因為跨機和跨地域導致數據庫性能下降,反而擴展性提升了3倍,而通過遠端數據庫替代本地數據庫的形式,數據庫成本也得以下降了50%。
對于基于CXL Switch內存池化的機型,李飛飛在接受媒體采訪時特別強調,“我們并不是要做線下市場、做一體機,這些機型最終都將會用到公共云上的PolarDB專屬資源池構建中。”
PolarDB在Kernel層有各類壓縮算法,但李飛飛認為,“僅做這些還不夠,PolarDB還需要在磁盤SSD的控制上做優化,由此才能真正做到軟硬件協同創新。”
李飛飛指出,“云原生是必然趨勢,任何系統向前演進僅做軟件創新是沒有未來的,一定要做軟硬件協同創新,DeepSeek證明了這一點,PolarDB的突破同樣證明了這一點。”
至于此次在發布會上亮相的CXL-Powered PolarDB,楊辛軍在發布會也強調,“這次基于CXL Switch內存池化的PolarDB數據庫只是預發布,還沒有正式應用到生產環境中。”
據悉,接下來PolarDB團隊還將會在GPU+CPU異構資源池上繼續優化,滿足大模型對于異構算力的應用需求。
03 將大模型,裝進PolarDB里
隨著DeepSeek在年初的開源,大模型正式進入到了人工智能應用爆發的元年。
誰能抓住這波人工智能應用爆發的機會?
李飛飛認為,“只有那些將大模型更好地與現有業務流程、數據流程結合,把成本降低、把資源優勢打滿、讓數據真正發揮出價值的企業,才能抓住這波機會。”
自2025年,以大模型為代表的人工智能時代被劃分為上下半場,上半場的競爭焦點是大模型的預訓練,接下來大模型的預訓練將會呈現出在線化、集中式的趨勢,而下半場本質上又回到了傳統的系統和工程領域。
對于數據庫廠商而言,“模型即算子”已經不再是一個“if”,而成了正在發生的事,也是在此次發布會上,PolarDB-Model as an Operator正式對外發布。
李飛飛在發布會上介紹稱,“我們現在已經可以把包括大模型在內的各種各樣的模型作為算子內嵌到數據庫引擎中,這樣為我們從數據中發現價值帶來了便利,為傳統OLAP的意義和方向會因此得到極大的拓展。”
這是李飛飛堅定看好的發展趨勢。
為此,PolarDB團隊將包括通義千問、DeepSeek等在內的大模型作為算子內嵌到了PolarDB數據庫中,利用PolarDB的三層解耦架構和多主多寫能力彈性伸縮出人工智能推理節點。
這一波操作下來,極大地簡化了企業部署和應用大模型過程中數據管道,企業不再需要將數據轉移到專有推理平臺上,將推理結果拿回來再進行業務判斷。
實際上,PolarDB-Model as an Operator不僅僅是將大模型內嵌到了PolarDB數據庫中,還針對大模型做了一系列優化。
楊辛軍告訴我們,“由于PolarDB特有的三層解耦架構可以實現內存的解耦,部署在PolarDB中的大模型就可以將CPU和GPU的資源充分利用起來,在同等GPU算力條件下,部署在PolarDB上的DeepSeek并行用戶訪問量可以提升35倍。”
與此同時,將大模型裝進數據庫也避免了企業私有數據出域,為企業數據安全和大模型應用提供了一個新思路。
好文章,需要你的鼓勵
這里曾是中國重工業的搖籃,裝備制造業的轟鳴聲響徹幾代人。如今,這片土地不再只依賴鋼筋鐵骨,而是主動擁抱數智化的浪潮,用算力和算法書寫東北振興的新篇章。
陳立武的到來,像一顆石子投入平靜湖面,激起漣漪的同時,也讓人好奇:這位65歲的“半導體老兵”能做到什么程度?
在GTC2025大會上,英偉達CEO黃仁勛在一場至頂科技等全球媒體共同參與的記者會上表示, AI正在成為一個全新的制造業。AI不是傳統意義上的軟件開發,而是一場需要基礎設施、能源和資本投入的產業革命。