首頁(yè) 資訊 > 產(chǎn)業(yè) > 正文

霄云科技:敢捅窗戶紙 不懼浪淘沙

“感覺(jué)捅破了窗戶紙。”

李小勇看了一眼實(shí)驗(yàn)室中搭建的原型系統(tǒng),又仔細(xì)核對(duì)一遍各項(xiàng)實(shí)測(cè)性能數(shù)據(jù)。他感覺(jué)捅破了窗戶紙,感覺(jué)時(shí)機(jī)已經(jīng)成熟,“是時(shí)候,將‘PB級(jí)海量存儲(chǔ)技術(shù)’進(jìn)行產(chǎn)業(yè)化推廣了。”

2015年,李小勇作為創(chuàng)始人兼CEO,正式創(chuàng)辦上海霄云信息科技有限公司,篤定完全自研、不基于開(kāi)源的高性能分布式存儲(chǔ)。

霄云科技 創(chuàng)始人兼CEO 李小勇博士

“系統(tǒng)架構(gòu)”成為突破口

李小勇的內(nèi)心一直有個(gè)IT人的夢(mèng)想,“我們使用的核心IT系統(tǒng)和各類(lèi)基礎(chǔ)軟件,幾乎都是國(guó)外的。我們的研究不能只停留在論文上,我們不但要能說(shuō)能寫(xiě)更要能做,才能迎頭趕上與國(guó)外IT技術(shù)的差距。”教書(shū)育人十余載,李小勇無(wú)數(shù)次向?qū)W生講授分布式存儲(chǔ)技術(shù)原理,但他深知“將原理轉(zhuǎn)化為產(chǎn)品,需要解決諸多技術(shù)挑戰(zhàn)。例如,可擴(kuò)展架構(gòu)、連接與請(qǐng)求的超時(shí)處理、I/O的并發(fā)性、讀寫(xiě)過(guò)程中進(jìn)行擴(kuò)容而I/O不能中斷等,諸多原理、架構(gòu)、關(guān)鍵技術(shù)問(wèn)題堆積在一起時(shí),就感覺(jué)無(wú)從下手。”

“系統(tǒng)架構(gòu)”成為了霄云科技的第一突破口。

時(shí)間回到2003年,Google發(fā)布Google File System論文,正式為分布式軟件定義存儲(chǔ)奠定了理論基石。當(dāng)時(shí)還在讀博士的李小勇敏銳感覺(jué)到是次機(jī)會(huì),“為存儲(chǔ)產(chǎn)業(yè)打開(kāi)了一扇新的窗口。”

但也僅是一扇窗口。

因?yàn)樵谥T多分布式存儲(chǔ)實(shí)現(xiàn)方式中,“集中式元數(shù)據(jù)管理”最早被提出應(yīng)用,GFS和Hadoop HDFS等經(jīng)典系統(tǒng),均是依據(jù)此模式設(shè)計(jì)。其優(yōu)點(diǎn)是系統(tǒng)架構(gòu)簡(jiǎn)單,元數(shù)據(jù)操作性高,但缺點(diǎn)也很明顯,元數(shù)據(jù)服務(wù)器就是系統(tǒng)瓶頸,它所能管理的文件數(shù)量上限很難突破10億。

到了2010年,分布式存儲(chǔ)又迎來(lái)一場(chǎng)巨大的技術(shù)進(jìn)步。隨著OpenStack技術(shù)的發(fā)展,“去中心化”的Ceph成為分布式存儲(chǔ)的明星。不夸張的說(shuō),國(guó)內(nèi)的大多數(shù)分布式存儲(chǔ)企業(yè),都在基于Ceph開(kāi)源軟件設(shè)計(jì)產(chǎn)品。但Ceph起步之初就缺乏工程經(jīng)驗(yàn),差強(qiáng)人意的代碼質(zhì)量也確實(shí)會(huì)影響系統(tǒng)穩(wěn)定性。

霄云科技學(xué)習(xí)了開(kāi)源技術(shù),但又忘掉開(kāi)源技術(shù),沒(méi)有選擇Ceph,當(dāng)然也沒(méi)有選擇此前的“集中式元數(shù)據(jù)管理”。“以復(fù)雜的方法去解決復(fù)雜的問(wèn)題,正確性和效率都難以保證,用簡(jiǎn)單方式解決復(fù)雜問(wèn)題才是正確的方法。”李小勇說(shuō):“借鑒NoSQL數(shù)據(jù)庫(kù)理念,霄云科技完全自研系統(tǒng)架構(gòu),以“集中決策、分布執(zhí)行”模式,將文件的內(nèi)容以對(duì)象的方式存儲(chǔ)到每個(gè)節(jié)點(diǎn)上。這樣既兼顧了集中式架構(gòu)和去中心化架構(gòu)的優(yōu)點(diǎn),也保證了系統(tǒng)可分布式拓展,且沒(méi)有單點(diǎn)并發(fā)瓶頸。”

運(yùn)氣還是偏執(zhí)

一切因此迎刃而解。

以2015年為起點(diǎn),創(chuàng)業(yè)后的4年間,霄云科技的技術(shù)線從塊存儲(chǔ),延伸至文件存儲(chǔ)、對(duì)象存儲(chǔ),并推出碧海分布式存儲(chǔ)系統(tǒng)(BOSS)。同時(shí),霄云科技攻克了“海量小文件聚合優(yōu)化”和“文件和對(duì)象可互通訪問(wèn)”、“自適應(yīng)流控”等技術(shù)難題,還在實(shí)踐中自研應(yīng)用了“海量數(shù)據(jù)快速遷移工具”。

“每一次關(guān)鍵技術(shù)的突破,至少要經(jīng)歷三次以上的失敗。”李小勇說(shuō):“創(chuàng)業(yè)始于創(chuàng)新,但成功的技術(shù)創(chuàng)新,必然是小概率事件,需要一點(diǎn)點(diǎn)運(yùn)氣,需要一點(diǎn)點(diǎn)偏執(zhí),也需要一點(diǎn)點(diǎn)時(shí)間。”

他所說(shuō)的“一點(diǎn)點(diǎn)”運(yùn)氣,就是技術(shù)創(chuàng)新的不確定性。如果有人有錢(qián)就能保證創(chuàng)新成功,就不可能有創(chuàng)業(yè)企業(yè)的生存空間。因?yàn)閺膩?lái)沒(méi)有所謂“條條大路通羅馬”,在技術(shù)創(chuàng)新過(guò)程中,只有部分道路才會(huì)通向羅馬。

當(dāng)然,李小勇所說(shuō)“一點(diǎn)點(diǎn)”偏執(zhí)和“一點(diǎn)點(diǎn)”時(shí)間,是霄云科技已經(jīng)在分布式存儲(chǔ)領(lǐng)域堅(jiān)持了10多年。人海戰(zhàn)術(shù),遠(yuǎn)遠(yuǎn)不能抵消“偏執(zhí)狂”在縱向領(lǐng)域10年+的探索積累。

在應(yīng)用場(chǎng)景中打開(kāi)市場(chǎng)

這就使霄云科技,有資格去捅破第二層窗戶紙。

中國(guó)企業(yè)的數(shù)字化轉(zhuǎn)型始于2015年,至2020年前后進(jìn)入深水區(qū)。此時(shí)產(chǎn)業(yè)格局發(fā)生著微妙的變化,科技企業(yè)在以“應(yīng)用場(chǎng)景”重新劃分市場(chǎng)格局。道理很簡(jiǎn)單,業(yè)務(wù)痛點(diǎn)藏在應(yīng)用場(chǎng)景中,而數(shù)字化轉(zhuǎn)型的價(jià)值就是解決業(yè)務(wù)痛點(diǎn)。

“存儲(chǔ)產(chǎn)品并沒(méi)有行業(yè)屬性,但聚焦行業(yè)應(yīng)用場(chǎng)景,更容易打開(kāi)市場(chǎng)。”霄云科技找到了, “碧海分布式存儲(chǔ)系統(tǒng)(BOSS),特別匹配醫(yī)院中的PACS場(chǎng)景,這可是醫(yī)療行業(yè)3大核心生產(chǎn)系統(tǒng)之一”。這并不是霄云科技摸索的第一個(gè)應(yīng)用場(chǎng)景,而是歷經(jīng)數(shù)年摸索了大概5-6個(gè)行業(yè)10幾種應(yīng)用場(chǎng)景后找到的。

10年前,患者CT檢查產(chǎn)生的圖像大約只有幾百?gòu)?,醫(yī)生調(diào)閱患者PACS圖像只需要10秒左右。但在10年后,256排高端CT設(shè)備已經(jīng)廣泛應(yīng)用。目前,患者一次檢查產(chǎn)生的圖像數(shù)量達(dá)到3000~10000幅,調(diào)圖時(shí)間普遍在2分鐘以上。

別看就是這兩分鐘,初審醫(yī)生還可以喝杯水忍耐一下,但復(fù)審醫(yī)生每天要調(diào)用200組以上圖片,調(diào)圖卡頓等待時(shí)間可能超過(guò)4個(gè)小時(shí),周末加班成為常態(tài)。“我們的時(shí)間不能浪費(fèi)在鼠標(biāo)“轉(zhuǎn)圈圈”上。中國(guó)人都要在月球建基地了,傳張圖片有那么困難嗎?”復(fù)審醫(yī)生經(jīng)常如此吐槽。

還真有這么難。

信息部門(mén)先后對(duì)系統(tǒng)硬盤(pán)和內(nèi)存進(jìn)行升級(jí),PACS軟件服務(wù)商也嘗試了6種優(yōu)化方案,網(wǎng)絡(luò)系統(tǒng)甚至已升級(jí)至“萬(wàn)兆骨干、千兆桌面”,但效果都不明顯。“性能瓶頸只能是存儲(chǔ)系統(tǒng),”在逐一排除了可能存在的性能瓶頸之后,醫(yī)院也不得不面對(duì)和解決存儲(chǔ)的性能瓶頸。

在此之前,醫(yī)療PACS影像在線業(yè)務(wù)幾乎都是國(guó)外高端SAN存儲(chǔ),并沒(méi)有三甲級(jí)醫(yī)院將分布式存儲(chǔ)用于在線業(yè)務(wù)的先例。但先例正是從此開(kāi)始,經(jīng)實(shí)際業(yè)務(wù)測(cè)試,霄云科技碧海分布式存儲(chǔ)系統(tǒng)(BOSS),可實(shí)現(xiàn)百億級(jí)文件性能不衰減(100TB的PACS數(shù)據(jù)量約為2億個(gè)文件),將PACS系統(tǒng)的調(diào)圖速度從業(yè)內(nèi)普遍的每秒20~50幅,提高到每秒300幅以上,徹底解決了PACS影像調(diào)圖卡頓的痛點(diǎn)。

“每秒300幅就此成為行業(yè)門(mén)檻。”李小勇說(shuō)。雖然友商也喊出了“每秒300幅”的目標(biāo),但那是下一代產(chǎn)品,霄云科技顯然不用讓用戶等那么久,其成熟產(chǎn)品已經(jīng)在實(shí)際項(xiàng)目中落地驗(yàn)證。

這確是個(gè)技術(shù)問(wèn)題。1995年,Sun公司發(fā)表文章,標(biāo)題為《為什么線程池設(shè)計(jì)是個(gè)很糟糕的想法》;2003年,伯克利大學(xué)也發(fā)表一篇文章,標(biāo)題為《事件驅(qū)動(dòng)是行不通的》。兩篇文章的觀點(diǎn)截然相反,代表決定分布式存儲(chǔ)性能的兩種技術(shù)流派之爭(zhēng):線程池模式與事件驅(qū)動(dòng)模式。

而且兩種技術(shù)流派爭(zhēng)論了20年。“霄云科技也走過(guò)彎路,每一種流派都有過(guò)嘗試,”李小勇說(shuō):“最終霄云科技是將兩種方法結(jié)合,采用‘進(jìn)程池+事件驅(qū)動(dòng)’模式,每顆CPU啟動(dòng)一個(gè)進(jìn)程,每個(gè)進(jìn)程內(nèi)部使用事件驅(qū)動(dòng)模式。”

以“海量小文件聚合優(yōu)化”為例,霄云科技管理文件數(shù)可達(dá)百億,是傳統(tǒng)NAS存儲(chǔ)的100倍,是開(kāi)源軟件Ceph的10倍。最終性能測(cè)試數(shù)據(jù)表明:霄云科技通過(guò)海量小文件聚合優(yōu)化技術(shù),能夠?qū)崿F(xiàn)百億級(jí)文件性能衰減小于5%,性能超過(guò)了傳統(tǒng)及Ceph開(kāi)源存儲(chǔ)。

同行之間才有赤裸裸的信任

正因如此。霄云科技的碧海分布式存儲(chǔ)系統(tǒng)(BOSS),成為目前為數(shù)不多能用于醫(yī)療PACS影像在線業(yè)務(wù)的分布式存儲(chǔ)產(chǎn)品。這可并不是一個(gè)小市場(chǎng),中國(guó)三級(jí)甲等綜合醫(yī)院已經(jīng)超過(guò)1600家,二級(jí)醫(yī)院數(shù)量更為龐大。

僅此應(yīng)用場(chǎng)景,年市場(chǎng)容量就在20億~50億元,而且在如此專(zhuān)業(yè)的應(yīng)用場(chǎng)景中,只有同行之間才有赤裸裸的信任。因?yàn)榭蛻粜湃瓮械谋硶?shū),客戶關(guān)注同行的實(shí)踐。這正是霄云科技捅破的第二層窗戶紙。

目前,霄云科技推出的新一代醫(yī)療PACS影像存儲(chǔ)解決方案,已經(jīng)服務(wù)近30%上海大三甲醫(yī)院,輻射北上廣深及全國(guó)范圍三甲醫(yī)院,包括上海市胸科醫(yī)院、上海市五官科醫(yī)院、復(fù)旦大學(xué)附屬腫瘤醫(yī)院、上海兒童醫(yī)學(xué)中心、上海市華東醫(yī)院、上海市龍華醫(yī)院以及北京、深圳、江蘇、山東、山西、安徽等多家三級(jí)甲等醫(yī)院。

“此后,醫(yī)療大數(shù)據(jù)、醫(yī)療影像云、醫(yī)療云平臺(tái)、金融電子票據(jù)、大數(shù)據(jù)分析等應(yīng)用場(chǎng)景,數(shù)據(jù)量巨大、性能要求高的應(yīng)用場(chǎng)景,都將成為霄云科技的目標(biāo)市場(chǎng)。”李小勇提出了后續(xù)業(yè)務(wù)目標(biāo)。

當(dāng)然,有一點(diǎn)永遠(yuǎn)不會(huì)改變。

“市場(chǎng)就是大浪淘沙。缺乏核心技術(shù)競(jìng)爭(zhēng)力,產(chǎn)品同質(zhì)化,就容易徘徊在低端市場(chǎng),難以盈利,很難有好的發(fā)展前景。而碧海分布式存儲(chǔ)系統(tǒng)(BOSS)在系統(tǒng)架構(gòu)、性能、穩(wěn)定性方面的優(yōu)勢(shì),將使霄云科技有能力在中高端分布式存儲(chǔ)市場(chǎng),占據(jù)一席之地。”李小勇最后說(shuō)。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - 670818.com All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3