北京軟開發公司IT行業日新月異的發展有目共睹,然而有一個市場卻一直保持著穩定而緩慢的發展腳步——存儲。相對於其他産品,存儲的技術門檻更高,無論是數據安全性、可恢複性、高可用性以及管理性,都要比其它的IT産品複雜的多。

然而随著(zhe)近幾年互聯網的不斷壯大,特别是雲計算、大數據等技術的沖擊下,存儲領域也開始發生颠覆性變革,那就是介質的變化。業務互聯網化、雲化的需求越來越明顯,企業對於(yú)存儲的要求不再局限於(yú)處理的速度、容量和可靠性,而是能爲數據中心帶來較優效率、靈活性、規模、成本和數據保護的存儲解決方案。這些都使傳統存儲越來越無力招架,企業開始将希望寄於(yú)軟件定義技術。2015 年年中,傳統存儲行業老大EMC 被服務器廠商 DELL 收購爲這場技術變革奠定重要的裏程碑。
與此同時,傳統虛拟化廠家 VMware 也推出 VSAN 來替代昂貴且過時的集中式存儲設備(bèi)。以可彈性擴展、更易用的存儲解決方案,降低數據中心的整體擁有成本。但VSAN的本質是SAN存儲,提供的是“塊”接口的數據存儲功能,不提供NFS服務。爲瞭(le)滿足虛拟機中需要文件共享的需求,大多數情況下需要在單個虛拟機中部署NFS服務,這種集中式的部署方式無法充分利用VSAN的橫向擴展性能。
爲瞭(le)豐富VSAN存儲方案,VMware與以軟件定義存儲技術見長的達沃時代合作,由其開發VNAS提供並(bìng)行文件服務。在接受51CTO記者採訪時,達沃時代副總裁、CTO雷迎春博士介紹瞭(le)VNAS與VSAN的協作方式,剖析瞭(le)分布式文件系統的開發難度何在,同時也展望瞭(le)他眼中的軟件定義技術發展趨勢。
VNAS:軟(ruǎn)件定義的分布式並(bìng)行NAS
VNAS是運行在VMware虛拟中的一種NAS虛拟化服務,它的部署非常簡單,利用VSAN虛拟出來的硬盤,通過VMware的vSphere一鍵操作即可完成部署。其核心是達沃自主研發的分布式文件系統YeeFS,對外提供标準的NFS/CIFS接口,以及集群式NAS服務。由於(yú)它與VSAN運行在同一個宿主機上,即使VMs遷移瞭(le),還是可以實現對StorgeVM的就近訪問,與VMs位置無關。另外,通過創新數據調度等技術,VNAS提供全活集群的保障機制,因此當本地StorgeVM故障時,VMs仍可以通過其他Host上的StorgeVM繼續訪問相關數據。當然,VNAS對故障的判斷,需要VSAN提供相應的物理資源信息。

除标準的NFS/CIFS接口外,VNAS也爲客戶提供私有協議支持,爲應用提供符合工業标準的Posix接口。運行在Windows、Linux操作系統之上的應用軟件都不需要更改即可訪(fǎng)問。通過選擇私有協議的方式,避免不必要的協議處(chù)理,提升系統的可用性和可靠性。
爲瞭(le)使大家進一步明確(què)VNAS對VSAN性能的補充,雷迎春以具體應用實例來加以說明。比如,雖然VSAN本身有Hadoop解決方案,但Hadoop的底層是HDFS文件接口,VNAS允許新增HDFS接口,從而更好地支持Hadoop應用在VSAN環境下的運行。
分布式存儲(chǔ)的核心在於(yú)共享
國内提供分布式存儲服務的廠商並(bìng)不少見,達沃作爲一家成立隻有五年的初創型公司,究竟憑借什麽獲得VMware的青睐呢?雷迎春認爲,除瞭(le)利於VMware在中國本土環境下的業務擴展,更重要的是達沃在存儲領域,特别是分布式文件系統研發方面有較爲領先的技術優勢。
雷迎春談到,國内存儲廠商中提供“塊”存儲服務的居多,真正自主研發分布文件系統的服務商還是很少見的。市場上見到的一些分布式文件存儲産(chǎn)品,也基本是基於(yú)GlusterFS、CephFS等開源系統。但對於(yú)企業存儲來說,可靠性永遠是第一位的,因此在缺少足夠技術維護人員的情況下,開源存儲系統較難投入到企業真正的生産(chǎn)環境當中。
雷迎春進一步分析到,分布式文件系統的研發難度較大。很多應用都依賴於(yú)文件系統提供的原子語義,這就要求分布式文件系統在保證性能的前提下,還需要使許多文件操作具有原子語義。例如,創建文件這個簡單操作就需要原子完成,要麽成功,要麽失敗(bài),不允許中間過程,否則,系統就不一緻,或者存在垃圾資源。
在雲計算帶來的變(biàn)革下,未來應用部署的主流形式将主要集中在Docker和虛拟機中。“塊”存儲技術解決瞭(le)盤陣的問題,但應用上雲後,應用和應用間共享數據時,文件是一種常用的方式。對名字空間進行虛拟化和統一,完成對海量數據的統一管理和共享。
應用定義存儲(chǔ)是重要的趨(qū)勢之一
採(cǎi)訪較後雷迎春談到,存儲和應用的耦合效力、耦合的好壞,會直接影響應用的使用和效能。另一方面,不同的應用對於(yú)存儲有不同的需求。例如,在傳統的三層架構下,應用與存儲間是分離的,它們之間一般通過iSCSI或NFS标準協議溝通。而在超融合架構下,VSAN通過嵌入到vSphere框架實現應用和存儲的直接溝通,獲得較好的性能和可靠性。應用定義的存儲應該是存儲發展的一個重要趨勢。
現在大家都在談論數據智能化,雷迎春認爲數據分析是其中重要的一方面,還有一個可以嘗試的方面是對數據語義的理解,挖掘數據之間的關系,進而影響數據在物理介質上的部署方式,改善存儲性能。當然,做好這個工作的前提之一是需要對應用有一定的理解。未來達沃将專注於(yú)解決存儲和應用的結合問題,通過應用超強的可調整性與存儲進行良好的耦合,存儲努力地配合應用的需求,使應用開發者可以不用過多地關注存儲層(céng)面而把更多的精力放在業務層(céng)面。