資料儲存遷移和混合雲端儲存訪問

大部分希望遷移到雲端的公司,都需要在開始遷移時首先評估現有的儲存基礎結構。為了更有效地評估現有儲存基礎結構,有必要了解如何將現有儲存裝置對映為不同的 Amazon Web Services (AWS) 儲存服務。為此必須花費時間明確目前的資料是如何儲存,以及儲存在哪裡,隨後才能以此為依據將現有工作負載和儲存基礎結構遷移至 AWS 儲存服務。

本文將對比 AWS 儲存和本地儲存的儲存模式,以幫助客戶將現有模式與 AWS 儲存服務豐富的產品組合相互匹配。此外本文還將提供儲存模式決策矩陣,藉此加快多樣化的應用程式和工作負載需求遷移到 AWS 時的決策過程。

為何遷移到雲端?

AWS 在幫助企業遷移上雲這方面已經積累了超過 14 年的經驗。將儲存工作負載遷移到雲端一直是 CIO 們解決以下優先戰略要務的主要方式之一:

提高業務敏捷度

加快創新速度

增強安全性

降低成本

遷移上雲的企業可以變得更敏捷,因為他們可以靈活地擴充套件各類資源,以滿足獨特的業務需求。藉助大規模分析能力和機器學習技術,我們可以消除資料孤島並從資料中獲得更多價值,藉此加速現代化革新之旅。在消除了資料孤島並應用更高階的加密控制能力後,企業可以在發現更多的資料價值的同時改善資料的安全性。

AWS 使用者可以直接獲得專為對安全性要求最嚴格的企業所打造的全部控制、工具以及認證。最後,由於可以獲得更靈活的購買模式,避免儲存裝置過度配置,裝置升級換代以及維護儲存基礎架構的支出,企業還可以進一步降低成本。相比本地部署模式,雲端儲存提供了數不勝數的價值,並能有效解決 CIO 最關注的問題。

AWS 儲存服務全解

圖1:儲存利用率對比

圖 1 對比了本地儲存系統以及使用 AWS 儲存服務在資本投入方面的需求,使用 AWS 服務時,客戶只需要為實際使用的資源付費。在本例中,客戶需要購買 1PB 原始儲存容量併為此付費。但在組建 RAID 陣列並格式化後,排除掉檔案系統本身的開銷併為未來增長留出餘量後,資料實際佔用的容量僅為 400TB。對於大部分 AWS 儲存服務(例如 Amazon EFS 和 Amazon S3),客戶只需要為自己實際使用的 400 TB 容量付費;或者(如果使用 Amazon EBS 和 Amazon FSx for Windows File Server,則)只需要為實際分配的 600TB 容量付費。

典型的本地儲存模式

典型的本地儲存模式包括光纖通道 FC SAN 儲存、iSCSI SAN 儲存、網路附加儲存(NAS)以及物件儲存。本節將簡要介紹不同的本地資料儲存技術,並分析客戶在滿足應用程式和使用者資料的儲存需求時所建立的工作負載模式

光纖通道(FC)SAN 儲存

SAN 是一種儲存網路技術,可透過專用高速光纖通道網路共享塊儲存資源。此外,光纖通道協議(FCP)是 SCSI 協議在光纖通道網路上的對映。最重要的是,SCSI 命令和資料塊會封裝為 FC 幀,並透過光纖網路/設施進行傳輸。通常來說,使用 FC SAN 的應用程式包括 ERP、CRM、SAP、SQL、Oracle、DB2、MSSQL 等。

iSCSI SAN 儲存

iSCSI 則是一種可以透過 IP 網路共享儲存資源的儲存網路技術。通常來說,透過 iSCSI SAN 共享的儲存資源往往是磁碟資源,不過 iSCSI 是 SCSI 協議在 TCP/IP 上的對映。

SCSI 協議還可以透過類似的方式對映至其他傳輸機制,例如光纖通道 FC,因此理論上,任何 SCSI 裝置都可以透過 iSCSI SAN 共享。通常來說,使用 FC SAN 的應用程式也可以使用 iSCSI,只不過此時會使用 IP 網路基礎結構進行資料傳輸(例如 ERP、CRM、SAP、SQL、Oracle 等)。

網路附加儲存(NAS)

NAS 檔案系統是一種共享的檔案儲存資源,通常代表了非結構化資料或檔案儲存。對於 Linux 工作負載,這些檔案系統通常會使用諸如 Network File Storage(NFS)等協議;對於 Windows 工作負載的資料共享,這些檔案系統往往會使用 Server Message Block(SMB)或 Common Internet File System(CIFS)協議。NAS 儲存通常被用於儲存諸如共享資料夾以及文件庫等可供使用者和應用程式訪問的檔案資料。

根據

http://

SNIA。org

(儲存網路行業聯盟)的介紹:

“NAS 代表連線到網路,為計算機系統提供檔案訪問服務的儲存裝置。”此類 NAS 裝置通常會使用元資料和用於儲存資料的檔案/資料夾層次結構來實現檔案服務。NAS 客戶端可使用標準化的協議(如 NFS 或 SMB/CIFS)訪問 NAS 裝置所儲存的資料。企業可以將 NAS 裝置作為一種高效、低成本、可擴充套件的儲存解決方案。NAS 儲存主要可用於支撐郵件系統、財務資料庫、薪酬系統、影片錄製和編輯、資料日誌、業務分析等應用。

物件儲存

物件儲存可供使用者以原生格式儲存資料,因此任何型別的資料都可儲存在物件儲存內。物件通常可透過一個很長(如 64 位)的唯一識別符號加以區分,該識別符號是由物件內容派生並附加某種雜湊機制得到的。通常來說,物件會儲存到一個單一的大型平面名稱空間中,不具備傳統檔案系統那樣的層次結構或樹狀結構。這種單一的大型平面的名稱空間使得物件儲存系統與生俱來地具備了極大的可擴充套件性。物件儲存裝置(OSD)可透過諸如 REST、SOAP 和 XAM 等 API 操作訪問。

根據

http://

SNIA。org

的介紹:

“物件儲存是在磁碟上組織資料的第三種主要方式。物件可透過物件 ID 或鍵-值進行定址,而不是按照位元組組織成檔名進行定址,或組織為塊並透過塊編號定址。我們可以透過物件 ID(也可以使用金鑰)訪問指定的物件,隨後即可獲得返回的資料。這些資料長度任意,可以是零位元組,或者極大的位元組數。”

AWS 儲存服務全解

圖 2:本地儲存決策矩陣

圖 2 展示了本地使用者和應用程式訪問並連線資料儲存的不同方式。在上文列舉的例子中,應用程式可透過受支援的協議使用 SAN、NAS 或物件儲存。但在效能、安全性和可擴充套件性方面,應用程式可支援的訪問協議將成為決定在後端使用哪種儲存型別(SAN、NAS、物件)的關鍵,因為每種儲存訪問協議都有各自的優勢與侷限。

AWS 儲存服務模式

本節將簡要介紹主要的 AWS 儲存服務,以及這些儲存服務如何替代部署在客戶本地資料中心的儲存裝置。

Amazon Elastic Block Store(Amazon EBS)

Amazon EBS 是一種易於使用的高效能塊儲存服務。Amazon EBS 專為 Amazon EC2 中執行的任意規模吞吐率密集型和事務密集型工作負載設計。關係和非關係資料庫,企業應用程式,容器化應用程式,大資料分析引擎,檔案系統和媒體工作流等各種工作負載已廣泛部署在 Amazon EBS 上。

Amazon EBS 適用於原本在本地環境使用 iSCSI 或 FC SAN 儲存陣列的應用程式工作負載。

Amazon Elastic File System(Amazon EFS)

Amazon EFS 提供了一種簡單、可擴充套件、完全託管的彈性 NFS 檔案系統,可供 AWS 雲服務和本地資源使用。在設計上,該服務可在不影響應用程式執行的前提下按需擴充套件至 PB 級規模,可隨著檔案的新增和移除自動擴充套件或收縮,使用者無需為了適應未來增長而預配並管理容量。Amazon EFS 是一種區域性服務,可提供個位數毫秒級別的延遲,同時在至少三個可用區中儲存資料,其永續性設計為 99。999999999%(11個9)。

Amazon EFS 適用於原本在本地環境使用基於 NFS 協議的 NAS 儲存陣列的應用程式和使用者工作負載。

Amazon FSx for Windows File Server

重要通知

:Amazon FSx for Windows File Server 及Amazon FSx for Lustre 現已在由光環新網運營的 Amazon Web Services (AWS) 中國(北京)區域和西雲資料運營的 AWS 中國(寧夏)區域推出。

關於 Amazon FSx 新服務的更多資訊,推薦大家參閱:

還在煩惱如何部署檔案儲存?瞧,您的高效能儲存神器已上線!

Amazon FSx for Windows File Server 提供了完全託管的高可靠、可擴充套件檔案儲存,可透過符合行業標準的 SMB 協議訪問。該服務基於 Windows Server 構建,提供了豐富的管理功能,例如使用者配額、終端使用者檔案還原以及與 Microsoft Active Directory 的整合。該服務提供了單一 AZ 和多 AZ 部署選項、完整的託管備份,以及對傳輸中和儲存後的資料進行加密的能力。Amazon FSx 檔案儲存可透過 Windows、Linux 和 macOS 計算例項以及執行在 AWS 或本地的裝置訪問。使用者可以使用 SSD 和 HDD 儲存選件來最佳化成本和效能,以滿足工作負載需求。

AWS 儲存服務全解

圖 3:Amazon FSx for Windows File Server功能

圖 3 著重展示了 FSx for Windows File Server 的功能,及其對各種協議、作業系統、計算、網路、可用性、永續性、備份、效能、可擴充套件性、成本最佳化、安全性以及合規性等方面的支援情況。Amazon FSx for Windows File Server 適用於原本在本地環境使用基於 CIFS/SMB 協議的 NAS 儲存陣列的應用程式和使用者工作負載。

Amazon Simple Storage Service(Amazon S3)

Amazon S3 是一種物件儲存服務,提供了業內領先的可擴充套件性、資料可用性、安全性以及效能。這些能力使得客戶能夠儲存和保護任意數量的資料,並將資料用於各種型別的用途,如網站、移動應用程式、備份和還原、歸檔、企業應用程式、IoT 裝置,以及大資料分析等。Amazon S3 提供了易於使用的管理功能,使用者可以藉此整理自己的資料,並配置可細化調整的訪問控制機制,以滿足特定的業務、組織或合規要求。Amazon S3 的設計永續性為99。999999999%(11個9),目前已被全球大量企業的數以百萬計企業應用程式所使用。

Amazon S3 針對不同用例提供了豐富的儲存類。例如針對頻繁訪問資料的常規用途儲存所提供的 S3 Standard;針對訪問模式未知或頻繁變化的資料所提供的 S3 Intelligent-Tiering;為需要長期儲存,需要輕鬆重建但訪問頻率較低的資料所提供的S3 Standard-Infrequent Access(S3 Standard-IA)和 S3 One Zone-Infrequent Access(S3 One Zone-IA);以及為長期歸檔和數字化保留所提供的 Amazon S3 Glacier 和 Amazon S3 Glacier Deep Archive。Amazon S3 還提供了資料全生命週期管理功能。在設定 S3 生命週期策略後,資料即可被自動轉移至不同的儲存類,而這一過程中完全不需要對應用程式進行任何改動。

Amazon S3 適用於基於本地物件儲存和很多基於檔案儲存陣列構建的應用程式和使用者工作負載。

AWS 儲存服務全解

圖 4:AWS 儲存模式決策矩陣

圖 4 展示了已經遷移至 AWS,或雲原生應用程式的儲存決策矩陣。在該決策矩陣中,工作負載對儲存訪問協議、效能以及可擴充套件性的要求扮演了重要角色。此外,對於本地應用程式,大部分 AWS 儲存服務都可在本地環境透過低延遲 AWS Direct Connect 或 VPN 連線的方式訪問。

資料儲存遷移和混合雲端儲存訪問

AWS 使用者可透過多種選項將本地資料儲存遷移至 AWS。下文將介紹透過 AWS DataSync 進行的線上遷移,以及透過 AWS Snow Family 服務進行的離線儲存遷移。

適用於線上儲存遷移的AWS DataSync

AWS DataSync 可以幫助使用者在本地儲存以及 Amazon S3、Amazon EFS 或Amazon FSx for Windows File Server 之間快速、簡單地線上移動大量資料。與資料傳輸有關的手工任務可能大幅拖累遷移進度並增加 IT 負擔,DataSync 則能省略或自動處理大部分此類任務,包括指令碼複製作業、排程、傳輸監視、資料驗證以及網路利用率最佳化。DataSync 軟體代理可連線到 NFS 和 SMB 儲存,因此使用者完全無需更改應用程式。

AWS DataSync 能夠藉助網際網路或 AWS Direct Connect 鏈路,以最多十倍於傳統開源工具的速度順利傳輸數百 TB 以及上百萬的檔案。使用者可以使用 DataSync 遷移活躍資料集或將其歸檔至 AWS,將資料傳輸到雲端以進行及時分析和處理,或將資料複製到 AWS 以保障業務連續性。

適用於離線儲存遷移的AWS Snow Family

AWS Snow Family 包括 AWS Snowcone、AWS Snowball 以及 AWS Snowmobile。AWS Snowcone和AWS Snowball 是一種小巧堅固但非常安全的可移動儲存與邊緣計算裝置,可用於資料收集、處理和遷移等工作。這些裝置在設計上專門面向網路頻寬受限或不具備網路連線的邊緣位置,能夠在嚴苛的環境中提供儲存和計算能力。AWS Snowmobile 則是一種 EB 級規模的資料傳輸服務,可用於將海量資料(包括影片庫、圖片倉庫,甚至完整的資料中心內容)遷移到雲端。藉助AWS Snowcone與 AWS DataSync 的整合,使用者可以從邊緣位置進行線上資料遷移。

透過 AWS Storage Gateway 實現混合雲端儲存訪問

除了 VPN 連線,使用者還可以利用現有的 AWS Direct Connect 從本地資料中心訪問自己在 AWS 中的資料。AWS 透過 AWS Storage Gateway 為不同型別的資料訪問模式提供了豐富的選項,以及本地快取功能,可以更快地讀寫最常訪問的資料。

AWS Storage Gateway 是一種混合雲端儲存服務,可供使用者從本地訪問幾乎無限量的雲端儲存空間。使用者可以使用 Storage Gateway 簡化儲存管理工作並降低關鍵的混合雲端儲存用例的相關成本。例如將備份轉移到雲端,在本地使用由雲端儲存支撐的檔案共享,為本地應用程式提供 AWS 中資料的低延遲訪問途徑。

下列儲存模式示意圖展示了混合雲端儲存的訪問模式:

AWS 儲存服務全解

圖 5:混合儲存模式決策矩陣

圖 5 展示了需要繼續保留在本地的應用程式的儲存模式決策矩陣。這些應用程式在利用本地讀/寫快取以極低延遲訪問活躍工作集的同時,同樣可以獲得雲平臺所提供的各項收益。圖5還展示了應用程式或使用者利用首選儲存協議訪問本地儲存的工作集資料時對應的決策矩陣。這種情況下,可在幾分鐘內獲得幾乎不受限制的雲端儲存空間擴充套件能力。

在圖 5 所示的決策矩陣中,工作負載的儲存訪問協議、效能要求以及可擴充套件性要求扮演了關鍵角色。該決策矩陣還涉及了其他一些用例,例如藉助 AWS Storage Gateway 的Tape Gateway 對長期儲存的備份進行分層儲存(用以取代磁帶備份技術),將其儲存到 Amazon S3 的歸檔層中。

結論

無論使用者需要從零開始進行遷移或需要把突發工作負載遷移至雲端,AWS 提供了能在這一過程的每個環節提供幫助的服務。在從本地儲存環境遷移至雲端解決方案後,組織將變得更敏捷,更具創新性。將本地資料儲存遷移至 AWS 儲存服務還可能幫助組織改善可擴充套件性與安全性,並降低基礎結構成本。

越來越多的企業 IT 管理者開始意識到 AWS 可以幫助自己以前所未有的方式,更安全地駕馭新的工作流程和服務。例如 TransferWise,這家 AWS 客戶利用 AWS Storage Gateway、Amazon EBS 和 AWS Backup 輕鬆地在 AWS 平臺上遷移並管理資料庫和備份。藉助 Amazon Relational Database Service(Amazon RDS)和 Amazon EC2,TransferWise 已經將數百個資料庫遷移至 AWS。此外,TransferWise 還解決了本地環境的可擴充套件性問題,透過遷移至 AWS 更好地觸及遍佈全球的客戶。

“透過使用 AWS,我們可以在需要的時間和地點快速獲得所需的計算和儲存資源,這樣的速度比以往任何時候更快。AWS可以幫助我們更好地推進全球擴張戰略。”

如果希望更進一步瞭解本文所涉及的產品,建議部署 DataSync 代理並將測試工作負載遷移至 AWS 儲存服務,藉此可以測試上文提到的任何服務,並測試自己的運維、安全和效能要求。如果您正在尋找更多的資源希望將基於檔案儲存的應用程式遷移到 AWS,請訪問我們的遷移至託管檔案儲存資源頁面。