I. Điện toán đám mây là gì
Điện toán đám mây – Cloud Computing là mô hình cung cấp tài nguyên máy tính cho người dùng thông qua hệ thống internet. Tài nguyên ở đây có thể hiểu là bao gồm bất cứ thứ gì liên quan đến điện toán và máy chính. Có thể kể đến như: phần mềm, phần cứng, cơ sở hạ tầng mạng, … Và chi phí cho việc sử dụng sẽ tính theo hạn mức tài nguyên được sử dụng.
Nó đã mang đến một giải pháp cho người dùng nhất là các doanh nghiệp trong việc xây dựng và quản lý tài nguyên máy tính. So với việc phải tìm hiểu và đầu tư cho mình một hệ thống về phần cứng, phần mềm và cả hệ thống mạng, đồng thời phải thực hiện kiểm tra khắc phục sao lưu dữ liệu thường xuyên, thì dường như điện toán đám mây có vẻ là một giải pháp ít tốn kém cả về tiền bạc lẫn thời gian công sức.
Với Cloud Computing, tất cả dữ liệu người dùng sẽ được lưu trữ tại các trung tâm dữ liệu và được trích xuất lại cho người dùng cuối cùng khi người dùng có nhu cầu. Đồng thời tại các trung tâm lưu trữ, dữ liệu sẽ được liên tục sao lưu phục hồi nhằm đảm bảo hạn chế các lỗi mất mát dữ liệu nếu có. Nhờ cơ chế này, bạn có thể kết nối vào kho tài nguyên máy tính của doanh nghiệp một cách dễ dàng mà chỉ cần thiết bị đầu cuối như: máy tính bàn, laptop, smartphone, … và kết nối Internet.
II. Điện toán đám mây có những đặc điểm nào?
1.Tự phục vụ nhu cầu (On-demand self-service)
Điện toán đám mây cung cấp cho người dùng một hệ thống cơ sở tài nguyên máy tính với giao diện dễ sử dụng, qua đó giúp người dùng có thể dễ dàng sử dụng và khai thác nguồn tài nguyên này mà không cần sự tương tác của bên thứ ba.
2. Khả năng truy cập mọi lúc mọi nơi (Broad network access)
Chỉ cần có Internet cùng với thiết bị đầu cuối, người dùng có thể truy cập vào nguồn tài nguyên được lưu trữ trên điện toán đám mây bất kể không gian hay thời gian.
3. Co giãn nhanh chóng (Rapid elasticity or expansion)
Trong điện toán đám mây, độ co giãn được hiểu là mức độ mà một hệ thống có thể thích ứng với sự thay đổi khối lượng công việc. Dịch vụ điện toán đám mây cho phép người dùng chủ động thay đổi linh hoạt lượng tài nguyên cần sử dụng theo nhu cầu của mình theo từng thời điểm nhằm tối thiểu hóa chi phí sử dụng tài nguyên.
III. Phân loại điện toán đám mây
Dựa theo mô hình dịch vụ được cung cấp ta có thể chia các dịch vụ thành ba loại sau:
1. Cơ sở hạ tầng như một dịch vụ (IaaS)
Được xem là lớp thấp nhất trong hệ thống phân cấp cung cấp dịch vụ và cung cấp một trung tâm dữ liệu ảo trong đám mây. IaaS cung cấp cho người dùng một hệ thống tài nguyên rất cơ bản – hệ thống máy có hệ điều hành và lưu trữ dưới dạng các dịch vụ được tiêu chuẩn hóa qua mạng.
Nói đơn giản, người dùng sẽ được cung cấp một hệ thống cơ sở hạ tầng hoàn chỉnh. Các nhiệm vụ liên quan đến bảo trì hệ thống sẽ được các nhà cung cấp dịch vụ đám mây đám mây thực hiện. IaaS cung cấp cho người dùng khả năng tùy biến cao nhất trong quá trình sử dụng trong từng nhu cầu cụ thể. Nó có thể được sử dụng như là đám mây chung hoặc riêng. Ví dụ nổi bật nhất của IaaS là Amazon Web Services (AWS).
2. Nền tảng như một dịch vụ (PaaS):
Ngoài IaaS, một số dịch vụ đám mây cung cấp hỗ trợ lớp ứng dụng cho công việc dữ liệu lớn, được gọi là nền tảng như một là dịch vụ (PaaS). So với, IaaS chỉ cung ứng các giải pháp đối với công nghệ phần cứng cơ bản, PaaS còn hỗ trợ các ứng dụng. Phần cứng và phần mềm của các hệ thống máy sẽ được quản lý và hỗ trợ bởi nhà cung cấp nền tảng dịch vụ điện toán đám mây. Giúp người dùng không cần lo lắng về nâng cấp phần cứng va hệ điều hành Một số nhà cung cấp dịch vụ điện toán PaaS nổi tiếng có thể kể đến gồm Windows Azure và Google App Engine.
3. Các ứng dụng hoặc phần mềm như một dịch vụ (SaaS):
Với SaaS tất cả các thiết lập cơ sở hạ tầng cũng như ứng dụng sẽ được đảm nhiệm bởi các nhà cung ứng dịch vụ. Để SaaS hoạt động, cơ sở hạ tầng (IaaS) và nền tảng (PaaS) phải được thực hiện hoàn thiện.Tuy khả năng tùy biến không cao nhưng SaaS tạo cho người dùng một không gian sử dụng thân thiện thích hợp cho người dùng cá nhân. Một số nhà cung cấp dịch vụ SaaS lớn như: Google drive, Salesforce.com, dropbox, …
IV. Ứng dụng trong Big Data
Vậy vai trò của điện toán đám mây trong xu hướng phát triển của big data hiện nay là gì?
Xuất phát điểm của Big Data là đám mây Apache Hadoop – một những nền tảng được sử dụng phổ biến nhất trong công nghệ big data hiện nay. Được nghiên cứu và xây dựng bởi Google, ban đầu công nghệ này được áp dụng trong việc biên soạn các chỉ mục trang Web điều được xem là việc bất khả thi trong hệ thống có sẵn lúc đó. Giờ đây, mọi người áp dụng công nghệ này vào các trung tâm dữ liệu của họ.
Điện toán đám mây và Big Data đã có sự trỗi dậy mạnh mẽ trong những năm gần đây, chúng hỗ trợ và hoàn thiện lẫn nhau một cách hoàn hảo. Bằng cách cung cấp một hệ thống cơ sở hạ tầng được tối ưu hóa và khả năng mở rộng cao, điện toán đám mây đã hỗ trợ rất nhiều trong việc thực tế hóa Big Data. Quá trình phát triển, mở rộng không ngừng của nền tảng điện toán đám mây thúc đẩy sự phát triển của Big Data nhờ vào việc cung cấp khả năng khai thác, lưu trữ và sử dụng các tài nguyên máy tính một cách tối ưu hóa, tiết kiệm và đơn giản.Và các nhu cầu đặt ra trong big data đề ra các bài toán cải thiện và phát triển cho điện toán đám mây. Tiêu biểu những cải tiến gần đây của Apache Hadoop đã cải tiến khả năng cho phép một lượng lớn công việc được chia sẻ và xử lý trong cùng một cluster. Nghĩa là người dùng sẽ có khả năng thực hiện nhiều dạng kiến trúc trên cùng một Hadoop cluster, còn cluster này sẽ được khởi chạy trên một kiến trúc đám mây. Có thể thấy, big data tạo ra nhu cầu phát triển cho điện toán đám mây nhiều dịch vụ chuyên dụng phục vụ cho việc khả năng lưu trữ, phân tích và xử lý những dữ liệu lớn.
Sự kết hợp giữa Big Data, điện toán đám mây cùng với các thuật toán, kỹ thuật hiện đại đã làm tang tính khả thi cho hoạt động phân tích hội tụ-phân tích trên tệp dữ liệu từ nhiều nguồn khác nhau. Việc kết nối và quản lý các hệ thống dữ liệu này đã và đang ngày càng hoàn thiện trong các hệ thống dịch vụ IaaS. Tuy nhiên, vẫn còn tồn tại một sự mâu thuẫn giữa mong muốn phân tích hội tụ và điện toán đám mây, bởi điện toán đám mây cung cấp khả năng chia sẻ dữ liệu đến nhiều thiết bị đầu ra trong khi phân tích hội tụ lại đặt ra nhu cầu kiểm soát bảo mật cá nhân và bảo mật dữ liệu dữ liệu chặt chẽ hơn.
Tóm lại, Digalyst thấy rằng điện toán đám mây đã và đang là bệ phóng vững chắc cho sự phát triển của big data, là nền tảng và cơ sở để big data có thể đi xa hơn và sâu hơn khi áp dụng và thực tiễn. Đồng thời, cũng có sự tương tác ngược lại từ big data đòi hỏi sự phát triển cải tiến không ngừng của điện toán đám mây nhằm đáp ứng các nhu cầu thực tiễn.