Các Loại Instance và Mô Hình Giá Amazon EC2 cho Nhiều Workload Khác Nhau

Amazon EC2 thường được mô tả như một máy ảo trên đám mây, nhưng cách mô tả này quá đơn giản so với cách nó thực sự được vận hành trong các hệ thống thực tế. EC2 cung cấp nhiều loại instance và mô hình giá khác nhau, và các quyết định ở tầng này ảnh hưởng trực tiếp đến hiệu suất, độ tin cậy và chi phí. Trước khi triển khai các workload production trên AWS, điều quan trọng là phải hiểu cách các thành phần này kết hợp với nhau.

1. Amazon EC2 trong Bối Cảnh Điện Toán Đám Mây

1.1 EC2 là gì?

Amazon EC2 (Elastic Compute Cloud) là dịch vụ điện toán cốt lõi của Amazon Web Services, cung cấp các máy chủ ảo có khả năng cấu hình linh hoạt trên đám mây. EC2 cho phép người dùng cấp phát tài nguyên compute theo nhu cầu, với quyền kiểm soát trực tiếp đối với CPU, bộ nhớ, lưu trữ và network.

Thay vì chỉ cung cấp một máy ảo "tiêu chuẩn" duy nhất, EC2 cung cấp compute dưới dạng một hệ thống linh hoạt có thể thích ứng với các yêu cầu workload khác nhau. Đây là lý do EC2 đóng vai trò nền tảng cho nhiều dịch vụ AWS cấp cao và các kiến trúc đám mây tùy chỉnh.

Các workload điển hình thường chạy trên EC2 bao gồm:

Ứng dụng web và các dịch vụ backend
Máy chủ cơ sở dữ liệu như MySQL, PostgreSQL và MongoDB
Máy chủ proxy và các thành phần cân bằng tải
Môi trường phát triển, kiểm thử và staging
Xử lý batch và các workload tính toán khoa học
Máy chủ game và ứng dụng xử lý media

Giá trị của EC2 không nằm ở việc nó có thể chạy được những gì, mà ở cách nó có thể được định hình chính xác để phù hợp với đặc điểm workload.

1.2 Các Thành Phần Cốt Lõi của EC2

Về bản chất, một môi trường EC2 bao gồm ba khối xây dựng có liên kết lỏng lẻo: AMIs, EBS volumes và Security Groups. Sự tách biệt này là có chủ đích. Nó cho phép khả năng tính toán, lưu trữ và chính sách mạng phát triển độc lập thay vì bị khóa cứng vào một cấu hình máy chủ duy nhất.

AMIs xác định cách các instances được tạo và tái tạo, EBS cung cấp lưu trữ bền vững tồn tại sau khi thay thế instance, và Security Groups thực thi các ranh giới mạng mà không yêu cầu khởi động lại instance. Kết hợp lại, các thành phần này làm cho môi trường EC2 có thể tạo mới và thay thế dễ dàng, lặp lại và dễ dàng tự động hóa—những phẩm chất thiết yếu cho việc mở rộng quy mô và vận hành hệ thống một cách đáng tin cậy trên đám mây.

1.3 EC2 Trong Hạ Tầng AWS

EC2 hoạt động trong các AWS Regions, mỗi region chứa nhiều Availability Zones. Một Availability Zone là một đơn vị hạ tầng biệt lập với nguồn điện, mạng và phần cứng vật lý riêng. Các EC2 instances và EBS volumes được gắn kèm luôn được đặt trong một Availability Zone duy nhất. Thiết kế này hướng đến việc xây dựng hệ thống dựa trên dự phòng và tự động hóa thay vì dựa vào độ tin cậy của từng máy chủ riêng lẻ. Do đó, các hệ thống EC2 được xây dựng để chịu đựng sự cố và phục hồi thông qua việc mở rộng và thay thế tự động, thay vì can thiệp thủ công.

Trong mô hình này:

Các EC2 instance và EBS volumes được đặt trong một Availability Zone duy nhất
Tính sẵn sàng cao đạt được bằng cách phân phối các instance trên nhiều zones
AMIs có thể được sao chép qua các regions để hỗ trợ khôi phục thảm họa
Auto Scaling Groups được sử dụng để duy trì capacity mong muốn một cách tự động

2. Hiểu Về Các Loại EC2 Instance (Cách Đọc và Lựa Chọn)

2.1 Cách Đặt Tên Instance EC2

Trong Amazon EC2, một loại instance đại diện cho một tổ hợp cố định của CPU, bộ nhớ, băng thông mạng và hiệu suất đĩa. Những đặc điểm này được mã hóa trực tiếp trong tên instance thay vì mô tả riêng lẻ.

Định dạng tên tuân theo một cấu trúc nhất quán:

c7gn.2xlarge

││││ └─ Kích thước instance (nano, micro, small, medium, large, xlarge, 2xlarge, ...)

│││└────── Tùy chọn tính năng (n = network optimized, d = NVMe SSD)

││└──────── Tùy chọn processor (g = Graviton, a = AMD)

│└───────── Generation

└────────── Instance family (c = compute, m = general, r = memory, ...)

Mỗi phần của tên truyền đạt một lựa chọn kỹ thuật cụ thể thay vì một thứ hạng hiệu suất.

Ví dụ:

c7gn.2xlarge: compute-optimized instance, generation 7, Graviton-based, network-optimized, size 2xlarge
m6i.large: general-purpose instance, generation 6, Intel-based, size large
r5d.xlarge: memory-optimized instance, generation 5, with local NVMe storage

2.2 Các Khía Cạnh Cốt Lõi Của Một Instance EC2

Vậy tại sao EC2 có nhiều loại instance như vậy? Các workload khác nhau gây áp lực lên các tài nguyên hệ thống khác nhau, điều này làm cho một cấu hình instance duy nhất trở nên kém hiệu quả trên tất cả các trường hợp sử dụng. Bởi vì các nhu cầu tài nguyên này mở rộng độc lập và có cấu trúc chi phí khác nhau, EC2 cung cấp nhiều instance families thay vì buộc tất cả workload vào một loại máy tổng quát duy nhất.

Mỗi loại instance EC2 được xác định bởi một số ít các khía cạnh kỹ thuật ảnh hưởng trực tiếp đến hành vi workload. Các instance family được thiết kế để tối ưu cho những tổ hợp tài nguyên khác nhau của những khía cạnh này thay vì cung cấp các máy "mạnh hơn" một cách dần dần.

Đặc điểm compute, bao gồm kiến trúc CPU và hồ sơ hiệu suất
Dung lượng bộ nhớ và tỷ lệ bộ nhớ trên vCPU
Mô hình lưu trữ, sử dụng storage gắn qua mạng hoặc local instance storage
Băng thông mạng và đặc điểm hiệu suất

3. Các Danh Mục EC2 Instance và Ánh Xạ Workload

Một khi bạn hiểu cách đặt tên các loại instance, câu hỏi tiếp theo là làm thế nào để chọn danh mục phù hợp cho một workload cụ thể.

3.1 General Purpose Instances: Workload Cân Bằng

General purpose instances được thiết kế cho các workload không có nút thắt hiệu suất rõ ràng. Trong những trường hợp này, việc sử dụng CPU, bộ nhớ và mạng có xu hướng tăng cùng nhau thay vì bị chi phối bởi một tài nguyên duy nhất.

M-Series (M5, M6i, M6a, M7i)

Tỷ lệ cân bằng giữa compute, bộ nhớ và mạng
Thường được sử dụng cho web servers, microservices, backend services và các database nhỏ

T-Series (T3, T4g)

Hiệu suất CPU burstable dựa trên mô hình credit
Phù hợp cho môi trường phát triển, websites lưu lượng thấp và các batch workloads không liên tục
Hiệu quả chi phí cho các workload không cần CPU chạy liên tục ở mức cao

3.2 Compute Optimized Instances: Workload Giới Hạn Bởi CPU

Khi hiệu suất ứng dụng bị giới hạn chủ yếu bởi khả năng xử lý của CPU thay vì bộ nhớ hoặc I/O, compute optimized instances trở thành lựa chọn phù hợp hơn. Compute optimized instances nhắm đến các workload nơi hiệu suất CPU cao và nhất quán là yếu tố giới hạn, chẳng hạn như xử lý batch, phân phối quảng cáo, mã hóa video, gaming, mô hình hóa khoa học, phân tích phân tán và machine learning inference dựa trên CPU.

C-Series (C5, C6i, C7i)

Processors hiệu suất cao được tối ưu hóa cho các tác vụ chuyên sâu về compute
Các trường hợp sử dụng điển hình bao gồm:
- Web servers thông lượng cao như Nginx hoặc Apache dưới tải nặng
- Các workload tính toán khoa học như mô phỏng Monte Carlo và mô hình hóa toán học
- Xử lý batch quy mô lớn và các ETL jobs
- Máy chủ game multiplayer thời gian thực
- Các workload transcoding và streaming media

Đặc điểm hiệu suất:

Lên đến 192 vCPUs trên các instance sizes lớn (ví dụ: c7i.48xlarge)
Băng thông bộ nhớ cao so với số lượng vCPU
Enhanced networking với băng thông lên đến 200 Gbps
Tùy chọn local NVMe SSD storage trên các biến thể được chọn

3.3 Memory-Optimized Instances: Workload Giới Hạn Bởi Bộ Nhớ

Memory-optimized instances được thiết kế cho các workload nơi hiệu suất bị giới hạn bởi dung lượng bộ nhớ hoặc tốc độ truy cập bộ nhớ thay vì throughput CPU. Các instances này thường được sử dụng cho các open-source databases, in-memory caches và các hệ thống phân tích thời gian thực yêu cầu các tập dữ liệu làm việc lớn phải nằm trong bộ nhớ.

R-Series (R5, R6i, R7i)

Tỷ lệ bộ nhớ trên vCPU cao, lên đến 1:32
Các trường hợp sử dụng điển hình bao gồm:
- In-memory data stores như Redis và Memcached
- Các nền tảng phân tích thời gian thực như Apache Spark và Elasticsearch
- Các databases hiệu suất cao bao gồm SAP HANA và Apache Cassandra

X-Series (X1e, X2i)

Dung lượng bộ nhớ cực lớn với tỷ lệ bộ nhớ trên vCPU lên đến 1:128
Các trường hợp sử dụng điển hình bao gồm:
- Các workload enterprise như SAP Business Suite và Microsoft SQL Server
- Các hệ thống xử lý dữ liệu quy mô lớn như Apache Hadoop và Apache Kafka
- Các workload phân tích in-memory yêu cầu footprint RAM rất lớn

3.4 Accelerated Computing Instances: Workload GPU và Hardware-Accelerated

Khi các workload yêu cầu xử lý song song vượt quá những gì CPUs có thể cung cấp hiệu quả, GPU-accelerated instances trở nên phù hợp. Accelerated computing instances được sử dụng cho các workload dựa vào GPUs cho training, inference, rendering đồ họa hoặc các hình thức hardware acceleration khác, bao gồm các ứng dụng generative AI như trả lời câu hỏi, tạo hình ảnh, xử lý video và nhận dạng giọng nói.

Instance Family	Mục Đích Chính	Tối Ưu Cho	Các Trường Hợp Sử Dụng Điển Hình
P-Series (P3, P4, P5)	Machine learning training	Tính toán song song quy mô lớn	Training các neural networks lớn (LLMs, CNNs) Nghiên cứu AI/ML với PyTorch và TensorFlow Tính toán khoa học (động lực học phân tử, mô hình hóa khí hậu)
G-Series (G4, G5)	Graphics & ML inference	Rendering thời gian thực và các workloads độ trễ thấp	Các nền tảng game streaming Transcoding và rendering video thời gian thực Virtual workstations cho CAD và 3D modeling

3.5 Storage Optimized Instances: Workload Giới Hạn Bởi I/O

Trong một số hệ thống, hiệu suất không phụ thuộc vào CPU hoặc bộ nhớ chút nào. Nút thắt hiệu suất thường nằm ở độ trễ disk hoặc thông lượng I/O. Storage optimized instances được xây dựng đặc biệt cho các workload nơi việc truy cập disk nhanh và nhất quán là rất quan trọng. Các instances này dựa vào local storage thay vì network-attached volumes. Chúng thường được sử dụng trong các hệ thống thực hiện khối lượng lớn reads và writes hoặc xử lý dữ liệu trực tiếp từ disk.

I-Series (I3, I4i)

Instance storage được xây dựng trên NVMe SSDs với hiệu suất I/O ngẫu nhiên rất cao
Các trường hợp sử dụng điển hình:
- Distributed databases như Apache Cassandra và MongoDB sharded clusters
- Search và indexing engines như Elasticsearch với các workloads ghi nặng
- Cache layers yêu cầu persistence

D-Series (D3)

Dense HDD storage được tối ưu hóa cho các access patterns tuần tự
Các trường hợp sử dụng điển hình:
- Distributed storage systems như HDFS data nodes
- Xử lý dữ liệu quy mô lớn với MapReduce hoặc Apache Spark

3.6 HPC Optimized Instances: High-Performance Computing Chuyên Biệt

HPC optimized instances phục vụ một lớp workload hẹp nhưng đòi hỏi cao. Các workload này yêu cầu tính toán ghép nối chặt chẽ trên nhiều cores và giao tiếp độ trễ cực thấp. Chúng không phải là general-purpose và hiếm khi được sử dụng bên ngoài các lĩnh vực chuyên biệt. Danh mục này thường thấy nhất trong nghiên cứu khoa học, mô phỏng kỹ thuật và mô hình hóa tài chính. Hiệu suất phụ thuộc nhiều vào mạng và băng thông bộ nhớ cũng như sức mạnh CPU thô.

Hpc-Series (Hpc6a, Hpc7a)

Tối ưu hóa cho các workload high-performance computing
Các trường hợp sử dụng điển hình:
- Mô phỏng khoa học như dự báo thời tiết và computational fluid dynamics
- Mô hình hóa tài chính bao gồm phân tích rủi ro và algorithmic trading
- Mô phỏng kỹ thuật như finite element analysis và crash modeling

Đặc điểm chính:

Enhanced networking với Elastic Fabric Adapter (EFA)
Băng thông bộ nhớ cao với độ trễ thấp
Hỗ trợ tối ưu cho các ứng dụng dựa trên MPI

4. Các Mô Hình Giá EC2 và Chiến Lược Tối Ưu Hóa Chi Phí

Amazon EC2 cung cấp nhiều mô hình giá để phù hợp với các đặc điểm workload và khả năng chấp nhận rủi ro khác nhau. Các mô hình này khác nhau chủ yếu về tính linh hoạt, hiệu quả chi phí và khả năng chịu đựng sự gián đoạn. Việc lựa chọn tùy chọn giá phù hợp là một phần của quyết định compute, không phải là một bước đến sau khi triển khai.

Giá EC2 có thể được nhóm thành bốn tùy chọn chính.

4.1 On-Demand Instances

On-Demand instances tuân theo mô hình pay-as-you-go nơi người dùng chỉ bị tính phí cho thời gian compute họ thực sự sử dụng. Không có cam kết dài hạn, điều này làm cho tùy chọn này trở nên đơn giản và dễ dự đoán. Sự đánh đổi là chi phí, vì giá On-Demand là tùy chọn đắt nhất trên mỗi đơn vị compute.

Đặc điểm chính:

Không cần thanh toán trước hoặc cam kết tối thiểu
Tính phí theo giây cho Linux và theo giờ cho Windows
Tính linh hoạt cao nhất với chi phí cao nhất
Instances có thể bị chấm dứt bất cứ lúc nào

Các trường hợp sử dụng điển hình:

Môi trường phát triển và kiểm thử với việc spin-up và shutdown thường xuyên
Các workloads tồn tại trong thời gian ngắn như batch jobs hoặc xử lý dữ liệu ad-hoc
Các workloads không thể dự đoán với traffic spikes hoặc các mô hình theo mùa
Các ứng dụng mới nơi các mô hình sử dụng chưa được hiểu rõ

4.2 Spot Instances

Spot Instances cung cấp quyền truy cập vào EC2 capacity chưa được sử dụng với mức giá thấp hơn đáng kể so với On-Demand instances. Giá phụ thuộc vào cung – cầu, điều này có nghĩa là availability không được đảm bảo. Do đó, Spot Instances phù hợp nhất cho các workloads có thể chịu đựng được sự gián đoạn.

Cách Spot Instances hoạt động:

Người dùng chỉ định mức giá tối đa họ sẵn sàng trả
Instances được khởi chạy khi Spot price ở mức bằng hoặc thấp hơn mức giá đó
AWS cung cấp thông báo gián đoạn hai phút trước khi thu hồi capacity
Instances có thể bị stopped, terminated hoặc hibernated dựa trên cấu hình

Chiến lược sử dụng Spot:

Phân phối workloads trên nhiều instance types và Availability Zones
Thiết kế ứng dụng để chịu đựng sự gián đoạn
Lưu tiến trình thường xuyên sử dụng checkpoints
Kết hợp Spot với On-Demand instances cho các thành phần quan trọng

Best practices

Phù hợp cho các retryable workloads như CI/CD pipelines và data crawlers
Sử dụng Spot Fleet để yêu cầu capacity đa dạng một cách tự động
Triển khai graceful shutdown handling trong ứng dụng
Theo dõi xu hướng Spot price và điều chỉnh chiến lược bidding
Kết hợp với Auto Scaling Groups để cải thiện resilience

4.3 Savings Plans và Reserved Instances

Savings Plans và Reserved Instances giảm chi phí bằng cách đánh đổi tính linh hoạt lấy cam kết dài hạn. Cả hai mô hình đều được thiết kế cho các workloads có mức sử dụng ổn định và có thể dự đoán. Sự khác biệt chính nằm ở mức độ linh hoạt mà người dùng giữ lại sau khi thực hiện cam kết.

Savings Plans (AWS khuyến nghị):

Chiết khấu dựa trên chi tiêu theo giờ đã cam kết trong 1 hoặc 3 năm
Thanh toán có thể là full upfront, partial upfront hoặc no upfront

Các loại Savings Plans:

Compute Savings Plans: Áp dụng trên các loại instance, operating systems và regions
EC2 Instance Savings Plans: Áp dụng cho các instance families cụ thể trong các regions được chọn

Reserved Instances

Chiết khấu dựa trên việc cam kết một instance type cụ thể trong một khoảng thời gian cố định
Cam kết từ 1 tháng đến 3 năm

Các loại Reserved Instances:

Standard RIs: Chiết khấu lên đến 75%, với tính linh hoạt hạn chế
Convertible RIs: Chiết khấu lên đến 54%, với tùy chọn thay đổi loại instance

4.4 So Sánh Các Mô Hình Giá

Mô Hình Thanh Toán	Tính Linh Hoạt	Chiết Khấu	Phù Hợp
On-Demand	Rất cao	Không có	Workloads không thể dự đoán hoặc ngắn hạn
Spot	Trung bình	Lên đến 90%	Workloads chịu lỗi được
Savings Plans	Cao	Lên đến 72%	Sử dụng compute ổn định
Reserved Instances	Thấp	Lên đến 75%	Workloads dài hạn, có thể dự đoán

Kết luận

C2 không khó vì các tính năng của nó. Nó trở nên khó khăn khi các teams coi việc lựa chọn instance và giá cả như những yếu tố cân nhắc sau cùng thay vì các quyết định thiết kế. Một khi bạn bắt đầu từ chính workload—cách nó hoạt động, nơi nó bị giới hạn và nó ổn định như thế nào theo thời gian—hầu hết các lựa chọn EC2 ngừng cảm thấy trừu tượng và bắt đầu có ý nghĩa.
Nếu bạn đang chạy workloads trên AWS và muốn kiểm tra lại các lựa chọn EC2 của mình với ai đó nhìn vào việc sử dụng trước các công cụ, Haposoft làm việc với các teams về các cloud setups thực tế dựa trên cách các hệ thống thực sự được sử dụng. Nếu bạn cần một cuộc thảo luận kỹ thuật thực tế thay vì một sales pitch, đó thường là nơi cuộc hội thoại bắt đầu.