CDN so với máy chủ Origin
Hai lớp, hai vai trò.
Origin là nguồn chính thức của nội dung — thường là object storage (S3, R2, GCS) hoặc một cụm máy chủ. Toàn bộ thư viện sống ở đây. Chi phí đọc cao hơn; khoảng cách địa lý đến người xem tùy thuộc vị trí.
CDN (Content Delivery Network) là mạng phân tán các edge server cache nội dung gần người xem. Cloudflare, Fastly, Akamai, AWS CloudFront — đều là CDN. Mỗi CDN có hàng trăm điểm hiện diện (POP) toàn cầu. Khi người xem yêu cầu nội dung, POP gần nhất phục vụ từ cache.
Một request video chảy ra sao
- Trình duyệt người xem yêu cầu
/segment-001.m4stừ CDN. - Edge CDN kiểm tra cache cho URL đó.
- Cache hit → phục vụ từ edge. Thường dưới 100ms.
- Cache miss → edge lấy từ origin (R2 đối với AVCaption), lưu vào cache, phục vụ người xem.
- Người xem kế tiếp cùng vùng được cache hit.
Với video HLS, các phân đoạn là bất biến (URL gắn theo hash nội dung) nên tỷ lệ cache hit >95% với bất kỳ video nào có nhiều người xem.
Vì sao điều này quan trọng với video
- Tốc độ: Edge cách phần lớn người xem 10-100ms RTT. Origin sẽ là 50-300ms.
- Chi phí: Băng thông CDN rẻ hơn egress origin (đặc biệt R2 → CF CDN egress miễn phí).
- Khả năng mở rộng: Một video viral có thể phục vụ hàng triệu người xem mà không tải lên origin.
- Độ tin cậy: Edge quanh vùng sự cố vẫn phục vụ nội dung cache dù origin đã sập.
Trên AVCaption
Origin = Cloudflare R2 (object storage, tương thích S3, không tính phí egress về CF CDN). Phân phối = Cloudflare CDN (300+ POP).
Cặp đôi này nghĩa là:
- Lưu trữ bền vững và được nhân bản địa lý bởi R2.
- Phân phối nhanh và cache mạnh tại edge.
- Egress giữa R2 và CF CDN miễn phí, đó là lý do AVCaption có thể đưa giá flat-tier mà không tính phí phân phối theo GB.