Chuyển đến nội dung chính

Top 50 câu hỏi phỏng vấn AWS và câu trả lời cho năm 2026

Hướng dẫn đầy đủ khám phá các câu hỏi phỏng vấn AWS cơ bản, trung cấp và nâng cao, cùng với các câu hỏi dựa trên tình huống thực tế.
Đã cập nhật 16 thg 4, 2026  · 15 phút đọc

Trọng tâm của hướng dẫn này là giúp quy trình phỏng vấn AWS dễ hiểu hơn bằng cách cung cấp danh sách câu hỏi và câu trả lời được tuyển chọn kỹ lưỡng. Phạm vi bao gồm từ những nguyên tắc cơ bản tạo nền tảng cho hệ sinh thái rộng lớn của AWS đến các câu hỏi chi tiết dựa trên tình huống nhằm kiểm tra mức độ hiểu biết sâu và khả năng áp dụng thực tiễn các dịch vụ AWS.

Dù bạn mới bắt đầu sự nghiệp dữ liệu hay đã là chuyên gia dày dạn, bài viết này hướng đến việc mang lại cho bạn kiến thức và sự tự tin để xử lý bất kỳ câu hỏi phỏng vấn AWS nào. Bằng cách khám phá các câu hỏi phỏng vấn AWS ở mức cơ bản, trung cấp và nâng cao, cùng với các câu hỏi dựa trên tình huống thực tế, hướng dẫn này nhằm bao quát tất cả lĩnh vực quan trọng, đảm bảo chiến lược chuẩn bị toàn diện. 

Vì sao chọn AWS?

Trước khi đi vào câu hỏi và câu trả lời, điều quan trọng là hiểu vì sao đáng cân nhắc AWS Cloud như nền tảng ưu tiên.

Đồ thị sau cung cấp thị phần toàn cầu của các nhà cung cấp dịch vụ hạ tầng đám mây hàng đầu trong quý 3 (Q3) năm 2025. Dưới đây là phân bổ thị phần được thể hiện:

  • Amazon Web Services (AWS) có thị phần lớn nhất ở mức 29%.
  • Microsoft Azure theo sau với 20%.
  • Google Cloud chiếm 13% thị phần.
  • Alibaba Cloud nắm 4%.
  • Oracle đang tăng trưởng để đạt 3%.
  • Salesforce, IBM Cloud và Tencent Cloud ở cuối bảng, mỗi bên 2%.

18819.jpeg

Nguồn (Statista)

Đồ thị cũng lưu ý rằng dữ liệu bao gồm nền tảng như một dịch vụ (PaaS) và hạ tầng như một dịch vụ (IaaS), cũng như các dịch vụ đám mây riêng được lưu trữ. Ngoài ra, có đề cập rằng doanh thu dịch vụ hạ tầng đám mây trong Q3 2025 đạt 107 tỷ USD, tăng đáng kể so với Q3 2024 khi là 84 tỷ USD.

Amazon Web Services (AWS) tiếp tục là người chơi thống trị trên thị trường đám mây tính đến Q3 2025, giữ khoảng cách đáng kể với đối thủ gần nhất là Microsoft Azure.

Vị thế dẫn đầu của AWS trên thị trường đám mây nhấn mạnh tầm quan trọng của việc nâng cao kỹ năng và mang lại lợi thế nghề nghiệp lớn nhờ mức độ ứng dụng rộng rãi và giá trị mà ngành công nghệ đặt vào kỹ năng AWS.

Phiếu gợi nhớ So sánh dịch vụ AWS, Azure và GCP cho Khoa học Dữ liệu & AI của chúng tôi cung cấp đối chiếu các dịch vụ chính cần thiết cho công việc liên quan đến dữ liệu và AI, từ kỹ thuật dữ liệu đến phân tích dữ liệu, khoa học dữ liệu đến xây dựng ứng dụng dữ liệu.

Câu hỏi phỏng vấn AWS cơ bản

Bắt đầu từ những điều căn bản, phần này giới thiệu các câu hỏi phỏng vấn AWS cơ bản thiết yếu để xây dựng nền tảng hiểu biết. Nội dung được điều chỉnh cho người mới hoặc cần ôn lại, tạo tiền đề cho phần khám phá chi tiết hơn phía sau.

Điện toán đám mây là gì?

Điện toán đám mây cung cấp quyền truy cập theo nhu cầu tới các tài nguyên CNTT như tính toán, lưu trữ và cơ sở dữ liệu qua internet. Người dùng chỉ trả tiền cho những gì họ sử dụng thay vì sở hữu hạ tầng vật lý.

Đám mây cho phép truy cập dịch vụ công nghệ linh hoạt theo nhu cầu mà không cần đầu tư lớn ban đầu. Các nhà cung cấp hàng đầu như AWS cung cấp nhiều dịch vụ đám mây theo mô hình trả theo mức tiêu thụ. Khóa học AWS Cloud Concepts của chúng tôi bao quát nhiều kiến thức cơ bản này.

Vấn đề của cách tiếp cận CNTT truyền thống so với dùng Đám mây là gì?

Nhiều ngành đang rời bỏ CNTT truyền thống để chuyển sang hạ tầng đám mây vì nhiều lý do. Đó là bởi cách tiếp cận Đám mây mang lại sự linh hoạt cho doanh nghiệp, đổi mới nhanh hơn, mở rộng linh hoạt và tổng chi phí sở hữu thấp hơn so với CNTT truyền thống. Dưới đây là một số đặc trưng phân biệt:

CNTT truyền thống

Điện toán đám mây

  • Yêu cầu chi tiêu vốn lớn ban đầu
  • Khả năng mở rộng theo nhu cầu hạn chế
  • Chu kỳ mua sắm và cấp phát kéo dài
  • Chi phí bảo trì cao
  • Tính linh hoạt và đổi mới hạn chế
  • Không cần đầu tư hạ tầng ban đầu
  • Trả theo mức sử dụng
  • Mở rộng nhanh để đáp ứng nhu cầu
  • Giảm chi phí bảo trì
  • Đổi mới nhanh và khởi động sáng kiến CNTT mới
  • Tăng tính linh hoạt và khả năng phản hồi

Có bao nhiêu kiểu mô hình triển khai trên đám mây?

Có ba kiểu mô hình triển khai khác nhau trên đám mây, minh họa như bên dưới:

  • Đám mây riêng: loại dịch vụ này được một tổ chức duy nhất sử dụng và không công khai. Phù hợp với tổ chức dùng ứng dụng nhạy cảm.
  • Đám mây công cộng: các tài nguyên đám mây này do bên thứ ba sở hữu và vận hành như Amazon Web Services, Microsoft Azure và tất cả nhà cung cấp được nhắc trong phần thị phần AWS.
  • Đám mây lai: là sự kết hợp giữa đám mây riêng và công cộng. Được thiết kế để giữ một số máy chủ tại chỗ đồng thời mở rộng năng lực còn lại lên đám mây. Đám mây lai mang lại tính linh hoạt và hiệu quả chi phí của đám mây công cộng.

Năm đặc trưng của điện toán đám mây là gì?

Điện toán đám mây gồm năm đặc trưng chính, minh họa như sau:

  • Tự phục vụ theo nhu cầu: Người dùng có thể cấp phát dịch vụ đám mây theo nhu cầu mà không cần tương tác với nhà cung cấp dịch vụ.
  • Truy cập mạng rộng: Dịch vụ sẵn có qua mạng và truy cập bằng các cơ chế tiêu chuẩn như điện thoại, laptop, máy tính bảng.
  • Đa thuê và gộp tài nguyên: Tài nguyên được gộp để phục vụ nhiều khách hàng, với tài nguyên ảo và vật lý khác nhau được gán động theo nhu cầu.
  • Đàn hồi và mở rộng nhanh: Năng lực có thể được cấp phát đàn hồi và mở rộng lên/xuống nhanh chóng, tự động để khớp năng lực với nhu cầu.
  • Dịch vụ đo lường: Việc sử dụng tài nguyên được giám sát, kiểm soát, báo cáo và tính phí minh bạch dựa trên mức sử dụng. Việc sử dụng có thể được quản lý, kiểm soát và báo cáo, cung cấp tính minh bạch cho cả nhà cung cấp và người dùng.

Các loại hình chính của Điện toán Đám mây là gì?

Có ba loại hình chính: IaaS, PaaS và SaaS

  • Hạ tầng như một Dịch vụ (IaaS): Cung cấp các khối xây dựng cơ bản cho CNTT đám mây như tính toán, lưu trữ và mạng mà người dùng có thể truy cập theo nhu cầu mà không cần quản lý hạ tầng bên dưới. Ví dụ: AWS EC2, S3, VPC.
  • Nền tảng như một Dịch vụ (PaaS): Cung cấp nền tảng hoặc môi trường được quản lý để phát triển, triển khai và quản lý ứng dụng đám mây mà không cần xây dựng hạ tầng bên dưới. Ví dụ: AWS Elastic Beanstalk, Heroku
  • Phần mềm như một Dịch vụ (SaaS): Cung cấp quyền truy cập vào các ứng dụng hoàn chỉnh cho người dùng cuối chạy trên đám mây và sử dụng qua internet. Người dùng không quản lý hạ tầng hay nền tảng. Ví dụ: AWS Simple Email Service, Google Docs, Salesforce CRM.

Bạn có thể tìm hiểu chi tiết hơn trong khóa học Understanding Cloud Computing của chúng tôi.

Amazon EC2 là gì và những mục đích sử dụng chính là gì?

Amazon EC2 (Elastic Compute Cloud) cung cấp các máy chủ ảo có thể mở rộng gọi là instance trong AWS Cloud. Dùng để chạy nhiều loại khối lượng công việc linh hoạt và tối ưu chi phí. Một số mục đích chính như sau:

  • Lưu trữ website và ứng dụng web
  • Chạy tiến trình nền và tác vụ theo lô
  • Triển khai giải pháp đám mây lai
  • Đạt tính sẵn sàng cao và khả năng mở rộng
  • Rút ngắn thời gian ra mắt cho các trường hợp sử dụng mới

Amazon S3 là gì và vì sao quan trọng?

Amazon Simple Storage Service (S3) là dịch vụ lưu trữ đối tượng linh hoạt, có thể mở rộng và bảo mật. Đây là nền tảng cho nhiều ứng dụng và khối lượng công việc trên đám mây. Dưới đây là một vài tính năng nêu bật tầm quan trọng:

  • Độ bền cao 99.999999999% và khả dụng 99.99%, phù hợp dữ liệu quan trọng.
  • Hỗ trợ tính năng bảo mật mạnh như chính sách truy cập, mã hóa, VPC endpoints.
  • Tích hợp liền mạch với dịch vụ AWS khác như Lambda, EC2, EBS, v.v.
  • Độ trễ thấp và thông lượng cao, lý tưởng cho phân tích dữ liệu lớn, ứng dụng di động, lưu trữ và phân phối media.
  • Tính năng quản lý linh hoạt cho giám sát, nhật ký truy cập, sao chép, phiên bản, chính sách vòng đời.
  • Hậu thuẫn bởi hạ tầng toàn cầu của AWS cho truy cập độ trễ thấp trên toàn thế giới.

Giải thích khái niệm "Khu vực" (Regions) và "Vùng sẵn sàng" (Availability Zones) trong AWS

  • Khu vực AWS (Regions) tương ứng với các địa điểm địa lý riêng biệt nơi tài nguyên AWS được đặt. Doanh nghiệp chọn khu vực gần khách hàng để giảm độ trễ, và sao chép chéo khu vực giúp khả năng khôi phục thảm họa tốt hơn.
  • Vùng sẵn sàng (Availability Zones) gồm một hoặc nhiều trung tâm dữ liệu riêng biệt với điện, mạng và kết nối dự phòng. Chúng cho phép triển khai tài nguyên theo cách chịu lỗi hơn.

Khóa học AWS Cloud Concepts của chúng tôi cung cấp hướng dẫn đầy đủ để tìm hiểu các dịch vụ cốt lõi chính của AWS, thực hành tốt nhất khi thiết kế ứng dụng AWS, và lợi ích khi doanh nghiệp sử dụng AWS.

IAM là gì và vì sao quan trọng?

AWS Identity and Access Management (IAM) là dịch vụ giúp bạn kiểm soát an toàn quyền truy cập vào các dịch vụ và tài nguyên AWS. IAM cho phép bạn quản lý người dùng, nhóm và vai trò với quyền chi tiết. Điều này quan trọng vì giúp thực thi nguyên tắc đặc quyền tối thiểu, đảm bảo người dùng chỉ truy cập tài nguyên họ cần, từ đó nâng cao bảo mật và tuân thủ.

Hướng dẫn Hoàn chỉnh về AWS IAM của chúng tôi giải thích chi tiết dịch vụ này.

Amazon RDS là gì và khác gì so với cơ sở dữ liệu truyền thống?

Amazon Relational Database Service (RDS) là dịch vụ cơ sở dữ liệu được quản lý cho phép người dùng thiết lập, vận hành và mở rộng cơ sở dữ liệu mà không phải lo tác vụ quản trị hạ tầng như sao lưu, vá lỗi và mở rộng. Không giống cơ sở dữ liệu truyền thống, Amazon RDS có khả năng mở rộng và sẵn sàng cao ngay từ đầu, hỗ trợ sao lưu tự động, và cho phép bản sao chỉ đọc (read replica) và triển khai đa AZ cho chuyển đổi dự phòng và dự phòng.

Dưới đây là bảng nêu bật khác biệt giữa RDS và cơ sở dữ liệu truyền thống dành cho những bạn thiên về trực quan:

Tính năng Amazon RDS Cơ sở dữ liệu truyền thống
Khả năng mở rộng Dễ dàng mở rộng theo chiều dọc hoặc ngang Cần nâng cấp phần cứng; mở rộng có thể tốn kém
Tính sẵn sàng Hỗ trợ triển khai Multi-AZ cho sẵn sàng cao Thiết lập sẵn sàng cao đòi hỏi cấu hình phức tạp
Bảo trì Được AWS quản lý, gồm sao lưu, cập nhật và vá lỗi Tự quản lý thủ công, gồm cập nhật định kỳ và sao lưu
Sao lưu và khôi phục Sao lưu và snapshot tự động Yêu cầu quy trình sao lưu thủ công
Chi phí Định giá trả theo mức dùng Chi phí cố định; cần đầu tư ban đầu cao hơn

Amazon VPC là gì và dùng để làm gì?

Amazon Virtual Private Cloud (VPC) cho phép bạn tạo mạng ảo trong AWS tương tự mạng truyền thống tại trung tâm dữ liệu tại chỗ. VPC được dùng để cô lập tài nguyên, kiểm soát lưu lượng vào/ra, và phân đoạn khối lượng công việc thành các subnet với cấu hình bảo mật nghiêm ngặt. Nó cung cấp kiểm soát chi tiết đối với dải IP, security group và danh sách kiểm soát truy cập mạng.

Amazon CloudWatch là gì và các thành phần chính là gì?

Amazon CloudWatch là dịch vụ giám sát và quan sát được thiết kế để theo dõi các chỉ số, thiết lập cảnh báo và tự động phản hồi các thay đổi của tài nguyên AWS. Nó giúp cải thiện khả năng quan sát hiệu năng ứng dụng, tình trạng hệ thống và vấn đề vận hành, trở thành công cụ thiết yếu cho người dùng AWS. Dưới đây là các thành phần chính của CloudWatch:

  • Metrics: CloudWatch thu thập các điểm dữ liệu, hay chỉ số, cung cấp hiểu biết về mức sử dụng tài nguyên, hiệu năng ứng dụng và sức khỏe vận hành. Dữ liệu này cho phép phân tích xu hướng và mở rộng chủ động.
  • Alarms: Cảnh báo thông báo cho người dùng hoặc kích hoạt hành động tự động dựa trên ngưỡng chỉ số cụ thể. Ví dụ, nếu CPU vượt ngưỡng đặt trước, một cảnh báo có thể kích hoạt tự động mở rộng để xử lý tải tăng.
  • Logs: CloudWatch Logs cung cấp lưu trữ tập trung cho nhật ký ứng dụng và hạ tầng, thiết yếu cho việc khắc phục sự cố và xác định vấn đề. Có thể lọc, theo dõi và phân tích nhật ký để vận hành trơn tru.
  • Events: CloudWatch Events (hoặc Amazon EventBridge) phát hiện thay đổi trong tài nguyên AWS và có thể kích hoạt hành động định sẵn, như gọi hàm Lambda khi xảy ra sự kiện cụ thể. Điều này cho phép tự động hóa cao hơn và phản hồi nhanh với sự kiện quan trọng.

AWS Lambda là gì và nó kích hoạt điện toán không máy chủ như thế nào?

AWS Lambda là dịch vụ tính toán không máy chủ loại bỏ nhu cầu quản lý máy chủ, giúp nhà phát triển dễ dàng chạy mã trên đám mây. Cách hoạt động và lý do nó thúc đẩy mô hình không máy chủ như sau:

  • Thực thi mã theo yêu cầu: Lambda chỉ chạy mã khi được kích hoạt bởi sự kiện—như yêu cầu HTTP hoặc tệp được tải lên Amazon S3. Điều này đảm bảo bạn chỉ dùng tài nguyên khi cần, tối ưu chi phí và hiệu quả.
  • Tự động mở rộng: Lambda tự động mở rộng dựa trên số lượng yêu cầu đến. Nó có thể xử lý từ một yêu cầu đến hàng nghìn mỗi giây, giúp ứng dụng luôn phản hồi khi lưu lượng thay đổi.
  • Tập trung vào mã, không phải hạ tầng: Vì Lambda trừu tượng hạ tầng máy chủ, nhà phát triển chỉ cần tập trung viết và triển khai mã mà không lo cấp phát, quản lý hay mở rộng máy chủ.

Qua các tính năng này, Lambda hiện thực hóa các nguyên tắc của điện toán không máy chủ—giảm gánh nặng quản trị hạ tầng và cho phép xây dựng, kiểm thử, mở rộng ứng dụng linh hoạt hơn.

Elastic Load Balancing (ELB) trong AWS là gì?

Elastic Load Balancing (ELB) là dịch vụ tự động phân phối lưu lượng ứng dụng đến nhiều đích, đảm bảo ứng dụng của bạn luôn phản hồi và bền bỉ. ELB mang lại nhiều lợi ích khiến nó trở thành thành phần thiết yếu của kiến trúc AWS có khả năng mở rộng:

  • Phân phối lưu lượng: ELB cân bằng thông minh lưu lượng đến giữa nhiều đích, bao gồm instance EC2, container và địa chỉ IP. Điều này giúp tránh quá tải một tài nguyên đơn lẻ, đảm bảo hiệu năng ứng dụng ổn định.
  • Khả năng chịu lỗi và sẵn sàng cao: ELB cung cấp khả năng chịu lỗi bằng cách phân phối lưu lượng giữa nhiều Vùng sẵn sàng, giúp ứng dụng vẫn khả dụng ngay cả khi một vùng gặp sự cố.
  • Tăng độ tin cậy và khả năng mở rộng: ELB tự động điều chỉnh phân phối lưu lượng khi nhu cầu thay đổi, giúp xử lý đột biến lưu lượng mà không ảnh hưởng hiệu năng.

Câu hỏi phỏng vấn AWS cho cấp trung và giàu kinh nghiệm

Câu hỏi phỏng vấn AWS DevOps

Chuyển sang các vai trò chuyên biệt, trọng tâm ở đây là cách AWS hỗ trợ thực hành DevOps. Phần này xem xét việc tự động hóa và tối ưu hóa môi trường AWS, yêu cầu ứng viên thể hiện kỹ năng tận dụng AWS cho tích hợp và triển khai liên tục. Nếu bạn nhắm đến vai trò AWS nâng cao, hãy xem bài viết Câu hỏi phỏng vấn Data Architect để luyện tập các câu hỏi về hạ tầng và kiến trúc dữ liệu.

Bạn sử dụng AWS CodePipeline để tự động hóa đường ống CI/CD cho ứng dụng nhiều tầng như thế nào?

CodePipeline có thể được dùng để tự động hóa luồng từ kiểm tra mã đến xây dựng, kiểm thử và triển khai qua nhiều môi trường nhằm tinh giản việc phát hành cập nhật đồng thời duy trì tiêu chuẩn chất lượng cao.

Có thể thực hiện các bước sau để tự động hóa đường ống CI/CD:

  • Tạo pipeline: Bắt đầu bằng cách tạo pipeline trong AWS CodePipeline, chỉ định kho mã nguồn (ví dụ: GitHub, AWS CodeCommit).
  • Xác định giai đoạn build: Kết nối dịch vụ build như AWS CodeBuild để biên dịch mã, chạy kiểm thử và tạo gói triển khai.
  • Thiết lập giai đoạn triển khai: Cấu hình giai đoạn triển khai cho mỗi tầng ứng dụng. Dùng AWS CodeDeploy để tự động triển khai lên Amazon EC2, AWS Elastic Beanstalk cho ứng dụng web, hoặc AWS ECS cho ứng dụng container hóa.
  • Thêm bước phê duyệt (tùy chọn): Với môi trường quan trọng, chèn các bước phê duyệt thủ công trước giai đoạn triển khai để đảm bảo chất lượng và kiểm soát.
  • Giám sát và cải tiến: Theo dõi hiệu năng của pipeline và điều chỉnh khi cần. Tận dụng phản hồi và cải tiến liên tục quy trình triển khai.

Những yếu tố then chốt cần cân nhắc khi thiết kế giải pháp triển khai trên AWS để cấp phát, cấu hình, triển khai, mở rộng và giám sát ứng dụng hiệu quả?

Xây dựng triển khai AWS chuẩn kiến trúc bao gồm điều chỉnh dịch vụ AWS theo nhu cầu ứng dụng của bạn, bao phủ yêu cầu tính toán, lưu trữ và cơ sở dữ liệu. Quy trình này, vốn phức tạp bởi danh mục dịch vụ rộng lớn của AWS, bao gồm một số bước quan trọng:

  • Cấp phát: Thiết lập hạ tầng AWS thiết yếu như EC2, VPC, subnet hoặc các dịch vụ quản lý như S3, RDS, CloudFront cho ứng dụng nền tảng.

  • Cấu hình: Điều chỉnh thiết lập để đáp ứng yêu cầu cụ thể liên quan đến môi trường, bảo mật, tính sẵn sàng và hiệu năng.

  • Triển khai: Phát hành hay cập nhật thành phần ứng dụng hiệu quả, đảm bảo chuyển đổi phiên bản trơn tru.

  • Mở rộng: Thay đổi phân bổ tài nguyên động dựa trên tiêu chí định sẵn để xử lý biến động tải.

  • Giám sát: Theo dõi mức dùng tài nguyên, kết quả triển khai, sức khỏe ứng dụng và nhật ký để đảm bảo mọi thứ vận hành như kỳ vọng.

Infrastructure as Code là gì? Mô tả bằng lời của bạn

Infrastructure as Code (IaC) là phương pháp quản lý và cấp phát trung tâm dữ liệu máy tính thông qua tệp định nghĩa có thể đọc bởi máy, thay vì cấu hình phần cứng vật lý hoặc công cụ cấu hình tương tác.

Về bản chất, nó cho phép nhà phát triển và đội vận hành CNTT tự động quản lý, giám sát và cấp phát tài nguyên bằng mã, thay vì thiết lập và cấu hình phần cứng thủ công.

Ngoài ra, IaC cho phép triển khai môi trường nhất quán một cách nhanh chóng và có khả năng mở rộng bằng cách mã hóa hạ tầng, từ đó giảm lỗi con người và tăng hiệu quả.

Cách bạn xử lý tích hợp liên tục và triển khai liên tục trong AWS DevOps?

Trong AWS DevOps, có thể quản lý CI/CD bằng cách sử dụng AWS Developer Tools. Bắt đầu bằng việc lưu trữ và quản lý phiên bản mã nguồn ứng dụng với các công cụ này.

Sau đó, tận dụng các dịch vụ như AWS CodePipeline để điều phối quy trình build, test và deploy. CodePipeline đóng vai trò xương sống, tích hợp với AWS CodeBuild để biên dịch và kiểm thử mã, và AWS CodeDeploy để tự động triển khai tới nhiều môi trường. Cách tiếp cận này giúp quy trình CI/CD hiệu quả, tự động hóa.

Amazon ECS mang lại lợi ích gì cho AWS DevOps?

Amazon ECS là dịch vụ quản lý container có khả năng mở rộng, đơn giản hóa việc chạy Docker containers trên các instance EC2 thông qua cụm được quản lý, tăng cường triển khai và vận hành ứng dụng.

Một số chiến lược triển khai blue/green trên AWS là gì?

Triển khai blue/green giảm thiểu thời gian ngừng hoạt động và rủi ro bằng cách vận hành hai môi trường: một (blue) với phiên bản hiện tại và một (green) với phiên bản mới. Trên AWS, có thể đạt được bằng các dịch vụ như Elastic Beanstalk, AWS CodeDeploy hoặc ECS. Bạn có thể chuyển hướng lưu lượng giữa môi trường bằng Route 53 hoặc Application Load Balancer, kiểm thử môi trường green an toàn và quay lại ngay nếu cần.

Vì sao có thể ưu tiên ECS hơn Kubernetes?

ECS mang lại linh hoạt, khả năng mở rộng và đơn giản hơn trong triển khai so với Kubernetes, khiến nó là lựa chọn ưa chuộng cho một số triển khai.

Bạn sẽ quản lý và bảo mật secrets cho pipeline CI/CD trong AWS như thế nào?

Để quản lý an toàn secrets trong pipeline CI/CD trên AWS, bạn có thể dùng AWS Secrets Manager hoặc AWS Systems Manager Parameter Store để lưu thông tin nhạy cảm như khóa API, mật khẩu cơ sở dữ liệu và chứng chỉ. Cả hai dịch vụ tích hợp với các dịch vụ AWS như CodePipeline và CodeBuild, cho phép truy cập secrets an toàn mà không cần hardcode trong mã nguồn.

Bằng cách kiểm soát quyền truy cập với IAM, bạn đảm bảo chỉ thực thể được ủy quyền mới có thể truy cập dữ liệu nhạy cảm, nâng cao bảo mật trong quy trình CI/CD.

Bạn sử dụng AWS Systems Manager trong môi trường sản xuất như thế nào?

AWS Systems Manager giúp tự động hóa và quản lý hạ tầng ở quy mô lớn. Trong môi trường sản xuất, nó thường được dùng cho quản lý bản vá, thực thi lệnh từ xa, thu thập kiểm kê, và lưu trữ an toàn tham số cấu hình và secrets. Nó tích hợp với EC2, RDS và dịch vụ AWS khác, cho phép tầm nhìn tập trung và kiểm soát vận hành.

AWS CloudFormation là gì và nó hỗ trợ thực hành DevOps như thế nào?

AWS CloudFormation tự động hóa cấp phát và quản lý hạ tầng AWS bằng mã, cho phép Infrastructure as Code (IaC). Dịch vụ này cho phép bạn định nghĩa hạ tầng dưới dạng template, giúp dễ dàng quản lý phiên bản, kiểm thử và nhân bản môi trường qua phát triển, staging và sản xuất.

Trong bối cảnh DevOps, CloudFormation giúp duy trì tính nhất quán, giảm lỗi cấu hình thủ công và hỗ trợ triển khai tự động, trở thành phần không thể thiếu của phân phối liên tục và nhân bản môi trường.

Để kết thúc nhóm câu hỏi DevOps, dưới đây là bảng tóm tắt các dịch vụ AWS được dùng trong lĩnh vực này và trường hợp sử dụng:

Dịch vụ Mục đích Trường hợp dùng trong DevOps
AWS CodePipeline Tự động hóa quy trình CI/CD qua nhiều môi trường Tích hợp và triển khai liên tục để cập nhật tinh gọn
AWS CodeBuild Biên dịch mã, chạy kiểm thử và tạo gói triển khai Tự động hóa build, kiểm thử và tạo artifact
AWS CodeDeploy Quản lý triển khai ứng dụng tới nhiều môi trường AWS (ví dụ: EC2, Lambda) Triển khai tự động giữa các môi trường với khả năng rollback
Amazon ECS Quản lý container để triển khai Docker containers Chạy microservices, đơn giản hóa triển khai và quản lý ứng dụng
AWS Secrets Manager Lưu trữ và quản lý thông tin nhạy cảm an toàn Lưu trữ an toàn khóa API, mật khẩu và dữ liệu nhạy cảm khác
AWS CloudFormation Tự động hóa thiết lập hạ tầng bằng mã (IaC) Tính nhất quán hạ tầng, nhân bản môi trường, thực hành IaC

Câu hỏi phỏng vấn kiến trúc sư giải pháp AWS

Đối với kiến trúc sư giải pháp, trọng tâm là thiết kế giải pháp AWS đáp ứng yêu cầu cụ thể. Phần này kiểm tra khả năng tạo hệ thống có khả năng mở rộng, hiệu quả và tối ưu chi phí bằng AWS, nêu bật thực hành kiến trúc tốt nhất.

Vai trò của kiến trúc sư giải pháp AWS là gì?

Kiến trúc sư giải pháp AWS thiết kế và giám sát ứng dụng trên AWS, đảm bảo khả năng mở rộng và hiệu năng tối ưu. Họ hướng dẫn nhà phát triển, quản trị hệ thống và khách hàng về cách sử dụng AWS hiệu quả cho nhu cầu kinh doanh, và truyền đạt khái niệm phức tạp cho cả đối tượng kỹ thuật và phi kỹ thuật.

Các thực hành bảo mật then chốt cho AWS EC2 là gì?

Thực hành bảo mật thiết yếu cho EC2 gồm sử dụng IAM để quản lý truy cập, hạn chế truy cập tới máy chủ tin cậy, tối thiểu hóa quyền, vô hiệu đăng nhập bằng mật khẩu cho AMI và triển khai xác thực đa yếu tố để tăng cường bảo mật.

Làm thế nào để đảm bảo dự phòng đa khu vực trong kiến trúc AWS?

Để thiết kế cho dự phòng đa khu vực, triển khai tài nguyên quan trọng như EC2, cơ sở dữ liệu RDS và S3 bucket ở nhiều Khu vực AWS. Dùng Route 53 cho định tuyến DNS theo địa lý và S3 Cross-Region Replication cho sao lưu dữ liệu. Áp dụng cấu hình active-active hoặc active-passive tùy chiến lược chuyển đổi dự phòng, và giám sát hiệu năng và sao chép bằng CloudWatch và AWS Global Accelerator.

Chiến lược tạo kiến trúc AWS có tính sẵn sàng cao và chịu lỗi cho ứng dụng web quan trọng?

Xây dựng kiến trúc có sẵn cao và chịu lỗi trên AWS liên quan đến nhiều chiến lược nhằm giảm tác động của lỗi và đảm bảo vận hành liên tục. Nguyên tắc chính gồm:

  • Triển khai dự phòng trên các thành phần hệ thống để loại bỏ điểm đơn lỗi
  • Sử dụng cân bằng tải để phân phối đều lưu lượng và đảm bảo hiệu năng tối ưu
  • Thiết lập giám sát tự động để phát hiện và phản hồi lỗi theo thời gian thực. Hệ thống nên được thiết kế để mở rộng nhằm xử lý tải biến đổi, với kiến trúc phân tán để tăng khả năng chịu lỗi.
  • Áp dụng cô lập lỗi, sao lưu định kỳ và kế hoạch khắc phục thảm họa để bảo vệ dữ liệu và phục hồi nhanh.
  • Thiết kế suy giảm có kiểm soát để duy trì chức năng trong thời gian gián đoạn, trong khi thực hành kiểm thử và triển khai liên tục cải thiện độ tin cậy hệ thống.

Giải thích cách bạn lựa chọn giữa Amazon RDS, Amazon DynamoDB và Amazon Redshift cho ứng dụng hướng dữ liệu.

Việc chọn giữa Amazon RDS, DynamoDB và Redshift phụ thuộc vào nhu cầu cụ thể:

  • Amazon RDS phù hợp ứng dụng cần cơ sở dữ liệu quan hệ truyền thống với hỗ trợ SQL tiêu chuẩn, giao dịch và truy vấn phức tạp.
  • Amazon DynamoDB hợp cho ứng dụng cần cơ sở dữ liệu NoSQL có khả năng mở rộng cao, hiệu năng nhanh, ổn định ở mọi quy mô. Tuyệt vời cho mô hình dữ liệu linh hoạt và phát triển nhanh.
  • Amazon Redshift phù hợp ứng dụng phân tích cần truy vấn phức tạp trên bộ dữ liệu lớn, mang lại hiệu năng truy vấn nhanh nhờ lưu trữ dạng cột và công nghệ kho dữ liệu.

Bạn cân nhắc gì khi di chuyển ứng dụng on-premises hiện có lên AWS? Dùng một ví dụ tùy chọn.

Khi chuyển phần mềm quản lý quan hệ khách hàng (CRM) của công ty từ hệ thống máy chủ nội bộ lên Amazon Web Services (AWS), điều quan trọng là tuân theo khung chiến lược tương tự đề xuất của AWS, điều chỉnh cho kịch bản cụ thể này:

  • Chuẩn bị ban đầu và hình thành chiến lược
    • Đánh giá thiết lập CRM hiện tại để xác định hạn chế và vùng cần cải thiện.
    • Đặt mục tiêu di chuyển rõ ràng, như đạt khả năng mở rộng tốt hơn, tăng cường tính năng phân tích dữ liệu hoặc giảm chi phí bảo trì.
    • Xác định giải pháp AWS cần thiết, như tận dụng Amazon EC2 cho tài nguyên tính toán và Amazon RDS để quản lý cơ sở dữ liệu.
  • Đánh giá và lập kế hoạch chiến lược
    • Lập danh mục thành phần CRM để ưu tiên phần cần di chuyển trước.
    • Chọn kỹ thuật di chuyển phù hợp, ví dụ di chuyển cơ sở dữ liệu CRM bằng AWS Database Migration Service (DMS).
    • Lên kế hoạch kết nối mạng ổn định trong quá trình chuyển, có thể dùng AWS Direct Connect.
  • Thực thi và xác nhận
    • Lập lộ trình di chuyển chi tiết, bắt đầu với mô-đun CRM ít quan trọng để chạy thử.
    • Đạt phê duyệt từ các bên liên quan chính trước khi di chuyển chức năng CRM chính, sử dụng dịch vụ AWS.
    • Kiểm thử hiệu năng và bảo mật của CRM sau di chuyển trên AWS, điều chỉnh khi cần.
  • Chuyển sang vận hành trên đám mây
    • Chuyển sang quản lý hoàn toàn ứng dụng CRM trong môi trường AWS, loại bỏ dần thành phần on-premises cũ.
    • Tận dụng bộ công cụ giám sát và quản lý của AWS để giám sát liên tục và tinh chỉnh.
    • Áp dụng bài học rút ra từ lần di chuyển này cho các lần sau, cân nhắc mở rộng áp dụng đám mây cho ứng dụng khác.

Cách tiếp cận này đảm bảo việc di chuyển CRM lên AWS phù hợp với mục tiêu kinh doanh chiến lược, tối đa hóa lợi ích của điện toán đám mây về khả năng mở rộng, hiệu quả và tiết kiệm chi phí.

Mô tả cách bạn dùng dịch vụ AWS để triển khai kiến trúc microservices.

Triển khai kiến trúc microservice liên quan đến việc chia nhỏ ứng dụng phần mềm thành các dịch vụ nhỏ, độc lập giao tiếp qua API. Dưới đây là hướng dẫn ngắn gọn để thiết lập microservices:

  • Áp dụng phát triển Agile: Sử dụng phương pháp Agile để thúc đẩy phát triển và triển khai nhanh từng microservice.
  • Ưu tiên thiết kế API-First: Phát triển API cho tương tác giữa microservice trước để đảm bảo giao tiếp rõ ràng, nhất quán.
  • Tận dụng thực hành CI/CD: Triển khai tích hợp và phân phối liên tục để tự động hóa kiểm thử và triển khai, tăng tốc và độ tin cậy phát triển.
  • Áp dụng nguyên tắc Twelve-Factor App: Áp dụng các nguyên tắc này để tạo dịch vụ có thể mở rộng, dễ bảo trì, dễ triển khai trên nền tảng đám mây như AWS.
  • Chọn mẫu kiến trúc phù hợp: Cân nhắc mẫu điều khiển theo API, theo sự kiện, hoặc streaming dữ liệu dựa trên nhu cầu ứng dụng để tối ưu giao tiếp và luồng dữ liệu.
  • Tận dụng AWS để triển khai: Dùng các dịch vụ AWS như công nghệ container cho microservices có khả năng mở rộng hoặc điện toán không máy chủ để giảm độ phức tạp vận hành và tập trung vào logic ứng dụng.
  • Áp dụng nguyên tắc serverless: Khi phù hợp, sử dụng kiến trúc không máy chủ để loại bỏ quản trị hạ tầng, tự động mở rộng và chỉ trả cho những gì bạn dùng, tăng hiệu quả và tối ưu chi phí.
  • Đảm bảo khả năng chịu lỗi của hệ thống: Thiết kế microservice chịu lỗi và bền bỉ, dùng tính năng sẵn có tích hợp của AWS để duy trì liên tục dịch vụ.
  • Tập trung vào khía cạnh xuyên suốt dịch vụ: Giải quyết giám sát phân tán, logging, tracing và tính nhất quán dữ liệu để duy trì sức khỏe và hiệu năng hệ thống.
  • Rà soát với AWS Well-Architected Framework: Dùng AWS Well-Architected Tool để đánh giá kiến trúc theo thực hành tốt nhất của AWS, đảm bảo độ tin cậy, bảo mật, hiệu quả và tối ưu chi phí.

Bằng cách cân nhắc kỹ các điểm này, đội ngũ có thể triển khai kiến trúc microservice có khả năng mở rộng, linh hoạt, phù hợp nhu cầu ứng dụng, đồng thời tận dụng mạnh mẽ năng lực đám mây của AWS.

Mối quan hệ giữa AWS Glue và AWS Lake Formation là gì?

AWS Lake Formation xây dựng dựa trên hạ tầng của AWS Glue, tích hợp khả năng ETL, bảng điều khiển, danh mục dữ liệu và kiến trúc serverless của Glue. Trong khi AWS Glue tập trung vào quy trình ETL, Lake Formation bổ sung tính năng xây dựng, bảo mật và quản lý data lake, nâng cao chức năng của Glue.

Với các câu hỏi phỏng vấn AWS Glue, điều quan trọng là hiểu Glue hỗ trợ Lake Formation như thế nào. Ứng viên nên sẵn sàng thảo luận vai trò của Glue trong quản lý data lake trong AWS, thể hiện hiểu biết về tích hợp và chức năng của cả hai dịch vụ trong hệ sinh thái AWS. Điều này cho thấy sự hiểu biết sâu về cách các dịch vụ này phối hợp để xử lý và quản lý dữ liệu hiệu quả.

Tối ưu chi phí AWS cho ứng dụng web lưu lượng cao như thế nào?

Để tối ưu chi phí AWS cho ứng dụng lưu lượng cao, bạn có thể bắt đầu bằng cách dùng AWS Cost Explorer và AWS Budgets để giám sát và quản lý chi tiêu. Sau đó, cân nhắc các chiến lược sau:

  • Dùng Reserved và Spot Instances lần lượt cho khối lượng công việc dự đoán được và linh hoạt.
  • Tự động mở rộng giúp điều chỉnh phân bổ tài nguyên theo nhu cầu, giảm chi phí trong giai đoạn ít lưu lượng.
  • Tối ưu lưu trữ với chính sách vòng đời Amazon S3 và S3 Intelligent-Tiering để chuyển dữ liệu ít truy cập sang lớp lưu trữ tiết kiệm.
  • Triển khai bộ nhớ đệm với Amazon CloudFront và Amazon ElastiCache để giảm yêu cầu lặp lại tới tài nguyên backend, tiết kiệm băng thông và chi phí tính toán.

Cách tiếp cận này đảm bảo ứng dụng hiệu quả chi phí mà không đánh đổi hiệu năng hoặc tính sẵn sàng.

Các trụ cột chính của AWS Well-Architected Framework là gì?

AWS Well-Architected Framework cung cấp cách tiếp cận có cấu trúc để thiết kế kiến trúc AWS an toàn, hiệu quả và bền bỉ. Nó gồm năm trụ cột chính:

  • Vận hành xuất sắc: Tập trung hỗ trợ phát triển và vận hành qua giám sát, phản hồi sự cố và tự động hóa.
  • Bảo mật: Bao gồm bảo vệ dữ liệu, hệ thống và tài sản qua quản lý danh tính, mã hóa và phản ứng sự cố.
  • Độ tin cậy: Xây dựng hệ thống có thể phục hồi sau lỗi, mở rộng tài nguyên động và xử lý vấn đề mạng.
  • Hiệu năng: Khuyến khích sử dụng tài nguyên có khả năng mở rộng và tối ưu khối lượng công việc.
  • Tối ưu chi phí: Tập trung quản lý chi phí bằng cách chọn đúng tài nguyên và dùng mô hình định giá như Reserved Instances.

Hiểu các trụ cột này giúp kiến trúc sư AWS xây dựng giải pháp cân bằng, phù hợp thực hành tốt nhất về bảo mật, hiệu năng, độ tin cậy và quản lý chi phí.

Câu hỏi phỏng vấn AWS nâng cao và câu trả lời

Câu hỏi phỏng vấn kỹ sư dữ liệu AWS

Hướng đến kỹ sư dữ liệu, phần này đi sâu vào các dịch vụ AWS cho xử lý dữ liệu, bao gồm kho dữ liệu và xử lý thời gian thực. Nội dung xem xét chuyên môn cần có để xây dựng pipeline dữ liệu có khả năng mở rộng với AWS.

Mô tả sự khác nhau giữa Amazon Redshift, RDS và S3, và khi nào nên dùng từng dịch vụ?

  • Amazon S3 là dịch vụ lưu trữ đối tượng cung cấp lưu trữ có thể mở rộng và bền vững cho bất kỳ lượng dữ liệu nào. Có thể dùng để lưu dữ liệu thô, phi cấu trúc như log, CSV, hình ảnh, v.v.
  • Amazon Redshift là kho dữ liệu đám mây tối ưu cho phân tích và business intelligence. Nó tích hợp với S3 và có thể nạp dữ liệu từ đó để thực hiện truy vấn phức tạp và tạo báo cáo.
  • Amazon RDS cung cấp cơ sở dữ liệu quan hệ được quản lý như PostgreSQL, MySQL, v.v. Có thể vận hành ứng dụng giao dịch cần cơ sở dữ liệu tuân thủ ACID với tính năng như lập chỉ mục, ràng buộc, v.v.

Mô tả kịch bản bạn sẽ dùng Amazon Kinesis thay vì AWS Lambda để xử lý dữ liệu. Những cân nhắc chính là gì?

Kinesis có thể dùng để xử lý lượng lớn dữ liệu streaming và cho phép đọc, xử lý luồng với ứng dụng tiêu thụ.

Một số cân nhắc chính như sau:

  • Khối lượng dữ liệu: Kinesis có thể xử lý đến hàng megabyte mỗi giây so với giới hạn 6MB mỗi lần gọi của Lambda, hữu ích cho luồng thông lượng cao.
  • Xử lý streaming: Ứng dụng tiêu thụ Kinesis có thể xử lý liên tục theo thời gian thực khi dữ liệu đến, khác với các lệnh gọi theo lô của Lambda, giúp giảm độ trễ.
  • Khả năng phát lại: Kinesis lưu dữ liệu trong thời gian cấu hình, cho phép phát lại và xử lý lại khi cần, trong khi Lambda không phù hợp cho phát lại.
  • Thứ tự: Shard của Kinesis cho phép xử lý có thứ tự với bản ghi liên quan. Lambda có thể xử lý sai thứ tự.
  • Mở rộng và song song: Shard của Kinesis có thể mở rộng để xử lý tải. Lambda có thể cần điều phối.
  • Tích hợp: Kinesis tích hợp tốt với dịch vụ AWS khác như Firehose, Redshift, EMR cho phân tích.

Hơn nữa, cho các trường hợp xử lý luồng có khối lượng lớn, liên tục, có thứ tự và có thể phát lại như phân tích thời gian thực, Kinesis cung cấp hỗ trợ streaming gốc so với cách tiếp cận theo lô của Lambda.

Để tìm hiểu thêm về streaming dữ liệu, khóa học Streaming Data with AWS Kinesis and Lambda giúp người học tận dụng công nghệ này để thu nhận dữ liệu từ hàng triệu nguồn và phân tích theo thời gian thực. Điều này có thể giúp chuẩn bị tốt hơn cho các câu hỏi phỏng vấn về AWS Lambda.

Những khác biệt chính giữa xử lý dữ liệu theo lô và thời gian thực là gì? Khi nào chọn cách tiếp cận này thay vì cách kia cho dự án kỹ thuật dữ liệu?

Xử lý theo lô là thu thập dữ liệu trong một khoảng thời gian và xử lý theo từng khối lớn. Cách này phù hợp phân tích dữ liệu lịch sử, ít thường xuyên.

Xử lý streaming thời gian thực phân tích dữ liệu liên tục khi đến theo từng phần nhỏ. Nó cho phép phân tích dữ liệu mới, cập nhật thường xuyên.

Với dự án kỹ thuật dữ liệu, có thể chọn streaming thời gian thực khi:

  • Bạn cần insight ngay lập tức và không thể chờ quy trình theo lô chạy. Ví dụ: phát hiện gian lận.
  • Dữ liệu thay đổi liên tục và phân tích cần theo kịp, như giám sát mạng xã hội.
  • Cần độ trễ thấp, như trong hệ thống giao dịch tự động.

Xử lý theo lô có thể tốt hơn khi:

  • Dữ liệu lịch sử cần mô hình hóa hay phân tích phức tạp, như dự báo nhu cầu.
  • Dữ liệu đến từ nguồn chỉ cung cấp theo đợt định kỳ.
  • Ưu tiên giảm chi phí xử lý hơn là tốc độ xử lý.

Vì thế, thời gian thực phù hợp dữ liệu thay đổi nhanh cần phân tích liên tục, còn theo lô phù hợp dữ liệu có sẵn theo định kỳ cần mô hình hóa lịch sử.

Làm sao tự động hóa tiến hóa schema trong pipeline dữ liệu trên AWS?

Có thể quản lý tiến hóa schema bằng tính năng dynamic frame và suy luận schema của AWS Glue. Kết hợp với Glue Data Catalog, bạn có thể tự động theo dõi thay đổi schema. Để tránh phá vỡ quy trình hạ lưu, triển khai bước xác thực schema bằng công cụ như AWS Deequ hoặc tích hợp logic tùy chỉnh vào script ETL để ghi log và xử lý không khớp.

Bạn xử lý schema-on-read so với schema-on-write trong data lake AWS như thế nào?

Schema-on-read thường dùng trong data lake nơi dữ liệu thô, bán cấu trúc được lưu (ví dụ trong S3), và schema chỉ áp dụng khi truy vấn bằng công cụ như Athena hoặc Redshift Spectrum. Cách này linh hoạt cho nguồn dữ liệu đa dạng. Schema-on-write, thường dùng trong RDS hoặc Redshift, áp đặt cấu trúc ngay từ đầu và phù hợp bộ dữ liệu giao dịch hoặc có cấu trúc cần xác thực nghiêm ngặt.

Operational data store là gì và nó bổ trợ cho data warehouse như thế nào?

Operational data store (ODS) là cơ sở dữ liệu được thiết kế để hỗ trợ vận hành doanh nghiệp và phân tích theo thời gian thực. Nó đóng vai trò nền tảng trung gian giữa hệ thống giao dịch và data warehouse.

Trong khi data warehouse chứa dữ liệu chất lượng cao được tối ưu cho BI và báo cáo, ODS chứa dữ liệu cập nhật, theo chủ đề, tích hợp từ nhiều nguồn.

Dưới đây là các đặc điểm chính của ODS:

  • Cung cấp dữ liệu thời gian thực cho giám sát vận hành và ra quyết định
  • Tích hợp dữ liệu trực tiếp từ nhiều nguồn
  • Tối ưu cho truy vấn và phân tích nhanh so với lưu trữ dài hạn
  • ODS chứa dữ liệu chi tiết, hạt mịn so với dữ liệu tổng hợp trong warehouse

ODS và data warehouse là hệ thống bổ trợ. ODS hỗ trợ vận hành thời gian thực với dữ liệu hiện hành, trong khi data warehouse cho phép báo cáo và phân tích chiến lược dựa trên dữ liệu lịch sử tích hợp. Kết hợp lại, chúng tạo nền tảng toàn diện cho cả nhu cầu vận hành và phân tích.

Bạn sẽ thiết lập data lake trên AWS như thế nào và dùng những dịch vụ nào?

Để xây dựng data lake trên AWS, dịch vụ cốt lõi khởi đầu là Amazon S3 để lưu dữ liệu thô, có cấu trúc và phi cấu trúc theo cách có thể mở rộng và bền vững. Dưới đây là cách tiếp cận theo bước và dịch vụ bổ trợ:

  • Lớp lưu trữ: Dùng Amazon S3 để lưu trữ khối lượng dữ liệu lớn. Tổ chức dữ liệu với cấu trúc thư mục dựa trên loại dữ liệu, nguồn hoặc độ mới.
  • Gắn nhãn dữ liệu: Dùng AWS Glue để tạo data catalog, giúp tìm kiếm và truy vấn dữ liệu trong S3 dễ hơn bằng cách tạo định nghĩa siêu dữ liệu.
  • Biến đổi và ETL: Dùng AWS Glue ETL để chuẩn bị và chuyển đổi dữ liệu thô sang định dạng sẵn sàng phân tích.
  • Bảo mật và kiểm soát truy cập: Triển khai AWS IAM và AWS Lake Formation để quản lý truy cập, quyền hạn và mã hóa dữ liệu.
  • Phân tích và truy vấn: Dùng Amazon Athena cho truy vấn tức thời, Amazon Redshift Spectrum cho phân tích, và Amazon QuickSight để trực quan hóa.

Thiết lập này mang lại kiến trúc data lake linh hoạt, có thể mở rộng, xử lý khối lượng dữ liệu lớn cho phân tích dữ liệu có cấu trúc và phi cấu trúc.

Giải thích các lớp lưu trữ khác nhau trong Amazon S3 và khi nào dùng mỗi loại.

Amazon S3 cung cấp nhiều lớp lưu trữ, mỗi lớp được tối ưu cho trường hợp sử dụng và yêu cầu chi phí cụ thể. Bảng sau tóm tắt: 

Lớp lưu trữ Trường hợp sử dụng Tần suất truy cập Hiệu quả chi phí
S3 Standard Dữ liệu truy cập thường xuyên Cao Định giá tiêu chuẩn
S3 Intelligent-Tiering Mẫu truy cập khó dự đoán Điều chỉnh tự động Tiết kiệm chi phí với phân tầng tự động
S3 Standard-IA Ít truy cập nhưng cần truy xuất nhanh Thấp Chi phí thấp hơn, truy xuất nhanh
S3 One Zone-IA Ít truy cập trong một AZ Thấp Chi phí thấp hơn, ít dự phòng hơn
S3 Glacier Lưu trữ lưu trữ dài hạn, ít truy cập Hiếm Chi phí thấp, truy xuất trong vài phút hoặc giờ
S3 Glacier Deep Archive Lưu trữ tuân thủ/quy định Rất hiếm Chi phí thấp nhất, truy xuất 12–48 giờ

Hiểu các lớp lưu trữ S3 giúp tối ưu chi phí lưu trữ và thời gian truy cập theo nhu cầu dữ liệu cụ thể.

Câu hỏi AWS dựa trên tình huống

Tập trung vào ứng dụng thực tiễn, những câu hỏi này đánh giá khả năng giải quyết vấn đề trong các kịch bản thực tế, đòi hỏi sự hiểu biết toàn diện về cách triển khai dịch vụ AWS để xử lý thách thức phức tạp.

Bảng sau tóm tắt các tình huống thường được hỏi trong phỏng vấn AWS, cùng mô tả và giải pháp tiềm năng:

Loại tình huống

Mô tả

Giải pháp

Di chuyển ứng dụng

Một công ty dự định di chuyển ứng dụng kế thừa lên AWS. Ứng dụng nặng về dữ liệu và yêu cầu truy cập độ trễ thấp cho người dùng toàn cầu. Bạn đề xuất dịch vụ và kiến trúc AWS nào để đảm bảo sẵn sàng cao và độ trễ thấp?

  • EC2 cho tính toán
  • S3 cho lưu trữ
  • CloudFront cho phân phối nội dung
  • Route 53 cho định tuyến DNS

Khắc phục thảm họa

Tổ chức của bạn muốn triển khai kế hoạch khắc phục thảm họa cho khối lượng công việc AWS quan trọng với RPO (Mục tiêu điểm khôi phục) 5 phút và RTO (Mục tiêu thời gian khôi phục) 1 giờ. Mô tả các dịch vụ AWS bạn sẽ dùng để đáp ứng mục tiêu này.

  • Backup để sao lưu định kỳ dữ liệu và hệ thống quan trọng với RPO 5 phút
  • CloudFormation để định nghĩa và cấp phát hạ tầng DR trên nhiều khu vực
  • Bật Cross Region Replication trong S3 để sao chép bản sao lưu qua các khu vực
  • Thiết lập CloudWatch alarms để giám sát hệ thống và tự động kích hoạt failover nếu có sự cố

Bảo vệ trước tấn công DDoS

Xem xét kịch bản bạn cần thiết kế hạ tầng ứng dụng web có khả năng mở rộng và an toàn trên AWS. Ứng dụng phải xử lý đột biến lưu lượng và bảo vệ trước tấn công DDoS. Bạn sẽ dùng dịch vụ và tính năng AWS nào trong thiết kế?

  • CloudFront và Route 53 cho phân phối nội dung
  • Nhóm Auto Scaling của EC2 trên nhiều vùng sẵn sàng để mở rộng
  • Shield cho bảo vệ DDoS
  • CloudWatch cho giám sát
  • Web Application Firewall (WAF) để lọc yêu cầu độc hại

Phân tích dữ liệu thời gian thực

Một startup IoT muốn xử lý và phân tích dữ liệu thời gian thực từ hàng nghìn cảm biến toàn cầu. Giải pháp cần khả năng mở rộng cao và tiết kiệm chi phí. Bạn sẽ dùng dịch vụ AWS nào để xây dựng nền tảng này và đảm bảo khả năng mở rộng theo nhu cầu?

  • Kinesis để thu nhận dữ liệu thời gian thực
  • EC2 và EMR cho xử lý phân tán
  • Redshift cho truy vấn phân tích
  • Auto Scaling để tự động tăng/giảm tài nguyên theo nhu cầu

Phân tích dữ liệu khối lượng lớn

Một công ty dịch vụ tài chính cần giải pháp phân tích dữ liệu trên AWS để xử lý và phân tích khối lượng lớn dữ liệu giao dịch theo thời gian thực. Giải pháp cũng phải tuân thủ tiêu chuẩn bảo mật và tuân thủ nghiêm ngặt. Bạn sẽ kiến trúc giải pháp này như thế nào và áp dụng biện pháp gì để đảm bảo an ninh và tuân thủ?

  • Kinesis và Kafka cho thu nhận dữ liệu thời gian thực
  • EMR cho xử lý dữ liệu phân tán
  • Redshift cho truy vấn phân tích
  • CloudTrail và Config để cung cấp giám sát tuân thủ và quản lý cấu hình
  • Tận dụng nhiều vùng sẵn sàng và chính sách IAM cho kiểm soát truy cập.

Câu hỏi phỏng vấn AWS phi kỹ thuật

Bên cạnh năng lực kỹ thuật, việc hiểu tác động rộng hơn của giải pháp AWS là yếu tố quan trọng để phỏng vấn thành công, và dưới đây là một vài câu hỏi cùng với câu trả lời gợi ý. Các câu trả lời có thể khác nhau tùy kinh nghiệm và nền tảng của từng ứng viên.

Bạn cập nhật các xu hướng công nghệ AWS và đám mây như thế nào?

  • Kỳ vọng từ ứng viên: Người phỏng vấn muốn biết cam kết học hỏi liên tục và cách bạn giữ kỹ năng phù hợp. Họ tìm kiếm nguồn lực hay thực hành cụ thể bạn dùng để cập nhật thông tin.
  • Câu trả lời mẫu: "Tôi cập nhật bằng cách đọc blog chính thức của AWS và tham gia cộng đồng như subreddit AWS. Tôi cũng tham dự meetup nhóm người dùng AWS địa phương và webinar. Những hoạt động này giúp tôi nắm được các tính năng AWS mới và thực hành tốt nhất."

Mô tả lần bạn phải giải thích một khái niệm AWS phức tạp cho người không có nền tảng kỹ thuật. Bạn đã làm thế nào?

  • Kỳ vọng từ ứng viên: Câu hỏi này đánh giá kỹ năng giao tiếp và khả năng đơn giản hóa thông tin phức tạp. Người phỏng vấn tìm bằng chứng về khả năng truyền đạt và sự kiên nhẫn.
  • Câu trả lời mẫu: "Trong vai trò trước đây, tôi cần giải thích lợi ích lưu trữ đám mây cho các bên liên quan không kỹ thuật. Tôi dùng phép so sánh lưu trữ tệp trên cloud drive so với ổ cứng vật lý, nhấn mạnh khả năng truy cập dễ dàng và bảo mật. Điều này giúp họ hiểu khái niệm mà không cần đi sâu kỹ thuật."

Điều gì thúc đẩy bạn làm việc trong ngành điện toán đám mây, đặc biệt với AWS?

  • Kỳ vọng từ ứng viên: Người phỏng vấn muốn đánh giá niềm đam mê của bạn với lĩnh vực và hiểu điều gì thúc đẩy bạn. Họ tìm kiếm động lực chân thật phù hợp vai trò và giá trị công ty.
  • Câu trả lời mẫu: "Điều khiến tôi hứng thú với điện toán đám mây, đặc biệt là AWS, là sức mạnh chuyển đổi trong việc mở rộng doanh nghiệp và thúc đẩy đổi mới. Sự phát triển không ngừng của dịch vụ AWS thúc đẩy tôi giải quyết thách thức mới và đóng góp vào dự án tác động cao."

Bạn có thể mô tả một dự án thách thức bạn đã quản lý và cách bạn đảm bảo thành công?

  • Kỳ vọng từ ứng viên: Ở đây, trọng tâm là kỹ năng quản lý dự án và giải quyết vấn đề. Người phỏng vấn quan tâm cách bạn vượt qua trở ngại và đưa dự án đến đích.
  • Câu trả lời mẫu: "Trong một dự án trước, chúng tôi bị chậm đáng kể do hạn chế tài nguyên. Tôi ưu tiên nhiệm vụ theo tác động, đàm phán để có thêm tài nguyên và giữ liên lạc rõ ràng với đội và các bên liên quan. Cách tiếp cận này giúp chúng tôi đáp ứng các mốc và cuối cùng giao hàng đúng hạn."

Bạn xử lý hạn chót gấp khi nhiều dự án cùng đòi hỏi sự chú ý như thế nào?

  • Kỳ vọng từ ứng viên: Câu hỏi này kiểm tra kỹ năng quản lý thời gian và ưu tiên. Người phỏng vấn muốn biết cách bạn quản lý căng thẳng và khối lượng công việc hiệu quả.
  • Câu trả lời mẫu: "Tôi kết hợp ưu tiên và ủy quyền. Tôi đánh giá mức khẩn và tác động của mỗi dự án, ưu tiên phù hợp và ủy quyền khi thích hợp. Tôi cũng thường xuyên trao đổi với các bên liên quan về tiến độ và điều chỉnh cần thiết để đáp ứng hạn chót."

Theo bạn, điều gì khiến AWS khác biệt so với các nhà cung cấp đám mây khác?

  • Kỳ vọng từ ứng viên: Người phỏng vấn muốn thấy bạn hiểu đề xuất giá trị độc đáo của AWS. Mục tiêu là xem bạn nắm bắt tốt điều khiến AWS dẫn đầu ngành đám mây.
  • Câu trả lời mẫu: "AWS khác biệt nhờ hạ tầng toàn cầu rộng lớn, mang lại khả năng mở rộng và độ tin cậy vượt trội. Bên cạnh đó, cam kết đổi mới của AWS, với danh mục dịch vụ rộng và sâu, cho phép giải pháp đám mây linh hoạt và phù hợp hơn so với đối thủ."

Bạn tiếp cận việc học công cụ hay dịch vụ AWS mới khi chúng được giới thiệu như thế nào?

  • Kỳ vọng từ ứng viên: Câu hỏi này đánh giá khả năng thích ứng và phong cách học của bạn. Người phỏng vấn muốn thấy bạn chủ động làm chủ công nghệ mới, điều thiết yếu trong lĩnh vực đám mây phát triển nhanh.
  • Câu trả lời mẫu: "Khi AWS giới thiệu dịch vụ mới, tôi bắt đầu bằng việc đọc tài liệu chính thức và ghi chú phát hành để hiểu mục đích và chức năng. Sau đó, tôi tìm hướng dẫn thực hành và thử nghiệm trong môi trường sandbox để có kinh nghiệm thực tế. Nếu có thể, tôi thảo luận với đồng nghiệp hoặc tham gia diễn đàn để xem người khác tận dụng ra sao. Sự kết hợp giữa lý thuyết và thực hành giúp tôi nhanh chóng làm quen công cụ mới."

Mô tả cách bạn cân bằng bảo mật và hiệu quả khi thiết kế giải pháp AWS.

  • Kỳ vọng từ ứng viên: Người phỏng vấn đang đánh giá khả năng tư duy chiến lược về bảo mật đồng thời cân nhắc hiệu năng. Mục tiêu là thấy bạn có thể cân bằng thực hành tốt nhất về bảo mật với nhu cầu hiệu quả vận hành.
  • Câu trả lời mẫu: "Tôi tin rằng bảo mật và hiệu quả song hành. Khi thiết kế giải pháp AWS, tôi bắt đầu với tư duy bảo mật trước bằng cách triển khai chính sách IAM, cô lập mạng với VPC và mã hóa dữ liệu. Về hiệu quả, tôi đảm bảo các biện pháp bảo mật này không tạo độ trễ không cần thiết bằng cách tối ưu cấu hình và chọn dịch vụ có khả năng mở rộng như AWS Lambda cho tác vụ tính toán chuyên sâu. Cách tiếp cận của tôi là xây dựng kiến trúc an toàn đồng thời phản hồi nhanh và tối ưu chi phí."

Kết luận

Bài viết này đã cung cấp lộ trình toàn diện về các câu hỏi phỏng vấn AWS cho ứng viên ở nhiều cấp độ chuyên môn—từ người mới bắt đầu khám phá thế giới AWS đến các chuyên gia dày dạn muốn nâng tầm sự nghiệp.

Dù bạn đang chuẩn bị cho buổi phỏng vấn AWS đầu tiên hay hướng tới vị trí cao hơn, hướng dẫn này là nguồn lực vô giá. Nó không chỉ giúp bạn trả lời câu hỏi phỏng vấn mà còn thúc đẩy bạn tương tác sâu với nền tảng AWS, nâng cao hiểu biết và khả năng ứng dụng hệ sinh thái phong phú của nó.

FAQs

Tôi có cần chứng chỉ AWS để có được công việc liên quan đến đám mây không?

Dù không bắt buộc, các chứng chỉ AWS như AWS Certified Solutions Architect Associate hoặc AWS Certified Developer Associate xác thực chuyên môn và tăng sức nặng cho hồ sơ. Nhiều nhà tuyển dụng coi trọng chứng chỉ như bằng chứng kỹ năng, nhưng kinh nghiệm thực tế cũng quan trọng không kém.

Những dịch vụ AWS quan trọng nhất cần tập trung cho phỏng vấn là gì?

Các dịch vụ AWS chủ chốt phụ thuộc vào vị trí bạn ứng tuyển. Một số dịch vụ quan trọng chung gồm:

  • Tính toán: EC2, Lambda.
  • Lưu trữ: S3, EBS, Glacier.
  • Mạng: VPC, Route 53, ELB.
  • Bảo mật: IAM, KMS.
  • Cơ sở dữ liệu: RDS, DynamoDB.
  • Công cụ DevOps: CloudFormation, CodePipeline.

Những kỹ năng phi kỹ thuật nào là thiết yếu để thành công trong phỏng vấn AWS?

Bên cạnh chuyên môn kỹ thuật, nhà tuyển dụng thường đánh giá:

  • Giải quyết vấn đề: Bạn có thể thiết kế giải pháp có khả năng mở rộng, tiết kiệm chi phí không?
  • Giao tiếp: Bạn có thể giải thích khái niệm kỹ thuật rõ ràng cho các bên liên quan không?
  • Quản lý thời gian: Bạn ưu tiên công việc và đáp ứng hạn chót trong môi trường năng động như thế nào?
  • Làm việc nhóm: Bạn có thể cộng tác hiệu quả trong đội đa chức năng không?

Nếu tôi không biết câu trả lời cho câu hỏi kỹ thuật trong phỏng vấn AWS thì sao?

Không biết hết là điều bình thường. Thay vì đoán, hãy thành thật:

  • Giải thích cách bạn sẽ tìm câu trả lời (ví dụ: tham khảo tài liệu AWS hoặc tiến hành thử nghiệm).
  • Nhấn mạnh kiến thức liên quan thể hiện hiểu biết khái niệm rộng hơn.

Làm sao tôi có thể đàm phán lương cho vị trí liên quan đến AWS?

  • Nghiên cứu mức lương thị trường cho vai trò và khu vực của bạn bằng các trang như Glassdoor hoặc Payscale.
  • Nêu bật chứng chỉ, kinh nghiệm liên quan và dự án của bạn trong quá trình đàm phán.
  • Chứng minh kỹ năng của bạn mang lại giá trị cho công ty, như tiết kiệm chi phí hoặc cải thiện độ tin cậy hạ tầng.

Tôi nên làm gì sau khi trượt kỳ thi chứng chỉ hoặc phỏng vấn AWS?

  • Xác định điểm yếu dựa trên phản hồi hoặc báo cáo kỳ thi.
  • Tạo kế hoạch học hoặc luyện tập để củng cố các mảng đó.
  • Tận dụng nguồn lực bổ sung như bài thi thử hoặc phòng lab thực hành.
  • Đừng nản chí—nhiều chuyên gia vượt qua ở lần thứ hai hoặc thứ ba.

Zoumana Keita 's photo
Author
Zoumana Keita
LinkedIn
Twitter

Nhà khoa học dữ liệu đa tài, yêu thích chia sẻ kiến thức và đóng góp cho cộng đồng, Zoumana là người sáng tạo nội dung trên YouTube và là cây bút công nghệ hàng đầu trên Medium. Anh yêu thích thuyết trình, lập trình và giảng dạy. Zoumana có hai bằng thạc sĩ: một về khoa học máy tính chuyên sâu Học máy tại Paris, Pháp, và một về Khoa học dữ liệu tại Texas Tech University, Hoa Kỳ. Anh bắt đầu sự nghiệp với vai trò Nhà phát triển phần mềm tại Groupe OPEN ở Pháp, sau đó chuyển sang IBM làm Tư vấn Học máy, nơi anh phát triển các giải pháp AI đầu-cuối cho các công ty bảo hiểm. Zoumana gia nhập Axionable, startup Trí tuệ nhân tạo Bền vững đầu tiên có trụ sở tại Paris và Montreal. Tại đây, anh làm Nhà khoa học dữ liệu và triển khai các sản phẩm AI, chủ yếu là các bài toán NLP, cho khách hàng tại Pháp, Montreal, Singapore và Thụy Sĩ. Ngoài ra, 5% thời gian của anh được dành cho Nghiên cứu và Phát triển. Hiện tại, anh làm việc với vai trò Nhà khoa học dữ liệu cao cấp tại IFC - Nhóm Ngân hàng Thế giới.

Chủ đề

Bắt đầu hành trình AWS của bạn ngay hôm nay!

Courses

Hiểu về Điện toán Đám mây

2 giờ
224K
Một giới thiệu cơ bản về điện toán đám mây, bao gồm các khái niệm chính, thuật ngữ và công cụ.
Xem chi tiếtRight Arrow
Bắt đầu khóa học
Xem thêmRight Arrow