💡 문제 1
한 데이터 분석 팀이 Amazon S3 버킷에 저장된 대규모 데이터셋을 활용하는 머신러닝 모델 학습 플랫폼을 구축하고 있습니다.
이 팀은 모델 학습 속도를 높이기 위해 S3와 원활하게 연동되면서도 높은 처리량과 낮은 지연 시간을 제공하는 고성능 스토리지 솔루션을 찾고 있습니다. 또한, 스토리지 관리에 드는 운영 부담을 최소화하고자 합니다.
다음 중 이러한 요구 사항을 충족하는 최적의 솔루션은 무엇입니까?
- Amazon EBS(Elastic Block Store) 볼륨을 프로비저닝하고, AWS DataSync를 사용하여 S3 데이터를 EBS로 주기적으로 동기화합니다.
- Amazon EC2 인스턴스에 대용량 인스턴스 스토어를 연결하고, S3 API를 사용하여 학습 데이터를 인스턴스 스토어로 복사합니다.
- Amazon FSx for Lustre 파일 시스템을 생성하고 S3 버킷과 연결합니다.
- Amazon EMR 클러스터를 배포하고, 학습 데이터는 S3 데이터를 HDFS(Hadoop Distributed File System)로 복사하여 처리합니다.
💡 문제 2
한 연구소에서 유체 역학 시뮬레이션을 수행하기 위해 대규모 병렬 처리가 가능한 고성능 컴퓨팅 클러스터를 AWS에 구축하고 있습니다.
이 시뮬레이션은 수천 개의 노드에서 동시에 데이터를 읽고 써야 하므로 스토리지의 높은 IOPS와 처리량이 필수적입니다. 이러한 요구 사항을 충족하는 스토리지 솔루션 조합은 무엇입니까? (2개 선택)
- 처리된 데이터를 영구 보관하기 위해 Amazon S3 Glacier Deep Archive를 사용합니다.
- 고성능 병렬 파일 시스템으로 Amazon FSx for Lustre를 사용합니다.
- 컴퓨팅 노드 간의 저지연 통신을 위해 클러스터 배치 그룹(Cluster Placement Group)을 사용합니다.
- 비용 절감을 위해 모든 노드를 스팟 인스턴스로만 구성하고 로컬 인스턴스 스토어를 주 스토리지로 사용합니다.
- 범용 파일 공유를 위해 Amazon EFS(Elastic File System)를 사용합니다.
💡 문제 3
한 글로벌 기업이 다양한 운영체제(Windows, Linux, macOS)를 사용하는 직원들이 공유하는 문서 중앙 저장소를 온프레미스에서 AWS로 이전하려고 합니다.
직원들은 SMB 및 NFS 프로토콜을 모두 사용하여 문서에 액세스해야 합니다. 데이터의 약 80%는 30일이 지나면 거의 액세스되지 않으므로 스토리지 비용을 절감하는 것이 중요합니다.
운영 오버헤드를 줄이면서 비용 효율적으로 이를 구현하는 방법은 무엇입니까?
- Amazon S3 버킷을 생성하고 Storage Gateway 파일 게이트웨이를 통해 SMB/NFS를 지원합니다.
- Amazon EFS를 생성하고 EFS 수명 주기 관리(Lifecycle Management)를 활성화하여 오래된 파일을
IA(Infrequent Access) 클래스로 이동합니다.
- Amazon FSx for OpenZFS를 배포하고 압축 기능을 활성화합니다.