스토리지 문제풀이

💡 문제 1

한 데이터 분석 팀이 Amazon S3 버킷에 저장된 대규모 데이터셋을 활용하는 머신러닝 모델 학습 플랫폼을 구축하고 있습니다. 이 팀은 모델 학습 속도를 높이기 위해 S3와 원활하게 연동되면서도 높은 처리량과 낮은 지연 시간을 제공하는 고성능 스토리지 솔루션을 찾고 있습니다. 또한, 스토리지 관리에 드는 운영 부담을 최소화하고자 합니다. 다음 중 이러한 요구 사항을 충족하는 최적의 솔루션은 무엇입니까?

Amazon EBS(Elastic Block Store) 볼륨을 프로비저닝하고, AWS DataSync를 사용하여 S3 데이터를 EBS로 주기적으로 동기화합니다.
Amazon EC2 인스턴스에 대용량 인스턴스 스토어를 연결하고, S3 API를 사용하여 학습 데이터를 인스턴스 스토어로 복사합니다.
Amazon FSx for Lustre 파일 시스템을 생성하고 S3 버킷과 연결합니다.
Amazon EMR 클러스터를 배포하고, 학습 데이터는 S3 데이터를 HDFS(Hadoop Distributed File System)로 복사하여 처리합니다.

💡 문제 2

한 연구소에서 유체 역학 시뮬레이션을 수행하기 위해 대규모 병렬 처리가 가능한 고성능 컴퓨팅 클러스터를 AWS에 구축하고 있습니다. 이 시뮬레이션은 수천 개의 노드에서 동시에 데이터를 읽고 써야 하므로 스토리지의 높은 IOPS와 처리량이 필수적입니다. 이러한 요구 사항을 충족하는 스토리지 솔루션 조합은 무엇입니까? (2개 선택)

처리된 데이터를 영구 보관하기 위해 Amazon S3 Glacier Deep Archive를 사용합니다.
고성능 병렬 파일 시스템으로 Amazon FSx for Lustre를 사용합니다.
컴퓨팅 노드 간의 저지연 통신을 위해 클러스터 배치 그룹(Cluster Placement Group)을 사용합니다.
비용 절감을 위해 모든 노드를 스팟 인스턴스로만 구성하고 로컬 인스턴스 스토어를 주 스토리지로 사용합니다.
범용 파일 공유를 위해 Amazon EFS(Elastic File System)를 사용합니다.

💡 문제 3

한 글로벌 기업이 다양한 운영체제(Windows, Linux, macOS)를 사용하는 직원들이 공유하는 문서 중앙 저장소를 온프레미스에서 AWS로 이전하려고 합니다. 직원들은 SMB 및 NFS 프로토콜을 모두 사용하여 문서에 액세스해야 합니다. 데이터의 약 80%는 30일이 지나면 거의 액세스되지 않으므로 스토리지 비용을 절감하는 것이 중요합니다. 운영 오버헤드를 줄이면서 비용 효율적으로 이를 구현하는 방법은 무엇입니까?

Amazon S3 버킷을 생성하고 Storage Gateway 파일 게이트웨이를 통해 SMB/NFS를 지원합니다.
Amazon EFS를 생성하고 EFS 수명 주기 관리(Lifecycle Management)를 활성화하여 오래된 파일을 IA(Infrequent Access) 클래스로 이동합니다.
Amazon FSx for OpenZFS를 배포하고 압축 기능을 활성화합니다.