역할
SRE팀은 푸망의 서비스 운영에 필요한 모든 인프라를 구축하고 서비스를 안정적으로 운영하는 역할을 합니다. 서비스 운영에는 아마존 웹 서비스(AWS)와 도커(Docker)를 주로 사용 하고 있으며, 클라우드 기반의 인프라 구축 및 운영, 안정적인 서비스 운영을 위한 모니터링, 인프라 관리 시스템 개발에 대한 책임을 집니다. 앞으로 쿠버네티스를 도입하고 Devops와 MLops 시스템을 구축합니다.
업무
- 푸망 플랫폼 서버 운영을 위한 인프라를 구성하고 운영합니다.
- AWS 리소스 코드화 및 관리 자동화를 하고 서비스를 운영합니다.
- 푸망의 컨텐츠 배포에 따른 인프라 운영 자동화 도구와 어드민을 개발합니다.
- 서비스 전반에 대한 모니터링 시스템을 구축하고 운영합니다.
인재상
- Node.js, Go, Python 등 하나 이상의 프로그래밍 언어에 능숙하신 분
- AWS 네트워크와 클라우드 서비스에 대한 이해가 있으신 분
- 마이크로 서비스 아키텍쳐와 REST, gRPC 등 서비스 간 통신에 대한 이해가 있으신 분
- 글로벌 서비스 및 대규모 트래픽 처리를 위한 애플리케이션 인프라 구성 경험이 있으신 분
우대 사항
- 리눅스 커널 및 시스템 퍼포먼스 튜닝, 리눅스 네트워크에 대한 전문성이 있는 분
- WAF, Firewall Manager, AWS Shield 등 클라우드 보안 관련 서비스들을 실무에서 운영해보신 경험이 있으신 분
- 소프트웨어 개발부터 배포 파이프라인 전체에 걸친 침해 위협을 분석하고 보안을 강화해본 경험이 있으신 분