AWS DataSync는 온프레미스 스토리지와 AWS 클라우드 간에 데이터를 빠르고 안전하게 전송할 수 있도록 도와주는 완전관리형 데이터 이동 서비스이다. 단순히 파일을 복사하는 것이 아니라, 대규모 데이터 이동, 네트워크 최적화, 무결성 검증, 보안 전송, 스케줄 자동화까지 포함된 전문 전송 솔루션이다.
DataSync는 다음과 같은 상황에서 매우 유용하다.
- 사내 파일 서버(NAS 등)에 있는 데이터를 S3나 EFS로 이전하고자 할 때
- 정기적으로 변경되는 파일을 스케줄에 따라 동기화하고자 할 때
- 기존 데이터를 AWS로 백업하거나 마이그레이션할 때
- 클라우드에서 분석 및 머신러닝을 위한 데이터 이동이 필요한 경우
DataSync는 아래 순서대로 동작한다.
- 에이전트 설치
- 온프레미스 VM(VMware, Hyper-V 등)에 DataSync 에이전트를 설치
- 이 에이전트는 NFS 또는 SMB 파일 공유를 통해 로컬 데이터를 읽는다.
- 작업(Task) 생성
- AWS 콘솔 또는 CLI를 통해 작업을 생성
- 소스는 온프레미스 파일 시스템, 대상은 S3, EFS, FSx 중 선택
- 데이터 전송
- 작업 실행 시 병렬로 데이터를 읽고, TLS 암호화로 AWS로 전송
- 전송 중 데이터 무결성 검사를 수행하여 정확히 복사되었는지 확인
- 자동화 및 감사
- 주기적인 스케줄을 설정하여 자동 동기화 가능
- AWS CloudTrail을 통해 누가 어떤 작업을 했는지 감사 가능
보안 및 성능 특징
TLS 암호화 | 데이터 전송 중 암호화를 통해 보안 확보 |
병렬 전송 처리 | 빠른 속도를 위한 다중 스레드 전송 |
무결성 검증 | 체크섬을 통한 데이터 손상 방지 |
IAM 통합 | 역할 기반 권한 제어 지원 |
CloudWatch 연동 | 전송 상태 모니터링 가능 |
Storage Gateway와의 차이점
DataSync | Storage Gateway | |
목적 | 대량 데이터 이동 | 로컬에서 클라우드 스토리지를 계속 사용 |
전송 방향 | 주로 온프레미스 → AWS | 양방향 가능 |
사용 형태 | 데이터 이전 후 AWS에서 직접 사용 | 로컬에서 계속 AWS 파일 접근 |
주요 사용처 | 마이그레이션, 백업 | NAS 대체, 하이브리드 운영 |
'AWS' 카테고리의 다른 글
AWS Lake Formation 개념 정리 (1) | 2025.06.07 |
---|---|
Auto Scaling 그룹의 휴지 기간(Cooldown) (0) | 2025.06.06 |
Amazon Aurora 병렬 쿼리(Parallel Query) (0) | 2025.06.04 |
Amazon Aurora의 엔드포인트 및 리더 엔드포인트 기반 로드밸런싱 (0) | 2025.06.03 |
Amazon EBS 볼륨 타입 정리 (0) | 2025.06.02 |