AWS

AWS DataSync: 온프레미스 데이터를 클라우드로 이전

heesoohi 2025. 6. 5. 01:30

AWS DataSync는 온프레미스 스토리지와 AWS 클라우드 간에 데이터를 빠르고 안전하게 전송할 수 있도록 도와주는 완전관리형 데이터 이동 서비스이다. 단순히 파일을 복사하는 것이 아니라, 대규모 데이터 이동, 네트워크 최적화, 무결성 검증, 보안 전송, 스케줄 자동화까지 포함된 전문 전송 솔루션이다.

 

DataSync는 다음과 같은 상황에서 매우 유용하다.

  • 사내 파일 서버(NAS 등)에 있는 데이터를 S3나 EFS로 이전하고자 할 때
  • 정기적으로 변경되는 파일을 스케줄에 따라 동기화하고자 할 때
  • 기존 데이터를 AWS로 백업하거나 마이그레이션할 때
  • 클라우드에서 분석 및 머신러닝을 위한 데이터 이동이 필요한 경우

 

DataSync는 아래 순서대로 동작한다.

  1. 에이전트 설치
    • 온프레미스 VM(VMware, Hyper-V 등)에 DataSync 에이전트를 설치
    • 이 에이전트는 NFS 또는 SMB 파일 공유를 통해 로컬 데이터를 읽는다.
  2. 작업(Task) 생성
    • AWS 콘솔 또는 CLI를 통해 작업을 생성
    • 소스는 온프레미스 파일 시스템, 대상은 S3, EFS, FSx 중 선택
  3. 데이터 전송
    • 작업 실행 시 병렬로 데이터를 읽고, TLS 암호화로 AWS로 전송
    • 전송 중 데이터 무결성 검사를 수행하여 정확히 복사되었는지 확인
  4. 자동화 및 감사
    • 주기적인 스케줄을 설정하여 자동 동기화 가능
    • AWS CloudTrail을 통해 누가 어떤 작업을 했는지 감사 가능

보안 및 성능 특징

TLS 암호화 데이터 전송 중 암호화를 통해 보안 확보
병렬 전송 처리 빠른 속도를 위한 다중 스레드 전송
무결성 검증 체크섬을 통한 데이터 손상 방지
IAM 통합 역할 기반 권한 제어 지원
CloudWatch 연동 전송 상태 모니터링 가능

 

Storage Gateway와의 차이점

  DataSync Storage Gateway
목적 대량 데이터 이동 로컬에서 클라우드 스토리지를 계속 사용
전송 방향 주로 온프레미스 → AWS 양방향 가능
사용 형태 데이터 이전 후 AWS에서 직접 사용 로컬에서 계속 AWS 파일 접근
주요 사용처 마이그레이션, 백업 NAS 대체, 하이브리드 운영