binary-kim 님의 블로그

  • 홈
  • 태그
  • 방명록

Apache Sqoop 1

[Apache Sqoop] Sqoop이란?

Sqoop이란?Apache Sqoop이란 RDBMS (MySQL, Oracle, ...)에서 Apache Hadoop 간 대용량 데이터 전송을 위해 설계된 도구이며, SQL-On-Hadoop의 약자라고 합니다. ETL / ELT 작업을 수행해야하는 상황에서 수집해야 하는 데이터의 크기가 대용량일 경우 Sqoop의 도입은 효율적인 파이프라인을 구성하는 데 고민해볼 수 있습니다. 간단한 예시로 DW (Data WareHouse)를 위한 파이프라인을 구성한다고 가정해보면...  위 그림과 같이, 다양한 형태의 운영계 DB가 존재하는 상황에서 ETL을 통해 STG / ODS / DW / DM을 구성할 수 있습니다. 여기서  STG 영역은 운영계의 데이터를 그대로 복사하여 저장 / 관리를 진행하는 영역이며, 해당..

Apache Sqoop 2025.01.11
이전
1
다음
더보기
프로필사진

binary-kim 님의 블로그

binary-kim 님의 블로그 입니다.

  • 분류 전체보기 (29)
    • CodeTree (14)
    • Programmers (1)
    • Apache Spark (3)
    • Apache Hadoop (1)
    • Apache Airflow (0)
    • Apache Kafka (0)
    • 교육 후기 (1)
    • 일상 (3)
    • 코테 후기 (3)
    • Apache Sqoop (1)

Tag

Function Module, 카카오 모빌리티, hmg softeer bootcamp, 한화비전, 코테 후기, 코딩테스트, federation, 삼성sw역량평가 #삼성전자, 교육 후기, 2024, CodeTree, 삼성sw역량평가성, 삼성sw역량평가, 현대자동차 소프티어 부트캠프, 글또, 글쓰는 또라이, T-CODE, programmers, MLOps, 삼성전자,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바