본문 바로가기
AI 관련/ADsP, ADP

ADsP 기출문제 오답노트 - 이론 정리 2

by 팀장일기 2021. 10. 14.
  • 데이터 웨어하우스는 비휘발성(NonVolatile)을 특징을 가지고 있으므로, 일단 데이터가 적재되면 일괄 처리 (Batch처리)외에는 별도의 갱신이 이루어지지 않는다. 데이터웨어하우스는 데이터를 주제별로 저장하기 때문에 최종사용자 혹은 전산 지식에 약한 분석자도 이해하기 쉬운 형태를 취한다. 

  • 맵리듀스에서 블록크기의 기본값은 64MB이고, 맵 태스크하나가 1개의 블록을대상으로 연산을 수행한다. 따라서 320MB 크기의 파일을 대상으로 작업을 수행하면 5개의 맵 태스크가 생성된다 (320/64=5개)

  • 데이터 스테이징 단계에서는 정기적인 ETL과 실시간 ETL을 혼용할 수 있고, 저장되는 테이블의 스키마는 데이터 원천의 구조에 의존한다. 데이터 원천과 스테이징 테이블과의 매핑은 일대일 혹은 일대다로 구성될수 있다. 

  • HDFS는 파일 데이터를 블록이나 청크 단위로 저장 하며, 데이터에 대한 순차 접근 방식을 지원한다. 

  • 암호화를 통한 데이터 전송은 대용량 비정형 데이터 수집 시스템의 특징에 해당하지 않는다. 대용량 비정형 데이터 수집 시스템은 수집도니 데이터가 저장소에 저장되는 과정에서 단계별로 혹은 인접한 단계 끼리 신호를 주고받아 이벤트의 유실을 방지하는 방식으로 전송을 보장한다. 

  • 대푠적인 가상화 기술인 VMWare, Xen, KVM 등은 laaS에 주로 활용 된다. 

댓글