본문 바로가기
AI 관련/ADsP, ADP

ADsP 1과목 공부 _2

by 팀장일기 2021. 5. 9.

■ 암묵지와 형식지

데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 있어 중요한 역할을 함. 

- 암묵지 : 개인에게 축적된 내면화된 지식 => 조직의 지식으로 공통화

- 형식지 : 언어, 기호 , 숫자로 표준화된 지식 => 개인의 지식으로 연결화 

구분 의미 특징 상호작용
암묵지 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식. 김장김치 담그기,
자전거 타기
사회적으로 중요하지만 개인에게 체화되어 있기 때문에 외부에 표출되어 다른 사람에게 공유되기 어려움. 공통화, 내면화
형식지 교과서, 매뉴얼, 비디오, DB와 같이 형상화된 지식을 의미 교과서, 비디오, DB 유형의 대상이 있기 때문에 지식의 전달과 공유가 매우 용이함. 표준화, 연결화

 

■ 기업지원 시스템

Q. 기업 내부 데이터베이스 중 기업 전체가 경영자원을 효과적으로 이용하기 위해 통합적으로 관리하고 경영의 효율화를 기하기 위한 수단으로 정보의 통합을 위해 기업의 모든 자원을 최적으로 관리하기 위한 기업 경영정보시스템은? 

(ERP)

 

 

■ 기업 내부 데이터 베이스

ERP(Enterprise Resource Planning) 

: 인사, 재무, 생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영자원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신 기법을 의미함. 전사적 자원관리.

 

CRM(Customer Relationship Management)

:'고객관계 관리'라고 함. 

기업이 고객과 관련된 내외부 자료를 분석, 통합해 고객 중심 자원을 극대화하고 이를 토대로 고객 특성에 맞게 마케팅 활동을 계획, 지원 평가하는 과정, CRM은 최근에 등장한 데이터베이스 마케팅의 일대일 마케팅. 관계마케팅에서 진화한 요소들을 기반으로 등장하게 되었음. 

 

SCM(Supply Chain Management)

: 기업에서 원재료의 생산, 유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공하는 '공급망 관리'를 뜻함. SCM은 부품 공급업체와 생산업체 그리고 고객에 이르기까지 거래 관계에 있는 기업 간 IT를 이용한 실시간 정보공유를 통해 시장이나 수요자들의 요구에 기민하게 대응토록 지원하는 것임.

 

KMS(Knowledge Management System)

: 기업의 환경이 물품을 주로 생산하던 산업사회에서, 지적 재산의 중요성이 커지는 지식사회로 급격히 이동함에 따라. 기업 경영을 지식이라는 관점에서 새롭게 조명하는 접근방식임. 지식관리시스템. 

 

■ 기업 내부 데이터 베이스

OLAP (On Line Analytical Processing)

: 정보 위주의 분석 처리를 의미하며, 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사결정에 활용할 수 있는 정보를 얻을 수 있게 해 주는 기술. 

 

OLTP(On Line Transaction Processing)

: 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나. 

 

통계분석

: 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구 

 

Data mining

: 대용량 데이터로부터 의미 있는 관계. 규칙. 패턴을 찾는 과정 

 

■ OLTP와 OLAP의 성격 비교 

OLTP(On Line Transaction Processing)

: 호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나이다. 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터 베이스를 액세스 하고. 바로 처리 결과를 돌려보내는 형태를 말한다. 데이터 베이스의 데이터를 수시로 갱신하는 프로세싱을 의미함. 

 

OLAP (On Line Analytical Processing)

:  정보 위주의 분석 처리를 의미하며, 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술임. OLTP에서 처리된 트랜잭션 데이터를 분석해 제품의 판매 추이. 구매 성향 파악. 재무회계 분석 등을 프로세싱하는 것을 의미함. OLAP는 데이터 조회 위주를 의미함. 

 

■ 암묵적 지식과 형식적 지식의 상호작용 

개인의 암묵적 지식을 언어나 기호, 숫자 등의 형태로 표출화하여 현장 경험을 통해 개인에게 축적된 내면화된 지식을 조직의 지식으로 공통화하고 이를 다시 다른 개인이 본인의 지식에 연결하여 그 바탕 위에서 새로운 경험을 부가하여 다시 내면화하는 과정이 반복되는 상호 순환작용을 통해 조직의 지식이 증대됨. 

 

 

■ 빅데이터 시대의 위기 요인

Q.  책임원칙 훼손의 사례로 알맞은 것은?

(범죄 예측 프로그램을 통해 범죄 전 체포)

 

사생활 침해

: 예) SNS에 실시간으로 여행사진을 올린 사람의 집에 도둑이 든 사건 발생

 

책임원칙 훼손

: 예) 신용도와 무관하게 대출이 거절되는 경우, 영화 마이너리포트에 나오는 것처럼 범죄 예측 프로그램에 의해 범행을 저지르기 전에 체포

 

데이터 오용

: 예) 음반 판매량이 본사에 과장 보고되어 생산량이 오버되는 경우

 

 

미국 연방 거래 위원회의 '소비자 프라이버시 보호 3대 권고 사항' 

 

▷기업은 상품개발 단계에서부터 소비자 프라이버시 보호 방안을 적용하라

▷기업은 소비자에게 공유 정보 선택 옵션을 제공하라. 

▷소비자에게 수집된 정보 내용 공개 및 접근권 부여하라. 

 

■위기요인에 대한 통제방안

 

①동의에서 책임으로 

: 빅데이터에 의한 사생활 침해 문제를 해결하기에는 부족한 측면이 많아 좀 더 포괄적인 해결책으로 동의제를 책임제로 바꾸는 방안을 제안함. 

( 개인정보 제공자의 동의 -> 개인정보 사용자의 책임) 

②결과 기반 책임 원칙 고수

: 책임원칙 훼손 위기요인에 대한 통제 방안으로는 기존의 책임원칙을 좀 더 보강하고 강화함. 

③알고리즘 접근 허용

: 데이터 오용의 위기 요소에 대한 대응책으로 알고리즘에 대한 접근권을 제공하여 알고리즘의 부당함을 반증할 수 있는 방법을 명시해 공개할 것을 주문함. 

( 알고리즘을 해설할 능력을 가진 전문가인 알고 리즈 미스트가 필요하게 됨) 

 

■메타 데이터 - 인덱스: 

데이터에 관한 구조화된 데이터로 다른 데이터를 설명해 주는 데이터를 메타데이터라 한다. 데이터를 표현하기 위한 목적으로 사용되는 메타데이터의 가장 좋은 예는 HTML 태그이다. 메타데이터의 또 다른 목적은 데이터를 빨리 찾기 위한 것으로 컴퓨터에서 정보의 인덱스 (Index) 구실을 한다. 우리가 많이 사용하는 데이터 베이스도 이러한 메타데이터가 잘 구성되어 있기 때문에 데이터를 빨리 찾을 수 있다. 

 

■데이터베이스의 일반적인 특징

데이터베이스 특징 설명
통합된 데이터 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미
데이터 중복은 관리상의 복잡한 부작용을 초래
저장된 데이터 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는것을 의미. 데이터 베이스는 기본적으로 컴퓨터 기술을 바탕으로 한것. 
공용 데이터 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미
대용량화되고 구조가 복잡한 것이 보통
변화되는 데이터 데이터베이스에 저장된 내용은 곧 데이터 베이스의 현 상태를 나타냄. 다만 이상태는 새로운 데이터의 삽입. 기존데이터의 삭제. 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 함.

 

■정량 데이터 

객관적 사실로서의 데이터를 살펴보면 그 형태에 따라 언어, 문자 등으로 기술되는 정성 데이터와 수치, 기호 도형으로 표시되는 정량 데이터로 구분된다. 

구분 형태
정성적 데이터 언어, 문자 등 회사 매출이 증가함. 
정량적 데이터  수치, 도형, 기호 등  나이, 몸무게, 주가

지역별 온도, 풍속, 강우량과 같이 수치로 명확하게 표현되는 정량 데이터는 데이터의 양이 크게 증가하더라도 이를 관리하는 시스템 (예: DBMS)에 저장, 검색, 분석하여 활용(예: 일기예보) 하가가 매우 용이하나. 설문조사의 주관식 응답, 트위터나 페이스북, 블로그 등에 올린 글 등과 같은 정성 데이터의 경우 그 형태와 형식이 정해져 있지 않고 천차만별 (이를 비정형 데이 터라고 함. ) 이기 때문에 이들을 저장, 검색, 분석하는 데에 상대적으로 많은 비용과 기술적 투자가 수반된다는 점에서 양자는 구분된다. 

 

■데이터 사이언스

Q. 데이터로부터 의미 있는 정보를 추출해내는 학문이며, 비정형 또는 비정형을 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자, 영상 정보 등 다양한 유형의 데이터를 대상으로 하며, 분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포함한 포괄적 개념 등에 대한 이것을 무엇이라 하는가? 

(데이터 사이언스)

 

데이터 사이언스 

: 데이터로부터 의미 있는 정보를 추출해내는 학문으로 분석뿐 아니라 이를 효과적으로 구현 전달하는 과정까지를 포괄한 개념.

 

데이터 사이언티스트

: 빅데이터의 세계에서 의미 있는 발견을 할 수 있도록 훈련된 호기심을 가진 전문가.

 

 

■가트너- 데이터 사이언티스트 역량

 

▷데이터 관리 : 데이터에 대한 이해 

▷분석 모델링 : 분석론에 대한 지식

▷비즈니스 분석: 비즈니스 요소에 초점

▷소프트 스킬 : 커뮤니케이션, 협력, 리더십, 창의력, 규율, 열정

 

 

■데이터 사이언스의 역할 

 

데이터 사이언스는 정형 또는 비정형을 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자와 문자. 영상 정보 등 다양한 유형의 데이터를 대상으로 함. 

분석뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포함한 포괄적 개념

데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당분야의 전문 지식을 종합한 학문.

비즈니스의 성과를 좌우하는 핵심 이슈에 답을 하고, 사업의 성과를 견인해 나갈 수 있어야 함. 중요한 역량 중 하나인 소통력이 필요한 이유 

 

■Hard Skill & Soft Skill

 

Hard Skill

▷빅데이터에 대한 이론적 지식 : 관련 기법에 대한 이해와 방법론 습득 

▷분석 기술에 대한 숙련 : 최적의 분석 설계 및 노하우 축적

 

Soft Skill

▷통찰력 있는 분석 : 창의력 사고, 호기심. 논리적 비판 

▷설득력 있는 전달 : 스토리텔링. 비주얼라이제이션

▷다 분야간 협력 : 커뮤니케이션

 

■유전자 알고리즘 

Q. 빅데이터 활용 사례에서 "최대 시청률을 얻으려면 어떤 프로그램을 어떤 시간대에 방송해야 하는가?"라는 문제의 해결을 위해 사용될 분석 방법으로 가장 적절한 것은? 

(유전자 알고리즘) 

 

진화의 핵심 원리인 자연선택과 유전자의 개념을 이용한 최적화 기법. 

유전자 알고리즘 :  최적화가 필요한 문제의 해결책을 찾을 때 사용되는 분석 

 

▷교차와 돌연변이 등 진화론 아이디어를 도입한 계산 방식을 진화 연산 

-집단성 : 개체 다수를 집단으로 설정해 동시에 탐색할 때는 병렬 연산을 함. 

-탐구 가능성 : 탐색 공간 (설명 변수와 목적 변수 등이 취할 수 있는 값의 범위)의 자세한 사전 지식을 요구하지 않는다. 

-다양성 : 집단에 있는 개체의 다양성으로 노이즈와 동적 변화에 적응성을 갖게 되므로 견고한 답을 얻을 수 있음. 

 

이 글과 함께 읽으면 좋은글 

 

ADsP 1과목 공부_1

■빅데이터 출현 배경 -개별기업의 고객 데이터 축적 및 활용 증가 -인터넷 확산 -저장 기술의 발전과 가격 하락 -모바일 시대의 도래와 스마트 단말의 보급 -클라우드 컴퓨팅 기술 발전 -비정형

chinggu2000.tistory.com

 

ADsP 2과목 공부 _1

■데이터 거버넌스 체계 ◇데이터 표준화 : 데이터 표준 용어 설명. 명명 규칙 수립. 메타데이터 구축 데이터 사전 구축 등의 업무로 구성됨 ◇데이터 관리 체계 : 데이터 정합성 및 활용의 효율

chinggu2000.tistory.com

 

ADsP 3과목 공부 _1

■변수 선택법 - 모든 가능한 독립변수들의 조합에 대한 회귀모형을 분석해 가장 적합한 모형 선택 ①전진 선택법 : 절편만 있는 상수 모형으로부터 시작해 중요하다고 생각되는 설명변수부터

chinggu2000.tistory.com

 

ADsP 3과목 공부 _2

■비모수 검정 ■모수적 검정과 비모수 검정의 차이점 - 모수적 검정 ①가정된 분포의 모수 : (예를 들어 모평균 μ, 모비율 p, 모분산σ² 등)에 대해 가설을 설정  ②관측된 자료를 이용해 구한

chinggu2000.tistory.com

 

ADsP 3과목 공부 _3

■ 연관분석 Q. 교차 판매/ 물건 배치 등에 이용되는 기법은? (연관분석) "어느 고객이 어떤제품을 같이 구매할까?" ☞ 연관분석 실시 ☞ 교차판매 ■연관성분석 연관성분석 연관규칙 : 항목들 간

chinggu2000.tistory.com

 

댓글