본문 바로가기
AI 관련/ADsP, ADP

ADsP 기출문제 오답노트 - 이론 정리 4

by 팀장일기 2021. 10. 19.
  • 기하, 이항 , 초기하 분포는 이산형 확률 분포이다. 

  • R에서 사용 가능한 데이터 오브젝트 (행렬, 벡터, 데이터 프레임, 리스트)에 관한 설명으로 데이터 프레임은 테이블로 된 구조인 것은 맞지만 행렬이 아닌 리스트 구조로 구현된다. 

  • a <-c(1,10)은 벡터 값으로 1,10이 나타나지만, 나머지는 1부터 10까지의 수를 보여준다. 

  • 다중 선형 회귀분석의 종속변수를 설명하는 가장 중요한 독립변수는 추정한 계수가 클수록 종속변수에 가장 영향을 많이 미치게 된다 특히 β0가 없는 표준화된 추정식을 만들게 되면 각 계수의 크기를 더욱 정확히 알 수 있게 된다. 

  • 동일한 확률분포를 가진 독립 확률 변수의 분포는 n이 적당히 크다면 (n은 30 이상) 정규분포에 가까워진다는 정리이다. 
  • 비율 척도는 측정대상의 간격에 대한 비율이 의미를 가지는 자료를 의미하고, 무게, 나이, 시간, 거리 정보가 해당된다. 

  • 다중 회귀분석에서 변수 선택법 중 전진 선택법은 변수가 추가되면 기존 변수들의 중요도에 영향을 받게 된다. 다시 말해, 변수를 추가했는데 이미 선택된 변수의 유의 수준이 높아지면 추가한 변수를 활용하지 못하게 된다. 

댓글