자료검색 > 상세페이지

저자

발행처

발행년도

KDC : 413.7
도서 R을 이용한 결측데이터 분석 : 최대우도 및 다중투입 기법을 중심으로
  • ㆍ저자사항 백영민,
  • ㆍ발행사항 서울 : 한나래 아카데미 : 한나래출판사, 2021
  • ㆍ형태사항 408 p. : 도표 ; 26 cm
  • ㆍISBN 9788955662559
  • ㆍ소장기관 논산열린도서관

소장정보

소장정보
등록번호 낱권정보 자료실 / 청구기호 / ISBN 자료상태 반납예정일 예약 상호대차서비스
NG0000002899 [열린]종합자료실
413.7-백976ㅇ
예약불가 - 예약불가 상호대차신청

상세정보

<분석결과의 대표성과 타당성 확보를 위한 필수과정, 결측데이터 분석 사회과학 데이터를 분석하다 보면 어떤 방식으로든 결측데이터(missing data), 즉 측정되지 않은 데이터를 마주하게 된다. 특히 사람들의 태도나 의견, 지식이나 과거 행동 등을 측정할 때 ‘모름’, ‘응답거부’ 등과 같은 결측값들이 자주 등장하게 된다. 사회과학 영역이 아니더라도 환자의 진료기록이나 검진기록 등을 다루는 의료데이터에서도 결측데이터는 매우 빈번하게 등장한다. 문제는 데이터 분석에서 결측값이 발생하면 통계적 검증력이 감소한다는 것이다. 결측값이 무작위 발생 메커니즘에서 멀어질수록 통계적 검증력은 대폭 감소하게 된다. 결측데이터가 무시하기 어려운 규모로 발생할 때, 통상적인 결측데이터 제거 방법인 리스트단위 결측제거(listwise deletion)로는 분석결과의 대표성(representativeness)을 확보하기 어려운 것은 물론 타당성(validity)과 정확성(precision)도 확보할 수 없다. 이 책에서는 결측데이터에 대처하는 데이터 분석기법으로 학계에서 가장 널리 사용되는 ‘최대우도(ML, maximum likelihood)’ 결측데이터 분석기법과 ‘다중투입(MI, multiple imputation)’ 기법을 소개하고, R을 통해 두 기법을 실습하는 과정을 제시한다. 결측데이터와 관련된 기본적 개념(이를테면 MCAR, MAR, MNAR 등)을 가급적 쉬운 말로 소개하고, ML 기법과 MI 기법이 어떤 논리로 결측데이터 현상에 대처하는지 설명한 후 R을 통해 각 기법을 실습하였다. 실습과정은 시뮬레이션 데이터와 현실데이터를 사례로 단계별로 제시하였고, ML 기법과 MI 기법이 왜 통상적인 결측데이터 대처방법들에 비해 우수하며 두 기법의 장단점은 무엇인지 쉽게 설명하는 데 집중하였다. 이 책은 R을 소개하는 입문서가 아니라 R을 활용하여 어떻게 결측데이터 분석을 진행하는지를 설명하는 책이다. 따라서 독자들은 R에 대한 기초지식과 함께 (결측데이터의 발생 메커니즘에 대한 가정을 이해하기 위해) 성향점수분석에 대한 어느 정도의 사전지식을 지니고 있어야 한다. 아울러 R tidyverse 패키지의 내장함수들에 대한 기초적 지식도 필요하다. 결측데이터 분석기법이 아무리 발전한다고 하더라도, 가급적 실측된 데이터를 확보하는 것이 가장 좋다. 연구자는 연구를 계획하는 단계부터 데이터를 수집하는 단계까지 결측데이터가 발생하지 않도록 최선을 다해야 한다. 하지만 그럼에도 불구하고 결측데이터 발생을 완전히 막는 것은 불가능하다. 이 책에서 집중적으로 다룬 2가지 기법, 최대우도(ML) 기법과 다중투입(MI) 기법은 결측데이터 분석기법들 중 현재까지 가장 널리 사용되는 것이며, 가장 신뢰할 수 있는 기법이다. 모쪼록 다양한 학문분과의 연구자들이 이 책을 통해 결측데이터 분석기법을 타당하게 적용할 수 있는 방법들을 익히고, 각자의 분야에서 더욱더 신뢰할 수 있는 연구결과를 이끌어낼 수 있기를 기대한다!

도서정보 상세보기[NAVER 제공]

내가 찾은 검색어

천안시도서관

본 웹사이트에 게시된 이메일 주소는 자동수집을 거부하며 이를 위반시 정보통신망법에 의해 처벌됨을 유념하시기 바랍니다.

(31127) 충남 천안시 동남구 중앙로 118 / Tel : 041-521-3721~2

Copyrightⓒ Cheonan-Si. All rights reserved.

Libropia QR code