제2판 행정계량분석론
펴낸날 제1판 제1쇄 2015년 1월 25일제2판 제1쇄 2021년 3월 3일
지은이 김민주
펴낸이 임춘환
펴낸곳
주소 (본사)사무실: 기도 고양시 일산서구 주화로 70우신프라자 307호(10387)
(본사)물류센터: 경기도 고양시 일산서구 덕산로107번길 68-50(10205)
등록 1975년 12월 26일 제3-16호
전화 (031)913-3062, (031)914-3884~5
팩스 (031)913-3839
홈페이지 http://www.dymbook.co.kr
ⓒ 김민주, 2021
ISBN 978-89-7644-773-9
값 22,000원
*잘못된 책은 바꾸어 드립니다.
*이 책의 내용은 저작권법의 보호를 받습니다.
차 례
제2판 머리말/ 2
초판 머리말/4
제1부 행정과 계량분석
제1장 행정계량분석의 의미 17
제1절 행정계량분석과 통계 18
1. 계량분석과 행정계량분석/18
2. 통계와 통계학/18
3. 행정계량분석의 역사적 사례/19
제2절 행정계량분석의 유용성 20
제3절 행정계량분석의 종류와 과정 24
1. 행정계량분석의 종류/24
2. 행정계량분석의 핵심 과정/25
제4절 행정계량분석의 주요 기본 용어 27
제2장 국가와 행정계량분석 33
제1절 국가통계의 의미와 종류 34
제2절 통계행정기관과 국가통계제도 35
1. 통계행정기관/35
2. 통계 작성의 주요 활동/41
3. 국가통계제도/44
4. 국가통계의 기본 원칙/46
제3절 통계행정과 민간위탁 48
제2부 통계분석의 기초 이론과 응용
제3장 통계자료의 수집 53
제1절 자료의 종류 54
1. 양적 자료와 질적 자료/54
2. 연속 자료, 이산 자료, 범주형 자료/54
3. 1차 자료, 2차 자료, 3차 자료/55
4. 종단적 자료와 횡단적 자료/55
제2절 표본조사 56
1. 표본조사의 의미/56
2. 표본조사의 장점과 한계점/57
3. 표본조사의 주요 개념/58
제3절 표본추출(표집) 방법 59
1. 확률추출 방법/60
2. 비확률추출 방법/67
제4절 측정과 척도 70
1. 측 정/70
2. 척 도/73
3. 측정오차/75
4. 측정의 정확도와 정밀도/79
제4장 통계자료의 정리 81
제1절 가시적 자료 정리 82
1. 도수분포표/82
2. 히스토그램/83
3. 줄기-잎 그림/84
4. 산점도/85
제2절 수치적 자료 정리 86
1. 중심위치(대푯값)/86
2. 변동성/89
3. 상관계수/98
제5장 확률과 확률분포 105
제1절 확률의 개념과 원리 106
1. 확률의 개념/106
2. 확률의 주요 용어/107
3. 확률의 기본 원리/110
제2절 확률변수와 확률분포 114
1. 확률변수의 의미와 유형/114
2. 확률변수의 기댓값과 분산/115
3. 확률분포/117
제3절 정규분포와 표준정규분포 118
1. 정규분포의 의미와 특성/118
2. 정규분포의 확률 계산/122
3. 표준정규분포/124
제6장 표본분포와 추정 129
제1절 표본분포의 의미와 종류 130
1. 의미/130
2. 종 류/130
제2절 추정 132
1. 점추정과 구간추정/132
2. 신뢰구간과 신뢰 수준/133
3. 신뢰구간과 Z분포 및 T분포/138
제7장 가설검정 141
제1절 가설검정의 의미와 절차 142
1. 가설검정의 의미와 가설의 종류/142
2. 가설점정의 기본 절차/145
제2절 가설검정의 방법 150
1. 양측검정과 단측검정/150
2. 가설검정의 결과를 판단하는 방법/152
제3부 통계분석 기법의 원리와 실습
제8장 교차비교분석() 161
제1절 의미 162
제2절 원리 162
제3절 분석 절차(실습) 165
1. 교차비교분석()의 사례/165
2. 교차비교분석()의 실습 절차/166
제4절 결과 작성 방법(보고서 및 논문) 170
제9장 집단비교분석(T검정) 173
제1절 의미 174
제2절 원리 175
1. 독립표본 T검정/175
2. 대응표본 T검정/177
3. 일표본 T검정/179
제3절 분석 절차(실습) 180
1. 독립표본 T검정의 사례/180
2. 독립표본 T검정의 실습 절차/180
3. 대응표본 T검정의 사례/183
4. 대응표본 T검정의 실습 절차/183
5. 일표본 T검정의 사례/186
6. 일표본 T검정의 실습 절차/186
제4절 결과 작성 방법(보고서 및 논문) 188
1. 독립표본 T검정의 결과 작성 방법/188
2. 대응표본 T검정의 결과 작성 방법/190
3. 일표본 T검정의 결과 작성 방법/191
제10장 분산분석(ANOVA) 193
제1절 의미 194
제2절 원리 195
1. 일원분산분석/195
2. 다원분산분석/201
제3절 분석 절차(실습) 203
1. 일원분산분석의 사례/203
2. 일원분산분석의 실습 절차/203
3. 다원분산분석의 사례/210
4. 다원분산분석의 실습 절차/210
제4절 결과 작성 방법(보고서 및 논문) 216
1. 일원분산분석의 결과 작성 방법/216
2. 다원분산분석의 결과 작성 방법/217
제11장 상관관계분석 221
제1절 의미 222
제2절 원리 222
제3절 분석 절차(실습) 224
1. 상관관계분석의 사례/224
2. 상관관계분석의 실습 절차/224
3. 편상관관계분석의 사례/228
4. 편상관관계분석의 실습 절차/228
제4절 결과 작성 방법(보고서 및 논문) 231
제12장 회귀분석(단순회귀분석, 다중회귀분석, 더미변수 회귀분석) 235
제1절 의미 236
1. 이론에 기초한 회귀분석/236
2. 인과관계의 의미와 원인 조건의 종류/237
제2절 원리 239
1. 단순회귀분석/239
2. 다중회귀분석/249
3. 더미변수 회귀분석/254
제3절 분석 절차(실습) 259
1. 단순회귀분석의 사례/259
2. 단순회귀분석의 실습 절차/260
3. 다중회귀분석의 사례/266
4. 다중회귀분석의 실습 절차/266
5. 더미변수 회귀분석의 사례/272
6. 더미변수 회귀분석의 실습 절차/273
제4절 결과 작성 방법(보고서 및 논문) 288
1. 단순회귀분석의 결과 작성 방법/288
2. 다중회귀분석의 결과 작성 방법/289
3. 더미변수 회귀분석의 결과 작성 방법/291
제13장 요인분석 295
제1절 의미 296
제2절 원리 298
제3절 분석 절차(실습) 304
1. 요인분석의 사례/304
2. 요인분석의 실습 절차/305
제4절 결과 작성 방법(보고서 및 논문) 310
부 록/313
참고문헌/325
찾아보기/326
제2판 행정계량분석론
-통계분석의 기초, 응용, 실습-
김 민 주
제2판 머리말
데이터의 중요성이 날로 강조되고 있다. 여기서 말하는 중요성이란 데이터 분석의 중요성을 말한다. 인터넷을 비롯한 정보통신기술의 발달 덕분에 오늘날 데이터 수집에서 발생하는 제약은 많이 극복되었다. 단적으로 볼 때 공공기관은 일정한 데이터에 관해서는 의무적으로 수집해서 축적해 두어야 하고 또 그것을 공개해야 하는 경우도 많다. 공공기관의 이런 데이터를 이용하는 것이 어렵지 않은 시대가 되었기 때문에 누구나 마음만 먹으면 공공 영역의 2차 데이터 정도는 쉽게 확보할 수 있다. 그래서 이제는 데이터를 얼마나 잘 확보할 수 있느냐(혹은 얼마나 가지고 있느냐)보다는 데이터를 분석하는 역량이 있는가 혹은 어느 정도 되는가가 중요해졌다. 쉽게 획득할 수 있는 데이터를 분석할 수 있는가의 여부가 빅데이터 시대에 살아가는 우리에게 놓인 과제이자 기회가 된 것이다.
행정계량분석론은 행정학을 비롯한 사회과학 전공자들이 그러한 과제를 수행하고 기회를 잡는 데 도움을 주는 책이다. 따라서 이 책은 이미 진행된 빅데이터 시대를 살아갈 전공자들의 데이터분석 역량 향상에 기여하고자 하는 목적을 지니고 있다. 그 목적에 얼마나 기여했는지는 모르겠지만, 지난 5년 간 많은 사람들이 이 책의 초판을 많이 이용하며 지지를 보내주었다.
그에 보답하고자 기존의 초판을 보완해서 제2판을 이번에 출간하게 되었다. 초판의 전반을 검토하면서 이해의 수월성을 높이고자 내용을 수정하고 또 추가하는 작업을 했다. 특히 초판에서는 없었던 요인분석 기법을 새롭게 추가하여 기존에 총 3부 12장까지였던 분량이 13장으로 늘어났다.
이 책은 그동안 학부생뿐 아니라 대학원생에게도 많이 활용된 것으로 알고 있다. 그만큼 책임감과 사명감이 더욱 크게 다가온다. 앞으로는 데이터를 분석할 수 있는 사람과 그렇지 못한 사람으로 구분될 수도 있을 것이라는 전망도 있다. 행정계량분석론 제2판은 미래 세대 모두가 데이터를 분석할 수 있는 사람이 되는 데 조금이라도 기여했으면 하는 바람을 지니고 있다.
제2판 출간을 결정하며 많은 도움을 주신 대영문화사 임직원분들께 깊은 감사의 마음을 전한다. 이 책이 빛을 발할 수 있었던 것은 출판사 임직원분들의 진심어린 수고 덕분이라고 생각한다. 그리고 사랑하는 가족에게도 감사의 마음을 전한다.
2021년 2월
연구실에서 김민주
초판 머리말
이 세상은 숫자가 지배한다고 해도 과언이 아니다. 어쩌면 우리는 태어나서 죽을 때까지 숫자와 함께 살아갈지도 모른다. 태어나면서부터 태어난 년(年), 월(月), 일(日), 시(時)가 숫자로 기록되어 평생의 사주(四柱)가 부여된다. 이 숫자는 살아가면서 생일날이 되어 매년 그 숫자가 도래되는 날을 손꼽아 기다리곤 한다. 죽을 때도 숫자로 날짜가 기록되어 후손들에 의해 기억된다. 이러한 간단한 개인사를 넘어 이 사회 속에서는 더 많은 숫자가 넘쳐난다. 뉴스를 켜기만 해도 경제성장률이니 출산율이니 소득 수준이니 OECD 국가들 중 몇 위를 했느니 하는 숫자들이 흘러나오고, 강의하러 강의실에 들어서면 학생들은 학점과 토익 성적 때문에 힘들어하는 소리가 들린다. 이 글을 쓰는 나 역시 지금이 몇 시인지 시계 바늘이 가리키는 숫자를 확인하고 있다.
그래서 사회를 이해하는 방법 중 하나가 바로 숫자를 통한 이해이다. 숫자를 통해 무엇을 이해한다고 하면 수학을 먼저 떠올리며 골치 아프다고 지레 생각해버리는 경우가 있는데, 사실 전혀 그렇지 않다. 숫자를 통해 무엇을 이해한다는 것은 오히려 복잡한 것을 간단한 숫자로 표현해서 쉽게 이해하기 위해서이다. 그래서 사회 곳곳에서 표현되고 있는 숫자는 사회를 이해하는 데 중요한 정보가 된다.
정부 영역에서도 마찬가지이다. 정부활동들은 숫자로 표현되는 경우가 많고 또 숫자로 평가되기도 한다. 예를 들어, 행정서비스를 전달할 때 효율성 등이 중요하게 고려되고, 정부활동을 평가할 때도 목표 대비 달성도나 이용률이나 만족도 등과 관련된 자료들이 대부분 숫자로 수집되어 수치적 정보로 결과가 도출된다. 이처럼 정부 영역에서도 정부활동에 관한 많은 정보가 수치로 표현되고 있다.
이 책은 바로 여기에 관한 이론적 지식과 실무적인 응용 방법을 안내해주기 위해 쓰였다. 특히 이 책은 정부 영역에 초점을 두고 있다. 정부 영역에 관한 수치적 정보 도출과 이해는 개인이나 사회 모든 영역과도 관련된 면이 많기 때문이다. 그래서 간단히 말해, 이 책은 여러 행정 현상을 계량적으로 분석하는 방법에 관한 책이다. 계량적 이해는 수치적 이해를 말한다.
복잡한 행정 현상을 간단한 수치로 이해한다는 것은 분명 매력적인 일이다. 복잡하게 얽혀 있을수록 핵심적인 정보를 캐내는 것은 더욱 중요하며, 이때 그 정보는 간략한 모습을 띤 정보일수록 좋다. ‘핵심적인 정보’를 ‘간략히’ 보여주므로 매력적인 것이다. 그 작업을 가능하게 해주는 도구가 계량분석 방법이다. 그래서 복잡한 행정 현상을 간단한 핵심적인 숫자로 이해하는 매력적인 일을 가능하게 해주는 행정계량분석 방법 역시 매력적이다.
그렇다고 행정계량분석이 관념적 이끌림을 주는 매력만 지니는 것은 아니다. 실용적이고 실무적이기도 하다. 행정계량분석 방법을 통해 도출하는 유용한 정보는 적절하고 적실성 있는 정책을 만들고 집행하는 데 결정적인 도움을 주기 때문이다. 그래서 배워 볼 만하다. 아니 필요하다면 반드시 배워야 할 분야이다.
따라서 행정학이나 정책학을 전공하는 사람이라면 행정계량분석은 반드시 학습해야 한다. 이 책은 학부 수준과 대학원 수준을 모두 아우를 수 있게 되어 있으므로 누구든 학습할 수 있다. 그리고 비단 행정학 전공자가 아니더라도 이 책을 사용해서 학습할 수 있다. 통계분석의 일반적인 이론과 기법이 그대로 여기서 다루어지기 때문이다. 사회 현상을 수치와 통계로 이해하고자 하는 누구든지 이 책에서 상당한 도움을 받을 수 있을 것이라고 확신한다.
이 책은 몇 가지 점에서 기존의 책들과는 다른 장점을 지니고 있다. 첫째, 이 책은 통계분석 프로그램인 SPSS를 실제로 사용하는 방법을 자세히 설명하고 있다. 실습하는 절차에 대해 하나하나 화면을 캡처해서 보여주면서 설명하고 있다. 강의를 통해 설명을 들은 후 혼자서 캡처된 화면을 보면서 따라 해도 충분할 정도로 자세히 설명하고 있다. 이 책에서는 SPSS 21 버전을 사용한 예를 보이고 있지만 그 이전 버전이나 이후 버전 어느 것이든 상관없이 이 책을 통해 학습할 수 있다. 버전별로 분석에 사용되는 메뉴는 큰 차이가 없기 때문이다. 둘째, 실습에 필요한 데이터를 별도의 CD를 통해 제공하고 있다. 이 CD 속에는 통계분석 기법별로 사용할 수 있는 간단한 데이터들이 들어 있다. 이 데이터를 사용해서 실습 절차대로 따라할 수 있도록 했다. 셋째, 통계분석 프로그램인 SPSS를 사용해서 분석한 결과를 보고서나 논문으로 작성하는 방법에 관해 자세히 설명하고 있다. 일종의 보고서 샘플을 제시하면서 분석 결과를 어떻게 작성해야 하는지에 관해 보여준다. 넷째, 이 책은 통계적 용어를 사용하기는 하지만 상당히 쉬운 언어로 풀어서 설명하고 있다. 어쩔 수 없이 통계적 용어가 들어간 설명이 있어야 하는 경우도 많지만, 사실 일상의 언어로 풀어서 설명할 수 있는 통계 용어가 상당히 많다. 그래서 이 책은 쉽게 쓰기 위해 무작정 통계적 용어를 사용하지 않는 설명이 아니라, 통계적 용어를 함께 사용하되 일상의 언어로 이해하기 쉽게 설명했다. 다섯째, 학습 내용과 관련되면서 비교적 가볍게 읽을 수 있는 ‘읽기 자료’를 본문 중간중간에 삽입해 두었다. 주로 신문의 칼럼이나 기사들이다. 현재 배우고 있는 지식이 실생활과 많이 관련된다는 사실을 확인하면서, 학습 중간에 잠깐 동안 맛보는 일종의 분위기 환기용으로 활용될 수 있을 것이다.
이 책은 총 3부 12장으로 구성되어 있다. 크게 세 개의 상위 주제가 있고 각각의 주제에 하위 주제들이 포함되어 있는 형식이다. 하위 주제들은 세 개의 상위 주제에 각각 구분되어 포함되어 있으나, 연속적으로 1장부터 12장까지 이어진다.
이 책이 나오기까지 많은 분의 도움과 격려가 있었다. 지도교수인 고려대학교 행정학과 윤성식 교수님은 내가 한없이 존경하는 분이다. 내가 학생일 때나 교수가 되었을 때나 윤 교수님은 가장 큰 스승으로 내 마음속에 자리 잡고 계신다. 감사한 마음은 헤아릴 수 없다. 그리고 현재 내가 몸담고 있는 동양대학교 행정경찰학부 교수님들께도 많은 도움을 받았다. 교수님들께서는 언제나 나를 편하게 대해주면서 연구 환경을 최적으로 만들어 주셨다. 이에 감사한 마음을 전하고 싶다.
그리고 가족에 대한 무한한 감사의 마음도 전한다. 아버지(김석웅)와 어머니(이재선)는 내 삶의 가장 소중한 분들로서 나를 위해 모든 것을 해주시는 분들이다. 큰 자형(임상홍)과 큰누나(김혜숙)는 형제들 간의 맏이로서 든든한 역할을 하고, 둘째 자형(최명원)과 둘째 누나(김미숙)는 보이지 않게 물심양면으로 많은 도움을 주고, 막내 자형(김석근)과 막내 누나(김현숙)는 사소한 일까지도 도맡아서 자발적으로 모든 일을 먼저 한다. 그리고 조카 임아름, 임창우, 최은지, 최지혁, 김유라는 세상에서 가장 귀엽고 사랑스럽다. 내가 대학원 시절에 조카들은 나의 큰 에너지였다. 장인어른(김진성)과 장모님(강상전)은 나를 언제나 따뜻하게 맞아주면서 깊은 애정과 진솔한 배려로 큰 감동을 주신다. 처형(김한나)은 현명하고 지혜롭게 나와 아내에게 아낌없는 사랑과 지지를 보내주신다. 마지막으로, 아내 김유라는 나를 가장 존중해주면서 내가 부족한 많은 것들을 하나하나 다정한 손길로 채워준다. 아내는 양가 모두를 행복하게 만드는 일등 공신이다.
끝으로, 이 책의 출판을 흔쾌히 받아들이고 출판 과정에 큰 도움을 준 대영문화사 임직원분들께 감사의 마음을 전하고자 한다.
2015년 1월
연구실에서 김민주
제2판 행정계량분석론
펴낸날 제1판 제1쇄 2015년 1월 25일제2판 제1쇄 2021년 3월 3일
지은이 김민주
펴낸이 임춘환
펴낸곳
주소 (본사)사무실: 기도 고양시 일산서구 주화로 70우신프라자 307호(10387)
(본사)물류센터: 경기도 고양시 일산서구 덕산로107번길 68-50(10205)
등록 1975년 12월 26일 제3-16호
전화 (031)913-3062, (031)914-3884~5
팩스 (031)913-3839
홈페이지 http://www.dymbook.co.kr
ⓒ 김민주, 2021
ISBN 978-89-7644-773-9
값 22,000원
*잘못된 책은 바꾸어 드립니다.
*이 책의 내용은 저작권법의 보호를 받습니다.
차 례
제2판 머리말/ 2
초판 머리말/4
제1부 행정과 계량분석
제1장 행정계량분석의 의미 17
제1절 행정계량분석과 통계 18
1. 계량분석과 행정계량분석/18
2. 통계와 통계학/18
3. 행정계량분석의 역사적 사례/19
제2절 행정계량분석의 유용성 20
제3절 행정계량분석의 종류와 과정 24
1. 행정계량분석의 종류/24
2. 행정계량분석의 핵심 과정/25
제4절 행정계량분석의 주요 기본 용어 27
제2장 국가와 행정계량분석 33
제1절 국가통계의 의미와 종류 34
제2절 통계행정기관과 국가통계제도 35
1. 통계행정기관/35
2. 통계 작성의 주요 활동/41
3. 국가통계제도/44
4. 국가통계의 기본 원칙/46
제3절 통계행정과 민간위탁 48
제2부 통계분석의 기초 이론과 응용
제3장 통계자료의 수집 53
제1절 자료의 종류 54
1. 양적 자료와 질적 자료/54
2. 연속 자료, 이산 자료, 범주형 자료/54
3. 1차 자료, 2차 자료, 3차 자료/55
4. 종단적 자료와 횡단적 자료/55
제2절 표본조사 56
1. 표본조사의 의미/56
2. 표본조사의 장점과 한계점/57
3. 표본조사의 주요 개념/58
제3절 표본추출(표집) 방법 59
1. 확률추출 방법/60
2. 비확률추출 방법/67
제4절 측정과 척도 70
1. 측 정/70
2. 척 도/73
3. 측정오차/75
4. 측정의 정확도와 정밀도/79
제4장 통계자료의 정리 81
제1절 가시적 자료 정리 82
1. 도수분포표/82
2. 히스토그램/83
3. 줄기-잎 그림/84
4. 산점도/85
제2절 수치적 자료 정리 86
1. 중심위치(대푯값)/86
2. 변동성/89
3. 상관계수/98
제5장 확률과 확률분포 105
제1절 확률의 개념과 원리 106
1. 확률의 개념/106
2. 확률의 주요 용어/107
3. 확률의 기본 원리/110
제2절 확률변수와 확률분포 114
1. 확률변수의 의미와 유형/114
2. 확률변수의 기댓값과 분산/115
3. 확률분포/117
제3절 정규분포와 표준정규분포 118
1. 정규분포의 의미와 특성/118
2. 정규분포의 확률 계산/122
3. 표준정규분포/124
제6장 표본분포와 추정 129
제1절 표본분포의 의미와 종류 130
1. 의미/130
2. 종 류/130
제2절 추정 132
1. 점추정과 구간추정/132
2. 신뢰구간과 신뢰 수준/133
3. 신뢰구간과 Z분포 및 T분포/138
제7장 가설검정 141
제1절 가설검정의 의미와 절차 142
1. 가설검정의 의미와 가설의 종류/142
2. 가설점정의 기본 절차/145
제2절 가설검정의 방법 150
1. 양측검정과 단측검정/150
2. 가설검정의 결과를 판단하는 방법/152
제3부 통계분석 기법의 원리와 실습
제8장 교차비교분석() 161
제1절 의미 162
제2절 원리 162
제3절 분석 절차(실습) 165
1. 교차비교분석()의 사례/165
2. 교차비교분석()의 실습 절차/166
제4절 결과 작성 방법(보고서 및 논문) 170
제9장 집단비교분석(T검정) 173
제1절 의미 174
제2절 원리 175
1. 독립표본 T검정/175
2. 대응표본 T검정/177
3. 일표본 T검정/179
제3절 분석 절차(실습) 180
1. 독립표본 T검정의 사례/180
2. 독립표본 T검정의 실습 절차/180
3. 대응표본 T검정의 사례/183
4. 대응표본 T검정의 실습 절차/183
5. 일표본 T검정의 사례/186
6. 일표본 T검정의 실습 절차/186
제4절 결과 작성 방법(보고서 및 논문) 188
1. 독립표본 T검정의 결과 작성 방법/188
2. 대응표본 T검정의 결과 작성 방법/190
3. 일표본 T검정의 결과 작성 방법/191
제10장 분산분석(ANOVA) 193
제1절 의미 194
제2절 원리 195
1. 일원분산분석/195
2. 다원분산분석/201
제3절 분석 절차(실습) 203
1. 일원분산분석의 사례/203
2. 일원분산분석의 실습 절차/203
3. 다원분산분석의 사례/210
4. 다원분산분석의 실습 절차/210
제4절 결과 작성 방법(보고서 및 논문) 216
1. 일원분산분석의 결과 작성 방법/216
2. 다원분산분석의 결과 작성 방법/217
제11장 상관관계분석 221
제1절 의미 222
제2절 원리 222
제3절 분석 절차(실습) 224
1. 상관관계분석의 사례/224
2. 상관관계분석의 실습 절차/224
3. 편상관관계분석의 사례/228
4. 편상관관계분석의 실습 절차/228
제4절 결과 작성 방법(보고서 및 논문) 231
제12장 회귀분석(단순회귀분석, 다중회귀분석, 더미변수 회귀분석) 235
제1절 의미 236
1. 이론에 기초한 회귀분석/236
2. 인과관계의 의미와 원인 조건의 종류/237
제2절 원리 239
1. 단순회귀분석/239
2. 다중회귀분석/249
3. 더미변수 회귀분석/254
제3절 분석 절차(실습) 259
1. 단순회귀분석의 사례/259
2. 단순회귀분석의 실습 절차/260
3. 다중회귀분석의 사례/266
4. 다중회귀분석의 실습 절차/266
5. 더미변수 회귀분석의 사례/272
6. 더미변수 회귀분석의 실습 절차/273
제4절 결과 작성 방법(보고서 및 논문) 288
1. 단순회귀분석의 결과 작성 방법/288
2. 다중회귀분석의 결과 작성 방법/289
3. 더미변수 회귀분석의 결과 작성 방법/291
제13장 요인분석 295
제1절 의미 296
제2절 원리 298
제3절 분석 절차(실습) 304
1. 요인분석의 사례/304
2. 요인분석의 실습 절차/305
제4절 결과 작성 방법(보고서 및 논문) 310
부 록/313
참고문헌/325
찾아보기/326
제2판 행정계량분석론
-통계분석의 기초, 응용, 실습-
김 민 주
제2판 머리말
데이터의 중요성이 날로 강조되고 있다. 여기서 말하는 중요성이란 데이터 분석의 중요성을 말한다. 인터넷을 비롯한 정보통신기술의 발달 덕분에 오늘날 데이터 수집에서 발생하는 제약은 많이 극복되었다. 단적으로 볼 때 공공기관은 일정한 데이터에 관해서는 의무적으로 수집해서 축적해 두어야 하고 또 그것을 공개해야 하는 경우도 많다. 공공기관의 이런 데이터를 이용하는 것이 어렵지 않은 시대가 되었기 때문에 누구나 마음만 먹으면 공공 영역의 2차 데이터 정도는 쉽게 확보할 수 있다. 그래서 이제는 데이터를 얼마나 잘 확보할 수 있느냐(혹은 얼마나 가지고 있느냐)보다는 데이터를 분석하는 역량이 있는가 혹은 어느 정도 되는가가 중요해졌다. 쉽게 획득할 수 있는 데이터를 분석할 수 있는가의 여부가 빅데이터 시대에 살아가는 우리에게 놓인 과제이자 기회가 된 것이다.
행정계량분석론은 행정학을 비롯한 사회과학 전공자들이 그러한 과제를 수행하고 기회를 잡는 데 도움을 주는 책이다. 따라서 이 책은 이미 진행된 빅데이터 시대를 살아갈 전공자들의 데이터분석 역량 향상에 기여하고자 하는 목적을 지니고 있다. 그 목적에 얼마나 기여했는지는 모르겠지만, 지난 5년 간 많은 사람들이 이 책의 초판을 많이 이용하며 지지를 보내주었다.
그에 보답하고자 기존의 초판을 보완해서 제2판을 이번에 출간하게 되었다. 초판의 전반을 검토하면서 이해의 수월성을 높이고자 내용을 수정하고 또 추가하는 작업을 했다. 특히 초판에서는 없었던 요인분석 기법을 새롭게 추가하여 기존에 총 3부 12장까지였던 분량이 13장으로 늘어났다.
이 책은 그동안 학부생뿐 아니라 대학원생에게도 많이 활용된 것으로 알고 있다. 그만큼 책임감과 사명감이 더욱 크게 다가온다. 앞으로는 데이터를 분석할 수 있는 사람과 그렇지 못한 사람으로 구분될 수도 있을 것이라는 전망도 있다. 행정계량분석론 제2판은 미래 세대 모두가 데이터를 분석할 수 있는 사람이 되는 데 조금이라도 기여했으면 하는 바람을 지니고 있다.
제2판 출간을 결정하며 많은 도움을 주신 대영문화사 임직원분들께 깊은 감사의 마음을 전한다. 이 책이 빛을 발할 수 있었던 것은 출판사 임직원분들의 진심어린 수고 덕분이라고 생각한다. 그리고 사랑하는 가족에게도 감사의 마음을 전한다.
2021년 2월
연구실에서 김민주
초판 머리말
이 세상은 숫자가 지배한다고 해도 과언이 아니다. 어쩌면 우리는 태어나서 죽을 때까지 숫자와 함께 살아갈지도 모른다. 태어나면서부터 태어난 년(年), 월(月), 일(日), 시(時)가 숫자로 기록되어 평생의 사주(四柱)가 부여된다. 이 숫자는 살아가면서 생일날이 되어 매년 그 숫자가 도래되는 날을 손꼽아 기다리곤 한다. 죽을 때도 숫자로 날짜가 기록되어 후손들에 의해 기억된다. 이러한 간단한 개인사를 넘어 이 사회 속에서는 더 많은 숫자가 넘쳐난다. 뉴스를 켜기만 해도 경제성장률이니 출산율이니 소득 수준이니 OECD 국가들 중 몇 위를 했느니 하는 숫자들이 흘러나오고, 강의하러 강의실에 들어서면 학생들은 학점과 토익 성적 때문에 힘들어하는 소리가 들린다. 이 글을 쓰는 나 역시 지금이 몇 시인지 시계 바늘이 가리키는 숫자를 확인하고 있다.
그래서 사회를 이해하는 방법 중 하나가 바로 숫자를 통한 이해이다. 숫자를 통해 무엇을 이해한다고 하면 수학을 먼저 떠올리며 골치 아프다고 지레 생각해버리는 경우가 있는데, 사실 전혀 그렇지 않다. 숫자를 통해 무엇을 이해한다는 것은 오히려 복잡한 것을 간단한 숫자로 표현해서 쉽게 이해하기 위해서이다. 그래서 사회 곳곳에서 표현되고 있는 숫자는 사회를 이해하는 데 중요한 정보가 된다.
정부 영역에서도 마찬가지이다. 정부활동들은 숫자로 표현되는 경우가 많고 또 숫자로 평가되기도 한다. 예를 들어, 행정서비스를 전달할 때 효율성 등이 중요하게 고려되고, 정부활동을 평가할 때도 목표 대비 달성도나 이용률이나 만족도 등과 관련된 자료들이 대부분 숫자로 수집되어 수치적 정보로 결과가 도출된다. 이처럼 정부 영역에서도 정부활동에 관한 많은 정보가 수치로 표현되고 있다.
이 책은 바로 여기에 관한 이론적 지식과 실무적인 응용 방법을 안내해주기 위해 쓰였다. 특히 이 책은 정부 영역에 초점을 두고 있다. 정부 영역에 관한 수치적 정보 도출과 이해는 개인이나 사회 모든 영역과도 관련된 면이 많기 때문이다. 그래서 간단히 말해, 이 책은 여러 행정 현상을 계량적으로 분석하는 방법에 관한 책이다. 계량적 이해는 수치적 이해를 말한다.
복잡한 행정 현상을 간단한 수치로 이해한다는 것은 분명 매력적인 일이다. 복잡하게 얽혀 있을수록 핵심적인 정보를 캐내는 것은 더욱 중요하며, 이때 그 정보는 간략한 모습을 띤 정보일수록 좋다. ‘핵심적인 정보’를 ‘간략히’ 보여주므로 매력적인 것이다. 그 작업을 가능하게 해주는 도구가 계량분석 방법이다. 그래서 복잡한 행정 현상을 간단한 핵심적인 숫자로 이해하는 매력적인 일을 가능하게 해주는 행정계량분석 방법 역시 매력적이다.
그렇다고 행정계량분석이 관념적 이끌림을 주는 매력만 지니는 것은 아니다. 실용적이고 실무적이기도 하다. 행정계량분석 방법을 통해 도출하는 유용한 정보는 적절하고 적실성 있는 정책을 만들고 집행하는 데 결정적인 도움을 주기 때문이다. 그래서 배워 볼 만하다. 아니 필요하다면 반드시 배워야 할 분야이다.
따라서 행정학이나 정책학을 전공하는 사람이라면 행정계량분석은 반드시 학습해야 한다. 이 책은 학부 수준과 대학원 수준을 모두 아우를 수 있게 되어 있으므로 누구든 학습할 수 있다. 그리고 비단 행정학 전공자가 아니더라도 이 책을 사용해서 학습할 수 있다. 통계분석의 일반적인 이론과 기법이 그대로 여기서 다루어지기 때문이다. 사회 현상을 수치와 통계로 이해하고자 하는 누구든지 이 책에서 상당한 도움을 받을 수 있을 것이라고 확신한다.
이 책은 몇 가지 점에서 기존의 책들과는 다른 장점을 지니고 있다. 첫째, 이 책은 통계분석 프로그램인 SPSS를 실제로 사용하는 방법을 자세히 설명하고 있다. 실습하는 절차에 대해 하나하나 화면을 캡처해서 보여주면서 설명하고 있다. 강의를 통해 설명을 들은 후 혼자서 캡처된 화면을 보면서 따라 해도 충분할 정도로 자세히 설명하고 있다. 이 책에서는 SPSS 21 버전을 사용한 예를 보이고 있지만 그 이전 버전이나 이후 버전 어느 것이든 상관없이 이 책을 통해 학습할 수 있다. 버전별로 분석에 사용되는 메뉴는 큰 차이가 없기 때문이다. 둘째, 실습에 필요한 데이터를 별도의 CD를 통해 제공하고 있다. 이 CD 속에는 통계분석 기법별로 사용할 수 있는 간단한 데이터들이 들어 있다. 이 데이터를 사용해서 실습 절차대로 따라할 수 있도록 했다. 셋째, 통계분석 프로그램인 SPSS를 사용해서 분석한 결과를 보고서나 논문으로 작성하는 방법에 관해 자세히 설명하고 있다. 일종의 보고서 샘플을 제시하면서 분석 결과를 어떻게 작성해야 하는지에 관해 보여준다. 넷째, 이 책은 통계적 용어를 사용하기는 하지만 상당히 쉬운 언어로 풀어서 설명하고 있다. 어쩔 수 없이 통계적 용어가 들어간 설명이 있어야 하는 경우도 많지만, 사실 일상의 언어로 풀어서 설명할 수 있는 통계 용어가 상당히 많다. 그래서 이 책은 쉽게 쓰기 위해 무작정 통계적 용어를 사용하지 않는 설명이 아니라, 통계적 용어를 함께 사용하되 일상의 언어로 이해하기 쉽게 설명했다. 다섯째, 학습 내용과 관련되면서 비교적 가볍게 읽을 수 있는 ‘읽기 자료’를 본문 중간중간에 삽입해 두었다. 주로 신문의 칼럼이나 기사들이다. 현재 배우고 있는 지식이 실생활과 많이 관련된다는 사실을 확인하면서, 학습 중간에 잠깐 동안 맛보는 일종의 분위기 환기용으로 활용될 수 있을 것이다.
이 책은 총 3부 12장으로 구성되어 있다. 크게 세 개의 상위 주제가 있고 각각의 주제에 하위 주제들이 포함되어 있는 형식이다. 하위 주제들은 세 개의 상위 주제에 각각 구분되어 포함되어 있으나, 연속적으로 1장부터 12장까지 이어진다.
이 책이 나오기까지 많은 분의 도움과 격려가 있었다. 지도교수인 고려대학교 행정학과 윤성식 교수님은 내가 한없이 존경하는 분이다. 내가 학생일 때나 교수가 되었을 때나 윤 교수님은 가장 큰 스승으로 내 마음속에 자리 잡고 계신다. 감사한 마음은 헤아릴 수 없다. 그리고 현재 내가 몸담고 있는 동양대학교 행정경찰학부 교수님들께도 많은 도움을 받았다. 교수님들께서는 언제나 나를 편하게 대해주면서 연구 환경을 최적으로 만들어 주셨다. 이에 감사한 마음을 전하고 싶다.
그리고 가족에 대한 무한한 감사의 마음도 전한다. 아버지(김석웅)와 어머니(이재선)는 내 삶의 가장 소중한 분들로서 나를 위해 모든 것을 해주시는 분들이다. 큰 자형(임상홍)과 큰누나(김혜숙)는 형제들 간의 맏이로서 든든한 역할을 하고, 둘째 자형(최명원)과 둘째 누나(김미숙)는 보이지 않게 물심양면으로 많은 도움을 주고, 막내 자형(김석근)과 막내 누나(김현숙)는 사소한 일까지도 도맡아서 자발적으로 모든 일을 먼저 한다. 그리고 조카 임아름, 임창우, 최은지, 최지혁, 김유라는 세상에서 가장 귀엽고 사랑스럽다. 내가 대학원 시절에 조카들은 나의 큰 에너지였다. 장인어른(김진성)과 장모님(강상전)은 나를 언제나 따뜻하게 맞아주면서 깊은 애정과 진솔한 배려로 큰 감동을 주신다. 처형(김한나)은 현명하고 지혜롭게 나와 아내에게 아낌없는 사랑과 지지를 보내주신다. 마지막으로, 아내 김유라는 나를 가장 존중해주면서 내가 부족한 많은 것들을 하나하나 다정한 손길로 채워준다. 아내는 양가 모두를 행복하게 만드는 일등 공신이다.
끝으로, 이 책의 출판을 흔쾌히 받아들이고 출판 과정에 큰 도움을 준 대영문화사 임직원분들께 감사의 마음을 전하고자 한다.
2015년 1월
연구실에서 김민주

