머리말 오늘날 정보통신의 발달과 사회가 고도로 전문화․분업화되면서 행정을 둘러싼 사회 현상도 복잡화되고 있다. 행정의 효율성을 높이고 합리적인 사회문제 해결을 위한 행정의 역할 역시 고도의 전문성을 필요로 하고 있다. 이런 측면에서 행정통계론은 과학적 방법으로 행정 현상에 대한 이해와 실증분석을 통한 예측 능력을 높이는 지식을 제공할 것이다. 통계학적 지식의 중요성이 증대되면서 많은 대학에서 행정통계론 강의를 개설하고 있지만, 이를 이해하고 사회 현상에 접목하기란 좀처럼 쉬운 일이 아니다. 따라서 이 책은 통계학 비전공자를 대상으로 복잡한 이론보다 기초적인 통계학적 지식을 통해 사회 현상을 관찰, 분석, 기술하고, 이를 기초로 추론해 나가는 데 초점을 두었다. 즉, 행정통계론의 실용적 측면에서 집필했다. 통계학 교재들은 수없이 많이 나와 있다. 그리고 행정통계학의 경우에도 시중에 많은 좋은 서적이 나와 있음은 주지의 사실이다. 그럼에도 불구하고 R과 R Commander(Rcmdr)를 이용한 행정통계론 관련 서적은 우리가 알기로는 이 책이 처음인 것으로 알고 있다. 이와같이 R과 Rcmdr를 이용한 처음의 시도가 학생들과 독자들에게 어떻게 다가갈지 솔직히 걱정 반 기대 반으로 상당히 걱정되는 마음이 앞선다. 이러한 인식에 따라 우리가 이 책을 집필하는 데는 나름대로 몇 가지 중요한 이유가 있었다. 개인 PC의 발달과 함께 복잡한 통계학적 수리 연산을 대신할 수 있는 다양한 형태의 통계 프로그램이 개발 및 상용화되고 있다. 대중적으로 알려진 SPSS, SAS부터 STATA, Minitab 등 종류가 다양하다. 하지만 개인 사용자가 이들 프로그램을 구입하여 활용하기에는 경제적 부담이 크다. 이러한 이유로 Excel 등에서 제공하는 통계분석 툴을 활용하기도 한다. 최근 이러한 경제적 부담을 완화시켜줄 수 있는 오픈 소스 형태의 프로그램이 개발되어 제공되고 있는데, 가장 대표적인 것이 R이라는 프로그램이다. R은 언제든지 http://www.r-project.org 사이트에서 무료로 다운받아 학교나 직장에서 개인이 자유롭게 사용할 수 있다. 또한 R 프로그램은 확장성이 다양하다는 장점이 있다. 전문화된 패키지(package)를 통해 기능을 확장시킬 수 있다. 최근 R 관련 패키지들이 질적․양적 측면 모두 급속도로 확산되고 있다는 것이다. 2002년 100여 개 정도에 불과하던 패키지가 2013년에는 R 프로그램 안에 4,000개 이상이 구성되어 있다. 이러한 확장성으로 인해 시중에 나와 있는 대부분의 고가의 소프트웨어 통계분석 작업이 R에서 가능할 뿐만 아니라, 특화된 패키지를 통해 더욱더 심도 있는 분석 작업이 가능하다. 그러나 R을 사용하기에는 약간의 인내가 필요하다. R 프로그램은 명령어(commander) 방식의 프로그램이다. 이런 이유로 윈도우 환경에 익숙한 학생들의 경우 처음부터 “R 프로그램은 어려운 프로그램이다”라는 선입관으로 쉽게 포기하게 된다. 이러한 초기의 어려운 점을 감안하여 윈도우 환경에 익숙한 독자를 위해 이 교재는 Rcmdr라는 윈도우 환경의 R 프로그램을 통한 행정통계 분석기법을 소개했다. Rcmdr는 SPSS와 같이 메뉴 방식의 통계분석이 가능하다는 장점이 있다. 따라서 통계학을 처음 만나는 독자의 경우 좀 더 쉽게 접근할 수 있을 것이다. 또한 30여 개 이상의 윈도우용 Rcmdr plug-in 프로그램이 사용 가능하게 구성되어 있다. 해당 plug-in을 선택하여 특화된 고급 통계분석이 가능하다. 나아가 R에서 사용되는 명령어를 통해 분석할 수 있다는 측면에서 활용성은 매우 높다. 좀 더 심도 있는 작업을 위한 독자라면 명령어 방식으로 전환이 필요하다. 이 책은 행정통계학 관련 분야의 이론들에 대해 심도 있게 설명하기보다는 실제의 자료 또는 가상 자료를 통해 다양한 통계적 분석 방법을 적용하여 결과를 얻고 해석하는 실무자(practitioner) 관점에서 집필되었다. 아무튼 Rcmdr을 이용하여 나름대로 최대한 쉽게 설명하려고 노력했다. 수리통계학적으로 엄격한 가정과 조건을 쉽게 설명하는 과정에서 다소 독자가 이해하기 어려운 부분이나, 잘못된 형태의 표현, 오류들이 발생할 수 있다. 앞으로 이들 오류에 대해서는 꾸준히 보완 수정해 나갈 것을 약속드린다. 이 책이 출판되기까지 물심 양면으로 도움을 준 대영문화사 임춘환 사장님과 임직원 여러분께 깊은 감사의 말씀을 전한다. 그리고 취업 준비에 바쁜 와중에도 고생한 부경대학교 행정학과 황현수 군과 남홍비 양에게도 심심한 감사의 말을 전한다. 끝으로 이 책에서 사용된 자료들은 대영문화사 홈페이지(http://www.dymbook. co.kr)에서 다운받아 볼 수 있음을 밝혀둔다. 2014년 1월 저자 정건섭․김성우 차 례 제1장 통계학과 통계분석 도구 13 제1절 통계와 통계학 13 1. 자료의 수집과 정리/13 2. 통계와 통계학/14 제2절 행정통계와 통계분석 도구 15 1. 통계학의 기원과 발전/15 2. 행정통계학의 필요성/17 3. 통계분석 도구의 활용/18 제3절 R Commander의 설치 및 기초 20 1. R Commander 설치하기/20 2. R Commander 둘러보기/26 3. 데이터 불러오기/30 4. 자료의 변경 및 관리하기/32 제2장 자료의 수집과 정리 37 제1절 자료의 수집과 정리 37 1. 자료의 수집 방법/37 2. 모집단과 표본/38 3. 변수의 유형/39 제2절 자료의 구분 및 척도 40 1. 자료의 구분/40 2. 자료의 척도/40 제3절 자료의 정리 42 1. 표와 그림에 의한 자료의 정리/42 2. 수치에 의한 자료의 특성/45 제4절 R Commander를 이용한 기술통계 분석 연습 53 1. 도표의 작성(빈도분석)/53 2. 그래프 그리기/54 3. 기술통계/58 제3장 확률과 확률분포 60 제1절 확률의 기초 60 1. 확률의 정의/61 2. 확률의 공리 및 덧셈 법칙/62 3. 조건부 확률과 곱셈 법칙/65 4. 결합(동시)확률과 주변(한계)확률/67 5. 베이즈 정리/68 제2절 확률변수와 확률분포 70 1. 확률변수/70 2. 확률분포/72 3. 확률분포의 기댓값과 분산/73 제3절 주요 확률분포 75 1. 이항분포/75 2. 포아송분포/78 3. 정규분포/79 4. 표준정규분포/80 제4절 R Commander를 이용한 연습 82 1. R Commander를 이용한 이항확률 계산/82 2 R Commander를 이용한 포아송분포/84 3. R Commander를 이용한 정규분포/85 제4장 표본추출과 표본분포 88 제1절 표본추출 89 1. 표본과 모집단/89 2. 표본추출 방법/90 3. 표본오차/93 4. 모집단의 크기와 표본의 크기/95 제2절 표본분포 96 1. 표본 통계량과 모수의 관계/96 2. 표본 평균의 분포/97 3. 표본 비율의 분포/100 4. 두 표본 평균 및 두 표본 비율차의 분포/101 제5장 통계적 추정 104 제1절 점추정과 바람직한 추정량 105 1. 점추정/105 2. 바람직한 추정량의 조건: 불편성, 효율성, 일치성/105 3. 바람직한 추정량을 산출하는 방법/109 제2절 구간추정 110 1. 모평균의 구간추정/111 2. T분포를 이용한 모평균의 추정/113 제3절 R Commander를 이용한 실습 118 1. R Commander를 이용한 T분포의 확률 계산/118 2. R Commander를 이용한 T분포 모양 그리기/120 제6장 가설의 설정과 검정 122 제1절 추리통계와 가설검정 123 1. 추리통계와 가설검정 절차/123 2. 가설의 설정/124 3. 가설검정 방법의 선정/126 4. 가설의 판정/126 5. 양측검정과 단측검정/130 제2절 가설검정의 오류 133 제7장 T검정 135 제1절 T검정의 기초 135 1. T검정의 활용/135 2. T검정에 필요한 조건/136 제2절 T검정을 통한 가설검정 137 1. 단일표본 T검정/137 2. 독립표본 T검정/138 3. 대응표본 T검정/139 제3절 R Commander를 이용한 가설검정 140 1. 단일표본 T검정/140 2. 두 집단 간의 평균 차이 검정/142 3. 대응표본 T검정(짝을 이룬 T검정)/147 제8장 분산분석 151 제1절 분산분석의 개요 152 1. 분산분석의 활용과 가설의 설정/152 2. 분산분석의 가정/152 3. 분산분석의 원리/153 제2절 R Commander를 이용한 일원분산분석 155 제9장 검정과 비모수검정 162 제1절 비모수검정 162 제2절 검정 163 1. 적합도 검정/165 2. 동질성 검정/167 3. 독립성 검정/168 제3절 기타 비모수적 통계검정 170 1. 윌콕슨 검정/170 2. 크러스칼-왈리스 검정/171 제4절 R Commander 비모수 통계학의 가설검정 173 1. 분석에 의한 가설검정/173 2. 윌콕슨 검정/178 3. 크러스칼-왈리스 검정/182 제10장 상관분석 186 제1절 상관분석의 기초 186 1. 공분산과 상관계수/186 2. 상관분석의 요건 및 가정/188 제2절 상관분석의 가설 및 검증 189 1. 상관분석의 가설 및 검증/189 2. 편상관분석/190 3. 순위상관 관계/191 제3절 R Commander를 이용한 상관분석 192 1. 상관분석/192 2. 편상관분석/194 3. 순위상관 관계/197 제11장 단순회귀분석 200 제1절 회귀분석의 기초 201 1. 통계적 관계와 함수적 관계/201 2. 가설의 설정과 회귀모형/203 제2절 단순회귀분석의 이론적 기초 206 1. 표본 회귀식의 결정/206 2. 회귀식의 전제 조건/209 3. 회귀식의 오차항/210 4. 회귀식의 적합도/212 5. 회귀식의 선형 관계 및 회귀계수에 대한 가설 검증/214 제3절 R Commander를 이용한 단순회귀분석 215 제12장 다중회귀분석 219 제1절 다중회귀분석 개요 219 제2절 다중회귀분석의 가정 및 이론적 기초 220 1. 다중공선성의 문제와 해결/222 2. 수정된 결정계수/223 3. 표준회귀계수/224 4. 독립변수의 선택 및 방법/224 제3절 더미변수를 이용한 회귀분석 225 제4절 R Commander를 이용한 다중회귀분석 227 1. 다중회귀분석/227 2. 다중공선성의 진단과 잔차분석/229 3. 표준화된 회귀계수/232 4. 다중회귀분석의 요약 및 해석/233 5. 더미변수를 이용한 회귀분석/234 <부록 1> 설문 및 코딩 자료 243 <부록 2> 각종 통계표· 247 참고 문헌/256 찾아보기/258 저자약력 정건섭 ∙택사스 주립대(댈러스) 도시주택 계량정책 전공 ∙택사스 주립대(댈러스) 지역개발연구소(Bruton Center) 연구원 ∙택사스 주립대(댈러스) 정치경제학 박사 ∙인천광역시 정책연구실장 ∙한서대학교 행정학과 교수 ∙현재 부경대학교 행정학과 교수 [주요 논문] ∙Hedonic Models of Housing Prices: A Critical Appraisal of the Assumptions The Application of the Efficient Housing Price Estimation With and/or Without Heteroskedasticity ∙Chow and Wald Tests for Parameter Equality under Conditions of Heteroskedasticity ∙The Regional Homogeneity in the Presence of Heteroskedasticity 김성우 ∙부산대학교 경영학 석사 ∙부경대학교 행정학 박사 ∙부경대학교 공공정책연구소 [주요 논문] ∙서비스산업을 중심으로 한 지역경제 구조 변화에 따른 지방세 수입의 영향분석 ∙사회서비스 일자리 확충이 경제 성장에 미치는 영향 ∙부산의 주택 하위시장 구분 및 특성에 관한 연구 ∙그랜저 인과 분석을 통한 매매와 전세시장이 주택가격 결정구조 분석 ∙지방정부의 재정 능력에 따른 주민의 사회복지서비스 인식 비교연구 |