본문 바로가기

코딩 - R (계량경제학)

[계량경제학:R활용] 경제자료의 수집과 실증 분석

한국은행 경제통계시스템 홈페이지 (ecos.bok.or.kr) 접속 -> 2006년부터 2010년까지 한, 미, 일, 중, 영국 5년간 1인당 국민 총소득(GNI, 단위:$) 자료를 엑셀로 다운로드 -> R로 불러오기

교재에는 자료를 찾는 방법이 자세히 나와있지 않아, 열심히 찾는 중

교재의 데이터와는 같은 년도, 같은 국민총소득 기준이지만 값이 다르다.

R로 자료를 불러오기 위해서는, 행 이름과 열 이름을 제외한 국민총소득액(E2부터 I6셀 까지) 데이터를 숫자(nunmerical)로 지정 -> 수치형 데이터로 변환 후 천 단위 구분기호 제거 (,)

-> 이 과정을 거치지 않으면 문자열 데이터로 인식함

A,C,D열 제거

R에서는 공백을 인식할 수 없으므로 제거

참고로 본인은 교재와 같은 데이터값으로 변경 후 진행

엑셀 파일을 불러오기 위해서는 RODBC 패키지 사용
(개방 데이터베이스 표쥰 규격인 ODBC, OpenDataBaseConnectivity와 연동할 수 있음)
install.packages("RODBC")
library(RODBC)

R을 최신버전으로 씁씨다...

그야말로 폭풍...해설읽으면서...

5개국 국민총생산의 연도별 총액을 구하고, 5개 국가으 ㅣ5년간 국민총샌상의 평균을 살펴보자

colSums()함수를 통해 5년간 연도별 총액 구하기
rowMeans() 함수를 통해 행 방향으로 평균을 계산하자

아... 나중에 다시 해야지
수치로 바꿨는데 모르고있네

경제자료의 수집과 실증 분석(2)

2009년 1월부터 2011년 12월까지 36개월간의 외환보유액 자료를 텍스트로 다운로드 -> R 불러오기


이상하게 책의 예제에 나와있는 vec.feh를 객체로 하니 오류가 뜬다. 나는 vec로 했다.

근데 불러오고 보니, 불편하다. 시계열 자료로 불러오자.

선 그래프를 통해 추세나 변화를 보자

역시 예쁘지가 않다

이번엔 행렬 구조로 불러오자

Box plot을 그려보면, 각 엱도별 외화보유액의 분포 형태를 대략적으로 파악할 수 있따.

최댓값, 3사분위수, 중앙값, 2사분위수, 최솟값을 나타냄
만약 극단값 (Outlier)가 있으면 상자그림 상단에 표시해줌