6강. 판단적 예측

7강. 시계열 회귀 모형

시계열 y가 다른 시계열 x와 선형 관계 가진다고 예측하기!

x y
regressors regressand
independent variable dependent variable
explanatory variable explained variable
predictor variable forecast variable

7.1 The linear model

(1) 단순 선형 회귀

Untitled

: 이때 yt 는 실제 관측값 (예측치는 y hat) : beta0 = y절편 / beta1 = 기울기 (x 1단위 변화 시 y 변화) / epsilon = 오차 (관측값과 회귀직선 간 y값 차)

#geom_smooth lm 옵션 통해 회귀직선 그리기 
#se: 오차범위 표
us_change |>
  ggplot(aes(x = Income, y = Consumption)) +
  labs(y = "Consumption (quarterly % change)",
       x = "Income (quarterly % change)") +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE)

#회귀식 추정하기
#기울기 = 0.27183 / y intercept = 0.54454 
us_change %>%
  model(TSLM(Consumption ~ Income)) %>%
  report()

Series: Consumption 
Model: TSLM 

Residuals:
     Min       1Q   Median       3Q 
-2.58236 -0.27777  0.01862  0.32330 
     Max 
 1.42229 

Coefficients:
            Estimate Std. Error t value
(Intercept)  0.54454    0.05403  10.079
Income       0.27183    0.04673   5.817
            Pr(>|t|)    
(Intercept)  < 2e-16 ***
Income       2.4e-08 ***
---
Signif. codes:  
  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’
  0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5905 on 196 degrees of freedom
Multiple R-squared: 0.1472,	Adjusted R-squared: 0.1429
F-statistic: 33.84 on 1 and 196 DF, p-value: 2.4022e-08

Untitled

(2) 다중 선형 회귀

Untitled

: 예측 변수가 여러 개 있을 때

⇒ 각 beta 값은 다른 설명 변수 고려한 후 도출됨 ⇒ 설명 변수의 marginal effect 파악 가능

us_change %>%
  GGally::ggpairs(columns = 2:6)

#첫 열이 4개의 x => 1개의 y 상관관계 보여줌
#Income, Production과 양의 상관관계 가