시계열 y가 다른 시계열 x와 선형 관계 가진다고 예측하기!
x | y |
---|---|
regressors | regressand |
independent variable | dependent variable |
explanatory variable | explained variable |
predictor variable | forecast variable |
(1) 단순 선형 회귀
: 이때 yt 는 실제 관측값 (예측치는 y hat) : beta0 = y절편 / beta1 = 기울기 (x 1단위 변화 시 y 변화) / epsilon = 오차 (관측값과 회귀직선 간 y값 차)
#geom_smooth lm 옵션 통해 회귀직선 그리기
#se: 오차범위 표
us_change |>
ggplot(aes(x = Income, y = Consumption)) +
labs(y = "Consumption (quarterly % change)",
x = "Income (quarterly % change)") +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
#회귀식 추정하기
#기울기 = 0.27183 / y intercept = 0.54454
us_change %>%
model(TSLM(Consumption ~ Income)) %>%
report()
Series: Consumption
Model: TSLM
Residuals:
Min 1Q Median 3Q
-2.58236 -0.27777 0.01862 0.32330
Max
1.42229
Coefficients:
Estimate Std. Error t value
(Intercept) 0.54454 0.05403 10.079
Income 0.27183 0.04673 5.817
Pr(>|t|)
(Intercept) < 2e-16 ***
Income 2.4e-08 ***
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’
0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.5905 on 196 degrees of freedom
Multiple R-squared: 0.1472, Adjusted R-squared: 0.1429
F-statistic: 33.84 on 1 and 196 DF, p-value: 2.4022e-08
(2) 다중 선형 회귀
: 예측 변수가 여러 개 있을 때
⇒ 각 beta 값은 다른 설명 변수 고려한 후 도출됨 ⇒ 설명 변수의 marginal effect 파악 가능
us_change %>%
GGally::ggpairs(columns = 2:6)
#첫 열이 4개의 x => 1개의 y 상관관계 보여줌
#Income, Production과 양의 상관관계 가