데이터 시각화

한정된 데이터로 추정해서 그리는 방법 (ggdensity)

r-code-for-data-analysis 2023. 5. 29. 12:36

데이터 분석을 하다보면 데이터 수가 모자란 상태에서 전체적인 데이터 분포를 알고 싶을 때가 있다. 

 

이때 유용하게 사용하는 패키지가 "ggdensity" 이다. 

 

1. 결과

 

 

2. 패키지 설치하고 불러오기

install.packages("ggdensity")
library(ggdensity)

 

3. 데이터 살펴보기

 

mpg
# A tibble: 234 × 11
   manufacturer model displ  year   cyl trans drv     cty   hwy
   <chr>        <chr> <dbl> <int> <int> <chr> <chr> <int> <int>
 1 audi         a4      1.8  1999     4 auto… f        18    29
 2 audi         a4      1.8  1999     4 manu… f        21    29
 3 audi         a4      2    2008     4 manu… f        20    31
 4 audi         a4      2    2008     4 auto… f        21    30
 5 audi         a4      2.8  1999     6 auto… f        16    26
 6 audi         a4      2.8  1999     6 manu… f        18    26
 7 audi         a4      3.1  2008     6 auto… f        18    27
 8 audi         a4 q…   1.8  1999     4 manu… 4        18    26
 9 audi         a4 q…   1.8  1999     4 auto… 4        16    25
10 audi         a4 q…   2    2008     4 manu… 4        20    28

 

4. 가로축을 배기량 (displ), 세로축을 연비 (hwy), 차종별로 산점도를 그리기

library(tidyverse)
library(tidyquant)

g1 <- mpg %>% ggplot(aes(displ,hwy,fill=class)) + 
  geom_hdr(probs=c(0.9,0.5), alpha=0.5)+
  geom_point(shape=21, size=3)+
  scale_fill_tq()+
  theme_tq()+
  facet_wrap(~class)
728x90
반응형