데이터 시각화
한정된 데이터로 추정해서 그리는 방법 (ggdensity)
r-code-for-data-analysis
2023. 5. 29. 12:36
데이터 분석을 하다보면 데이터 수가 모자란 상태에서 전체적인 데이터 분포를 알고 싶을 때가 있다.
이때 유용하게 사용하는 패키지가 "ggdensity" 이다.
1. 결과
2. 패키지 설치하고 불러오기
install.packages("ggdensity")
library(ggdensity)
3. 데이터 살펴보기
mpg
# A tibble: 234 × 11
manufacturer model displ year cyl trans drv cty hwy
<chr> <chr> <dbl> <int> <int> <chr> <chr> <int> <int>
1 audi a4 1.8 1999 4 auto… f 18 29
2 audi a4 1.8 1999 4 manu… f 21 29
3 audi a4 2 2008 4 manu… f 20 31
4 audi a4 2 2008 4 auto… f 21 30
5 audi a4 2.8 1999 6 auto… f 16 26
6 audi a4 2.8 1999 6 manu… f 18 26
7 audi a4 3.1 2008 6 auto… f 18 27
8 audi a4 q… 1.8 1999 4 manu… 4 18 26
9 audi a4 q… 1.8 1999 4 auto… 4 16 25
10 audi a4 q… 2 2008 4 manu… 4 20 28
4. 가로축을 배기량 (displ), 세로축을 연비 (hwy), 차종별로 산점도를 그리기
library(tidyverse)
library(tidyquant)
g1 <- mpg %>% ggplot(aes(displ,hwy,fill=class)) +
geom_hdr(probs=c(0.9,0.5), alpha=0.5)+
geom_point(shape=21, size=3)+
scale_fill_tq()+
theme_tq()+
facet_wrap(~class)
728x90
반응형