- RSTUDIO로 위키피디아 문서 검색 (tidywikidatar)2023-05-30 17:03:57해들리 위컴의 깃허브를 가끔씩 들어가보면 매우 유용한 패키지 개발내역들이 많다. 위키피디아 문서를 텍스트로 읽어와서 분석하는 패키지가 "tidywikidatar" 이다. https://github.com/hadley/tidywikidatar GitHub - hadley/tidywikidatar: This is a read-only mirror of the CRAN R package repository. tidywikidatar — Exp :exclamation: This is a read-only mirror of the CRAN R package repository. tidywikidatar — Explore 'Wikidata' Through Tidy Data Frames. Homepage: https..
- 한정된 데이터로 추정해서 그리는 방법 (ggdensity)2023-05-29 12:36:43데이터 분석을 하다보면 데이터 수가 모자란 상태에서 전체적인 데이터 분포를 알고 싶을 때가 있다. 이때 유용하게 사용하는 패키지가 "ggdensity" 이다. 1. 결과 2. 패키지 설치하고 불러오기 install.packages("ggdensity") library(ggdensity) 3. 데이터 살펴보기 mpg # A tibble: 234 × 11 manufacturer model displ year cyl trans drv cty hwy 1 audi a4 1.8 1999 4 auto… f 18 29 2 audi a4 1.8 1999 4 manu… f 21 29 3 audi a4 2 2008 4 manu… f 20 31 4 audi a4 2 2008 4 auto… f 21 30 5 audi a4 2...
- 움직이는 그래프를 만들어보자(gganimation)2023-05-29 10:02:04gganimation이란 패키지를 이용하면 움직이는 그래프를 만들어볼 수 있다. 1. 결과 보기 2. 코드 분석 library(gganimate) p
- RSTUDIO로 gps 데이터 3d 시각화하기(rgl)2023-05-29 09:41:42얼마전 누리호3호가 발사되었다. 앞으로 인공위성에서 보내오는 신호를 이용하여 많은 비즈니스 모델이 생길 것을 기대한다. 인공위성등이 보내오는 gps 데이터를 3d로 시각화 해 보는 것을 연습해보자 1. 결과 보기 2. 코드 분석 #데이터 불러오기 mytelematics
- 그래프에서 하이라이트 적용하기(gghighlight)2023-05-29 09:36:16여러 선들이 겹쳐있을 때 내가 중요하게 보는 것만 강조해서 보여주는 패키지가 "gghighlight" 이다. https://yutannihilation.github.io/gghighlight/ Highlight Lines and Points in ggplot2 Make it easier to explore data with highlights. yutannihilation.github.io 그러면 아래와 같이 여러개 선들 중 중요하게 보여주고 싶은 것만 색을 칠할 수 있다. 1. 패키지 설치 및 불러오기 install.packages("gghightligt") library(gghighlight) 2. 데이터 만들기 set.seed(2) d 17) ggplot(d) + geom_line(aes(idx, ..
- 구글스프레드 시트 불러와서 RSTUDIO로 코딩하기(googlesheets4)2023-05-29 08:59:40많은 사람들이 윈도우의 엑셀을 사용하겠지만 요즘은 구글스프레드시트도 많이 사용한다. 우선 클라우드상에 저장해 놓으므로 어디서든 사용할 수 있기 때문이다. R에서 구글스프레드시트에 저장되어 있는 데이터를 불러올 때 필요한 패키지는 "googlesheets4" 이다. 1. 패키지 설치 및 불러오기 install.packages("googlesheet4") library(googlesheets4 2. 구글에 접속해서 파일에 접근 / 권한 허용하기 df % read_sheet() gs4_auth() 3. 그러면 아래와 같은 계정 확인 및 권한 허용 화면이 나옴 4. 그리고 나서 데이터 살펴봄. GPT에게 물어보는 질문 데이터셋이다.
- xyz 3열의 데이터를 2d, 3d로 시각화 해보기(plot_ly)2023-05-29 08:29:14데이터를 다루다보면 x,y,z 3열의 데이터를 다룰때가 있다. 보통 x,y는 위치 값이고, z값이 특성값이다. 이걸 효과적으로 시각화 하는 방법을 연습해 보았다. 1. x,y 축 위에 z 값을 색으로 표시하는 방법이다. ggplot(data, aes(x=x, y=y) ) + stat_density_2d(aes(fill = ..density..), geom = "raster", contour = FALSE) + scale_x_continuous(expand = c(0, 0)) + scale_y_continuous(expand = c(0, 0)) + scale_fill_viridis() + theme( legend.position='none' ) 2. 다음은 x, y 좌표평면에 z축을 세우고, 색으로 z값을..
- Sank Diagram 으로 QC 데이터 시각화 하기(ggalluvial)2023-05-29 08:15:37날짜별 제품의 신뢰성 데이터를 측정을 하고, Spec을 정해서 Pass, Fail을 정한다고 해보자. 제품의 특정 position1 과 position2 중 어떤 위치에서 불량율이 높인지를 보는데 용이한 패키지가 있다. 바로 "ggalluvial" 패키지이다. 이걸 이용한 그래프를 Sank Diagram이라고 한다. https://corybrunson.github.io/ggalluvial/ Alluvial Plots in ggplot2 Alluvial plots use variable-width ribbons and stacked bar plots to represent multi-dimensional or repeated-measures data with categorical or ordinal var..
- 대한민국 인구분포 피라미드 그래프 그리기(pyramid)2023-05-29 08:03:19통계청 사이트에서 연도별 대한민국 인구 데이터를 불러와서 나이대별, 성별로 전처리를 한 후 아래와 같이 그려보는 연습을 해 보았다. 일단 데이터와 동영상을 아래 첨부에 붙였다. 여기서 사용할 패키지는 "pyramid" 이다. 일본인이 만들었군. http://minato.sip21c.org/swtips/Rgraphics.html#PYRAMID 統計処理ソフトウェアRについてのTips/グラフィクス ●グラフィックデバイスによって異なる。 中間さんのAI_UCS2.Rをsource()を使うなどして先に実行してからグラフィックデバイスを開き,par(family="Japan1GothicBBB")をしてグラフ出力すべき。はしご minato.sip21c.org 그럼 어떻게 코딩을 했는지 살펴보자 1. 패키지 설치 및 불러오기 instal..
- RSTUIDO에서 boxplot, density, point를 한번에 그리는 법(ggdist)2023-05-29 07:35:45데이터 시각화 중 대표적인 것이 boxplot 이다. 그런데 개별점을 표시하는 point와 같이 쓸 경우 겹쳐 보여서 시인성이 안 좋다. 더구나 데이터 분포를 보는 density 까지 보여주려면 그래프가 지저분해진다. 이걸 해결해 주는 패키지가 "ggdist" 이다. https://mjskay.github.io/ggdist/ Visualizations of Distributions and Uncertainty Provides primitives for visualizing distributions using ggplot2 that are particularly tuned for visualizing uncertainty in either a frequentist or Bayesian mode. Both ..
728x90
반응형