- [머신러닝 모델링을 통한 타이타닉 데이터 분석]2023-07-09 21:30:34Code Show All Code Hide All Code 머신러닝 타이타닉 생존자 예측 2023-07-09 knitr::opts_chunk$set(echo=F, fig.align = "center", message=F, warning=F, fig.height = 5, cache=T, dpi = 300) #데이터 불러오기 데이터 변수와 형식을 보자. Survived 가 우리가 예측해야 하는 종속변수이고, 나머지 컬럼이 독립변수이다. ```r str(train) ## 'data.frame': 891 obs. of 12 variables: ## $ PassengerId: int 1 2 3 4 5 6 7 8 9 10 ... ## $ Survived : int 0 1 1 1 0 0 0 0 1 1 ... ## $..
- [R을 이용한 타이타닉 생존자 예측]2023-07-09 18:00:30고전 문제다. 일단 데이터 다운로드 R에서 머신러닝 하는 예전 방법이 아닌 최근 Workflow로 하는 방식을 연습해보았다. 분류 문제를 XGBoost 를 통해 예측하는 연습 문제다. XGBoost (eXtreme Gradient Boosting)는 그라디언트 부스팅 트리 알고리즘에서 유명하고 효율적인 오픈 소스 구현입니다. 그라디언트 부스팅은 더욱 단순하고 약한 모델 세트의 추정치의 앙상블을 결합하여 대상 변수를 정확하게 예측하려 시도하는 지도 학습 알고리즘입니다 일단 학술적인 원리는 넘어가고, 생존자를 예측하는 문제를 풀어보자 #데이터 불러오기 rm(list=ls()) library(tidyverse) library(gt) library(patchwork) library(skimr) library(e..
- [R을 이용한 gradient 막대그래프]2023-07-09 12:16:57Code Show All Code Hide All Code 화장품 보습효과 시각화 2023 7 9 Background 피부 깊이별 수분의 변화량 데이터가 있다. 화장품 바르기, 전후 피부 깊이별 수분의 양을 연속적으로 표현하려고 한다. 그런데 기존 데이터 분석은 x축을 파부 깊이, y축을 수분양으로 해서 2종의 샘플 (test, control) 적용 전후 line 그래프로 시각화하였다. Problem 고객이 원하는 수준은 아래와 같이 3차원 시각화를 원했다. 그러나 데이터의 수가 x축 깊이, y축 수분량으로 2차원 데이터라 3차원으로는 어려웠다. 이에 ggplot으로 geom_tile, geom_rater + gradient color 적용으로 문제를 해결하려고 함 Methode 데이터의 수가 부족하니 ..
- R을 이용한 서울시 도서관 위치 시각화2023-06-25 13:09:52어제는 googleVis 패키지를 이용해서 지도 시각화를 했는데 더 간단하게 볼 수 있는 패키지가 있다. leaflet 이다. 사용법도 너무나 간단하다. 패키지와 데이터 불러오기 library(tidyverse) library(leaflet) df % rename(lat = 위도, lng = 경도) %>% select(lng, lat, 도서관명) -> m leaflet() %>% addTiles() %>% addMarkers(lng = m$lng, lat = m$lat, popup=m$도서관명) 그러면 서울시 공공 도서관 위치 시각화가 된다. R 마크다운으로 다시 작성해봄
- R을 이용한 대한민국 동물 병원 지도 시각화2023-06-24 19:05:31데이터는 공공데이터포털에서 얻었다. https://www.localdata.go.kr/devcenter/dataDown.do?menuNo=20001 LOCALDATA - 지방행정인허가데이터개방:데이터다운로드 전체 데이터다운로드 전체 인허가 데이터에 대한 전체분,월 변동분, 일 변동분에 대한 자료를 제공받을 수 있습니다. 전체 다운로드 선택 업종다운로드 36개 그룹, 196개 업종에 대한 데이터를 업 www.localdata.go.kr 동물병원 분포도를 그려봄 단순 위도/경도 데이터로만 산점도로 그려봄 googleVis 패키지를 이용하여 쉽게 지도로 표시함 그럼 어떻게 했는지 살펴보자. 패키지 설치 및 데이터 불러오기 library(tidyverse) library(googleVis) library(rea..
- R을 이용한 축구 데이터 분석 (MAP)2023-06-11 17:38:47오늘 새벽 유럽 챔피언스 결승 경기로 많은 사람들이 아침잠을 설쳤을 것이다. R을 이용하여 축구 데이터 분석을 할 수 있는 블로그를 발견하여 약간 변형하여 따라 해 보았다. 참조 블로그 https://towardsdatascience.com/how-to-visualize-football-data-using-r-ee963b3a0ba4 How to Visualize Football Data Using R Tutorials on creating shots, passes, and heat maps towardsdatascience.com 위 예시는 옛날 경기라 20/21 라리가의 메시를 중심으로 데이터 분석을 다시 진행하였다. 필요한 패키지 설치 및 라이브러리 불러오기 # 필요한 라이브러리 설치 install...
- R을 이용한 대한민국 국회 의석수 시각화2023-06-10 13:28:11아래 사이트를 들어가 보면 21대 대한민국 국회의원 의석수를 시각화가 잘 되어 있다. https://open.assembly.go.kr/portal/assm/assmPartyNegotiationPage.do 열린국회정보 국회를 열다, 정보를 나누다. open.assembly.go.kr R을 이용하여 이와 같은 정당별 의석수 시각화 예제가 있어 따라 해 보았다. 참고 자료 https://rforpoliticalscience.com/2023/01/19/how-to-create-semi-circle-parliament-graphs-with-the-ggparliament-package-in-r/ How to create semi-circle parliament graphs with the ggparliament..
- R을 이용한 대한민국의 민주주의 지수 정량 분석2023-06-09 15:49:25사회과학에서도 R을 이용한 분석이 활발히 이루어지고 있어 관련 사이트를 참고하여 분석해보려고 한다. 참고 사이트 https://rforpoliticalscience.com/2022/03/18/download-democracy-data-with-democracydata-pacakge-in-r/ Download democracy data with democracyData package in R Packages we will need: library(democracyData) library(tidyverse) library(magrittr) # for pipes library(ggstream) # proportion plots library(ggthemes) # nice ggplot themes library..
- RSTUDIO로 위키피디아 문서 검색 (tidywikidatar)2023-05-30 17:03:57해들리 위컴의 깃허브를 가끔씩 들어가보면 매우 유용한 패키지 개발내역들이 많다. 위키피디아 문서를 텍스트로 읽어와서 분석하는 패키지가 "tidywikidatar" 이다. https://github.com/hadley/tidywikidatar GitHub - hadley/tidywikidatar: This is a read-only mirror of the CRAN R package repository. tidywikidatar — Exp :exclamation: This is a read-only mirror of the CRAN R package repository. tidywikidatar — Explore 'Wikidata' Through Tidy Data Frames. Homepage: https..
- 점탄성 특성 분석 (ANOVA, PCA분석)2023-05-30 12:21:08Code Show All Code Hide All Code 유기막의 점탄성 특성 측정 water.choi 2022 9 14 유체 구분 Rheometer를 이용하여 shear rate를 변경시키면서 viscosity 변화량을 본다. include_graphics("./images/rheometer.jpg") 점도 측정방법 원통형 사이에 유체를 넣거나, 원판 사이에 유체를 넣고, 회전 속도를 변경하면서 stress 변화랴을 통해 점도를 측정한다. include_graphics("./images/thixo.gif") # 10의 지수승으로 변환하는 함수 만듦 l
728x90
반응형