- R을 이용한 시계열 분석 연습 (인구, 출생율)2023-11-04 12:04:19통계청 사이트에서 1980년도부터 월별 출생아수, 혼인건수, 이혼건수, 사망건수를 시계열 분석해보자 패키지, 데이터 로드library(tidyverse) library(lubridate) df head(df) # A tibble: 6 × 5 V1 출생아수 혼인건수 이혼건수 사망자수 1 1981.01 월 88151 49285 1827 - 2 1981.02 월 93556 34481 1687 - 3 1981.03 월 70421 47843 2094 - 4 1981.04 월 66093 35956 2189 - 5 1981.05 월 68940 35769 2059 - 6 1981.06 월 64634 31132 2098 - 날짜 데이터 처리df2 % mutate(year = substr(V1, 1,4), month = ..
- DACON 영화관객수 예측(회귀)2023-10-21 11:27:17Code Show All Code Hide All Code 영화관객수 예측 첨물 2023-10-14 라이브러리 불러오기 오늘은 데이콘의 영화 관객수 예측 데이터를 이용하여 데이터 분석을 해 보겠습니다. 데이터를 다운받아서 R 코딩을 통해 시각화, 머신러닝(회귀) 연습입니다. 데이터 출처 데이터 불러오기 rm(list=ls()) train % na.omit() %>% select(dir_prev_bfnum,box_off_num) %>% cor() ## dir_prev_bfnum box_off_num ## dir_prev_bfnum 1.0000000 0.2831842 ## box_off_num 0.2831842 1.0000000 28% 상관성을 가지는 것으로 나온다. 그럼 이번 영화의 관객수와 상관성이 가장..
- [머신러닝 모델링을 통한 타이타닉 데이터 분석]2023-07-09 21:30:34Code Show All Code Hide All Code 머신러닝 타이타닉 생존자 예측 2023-07-09 knitr::opts_chunk$set(echo=F, fig.align = "center", message=F, warning=F, fig.height = 5, cache=T, dpi = 300) #데이터 불러오기 데이터 변수와 형식을 보자. Survived 가 우리가 예측해야 하는 종속변수이고, 나머지 컬럼이 독립변수이다. ```r str(train) ## 'data.frame': 891 obs. of 12 variables: ## $ PassengerId: int 1 2 3 4 5 6 7 8 9 10 ... ## $ Survived : int 0 1 1 1 0 0 0 0 1 1 ... ## $..
- [R을 이용한 타이타닉 생존자 예측]2023-07-09 18:00:30고전 문제다. 일단 데이터 다운로드 R에서 머신러닝 하는 예전 방법이 아닌 최근 Workflow로 하는 방식을 연습해보았다. 분류 문제를 XGBoost 를 통해 예측하는 연습 문제다. XGBoost (eXtreme Gradient Boosting)는 그라디언트 부스팅 트리 알고리즘에서 유명하고 효율적인 오픈 소스 구현입니다. 그라디언트 부스팅은 더욱 단순하고 약한 모델 세트의 추정치의 앙상블을 결합하여 대상 변수를 정확하게 예측하려 시도하는 지도 학습 알고리즘입니다 일단 학술적인 원리는 넘어가고, 생존자를 예측하는 문제를 풀어보자 #데이터 불러오기 rm(list=ls()) library(tidyverse) library(gt) library(patchwork) library(skimr) library(e..
- R을 이용한 축구 데이터 분석 (MAP)2023-06-11 17:38:47오늘 새벽 유럽 챔피언스 결승 경기로 많은 사람들이 아침잠을 설쳤을 것이다. R을 이용하여 축구 데이터 분석을 할 수 있는 블로그를 발견하여 약간 변형하여 따라 해 보았다. 참조 블로그 https://towardsdatascience.com/how-to-visualize-football-data-using-r-ee963b3a0ba4 How to Visualize Football Data Using R Tutorials on creating shots, passes, and heat maps towardsdatascience.com 위 예시는 옛날 경기라 20/21 라리가의 메시를 중심으로 데이터 분석을 다시 진행하였다. 필요한 패키지 설치 및 라이브러리 불러오기 # 필요한 라이브러리 설치 install...
- 점탄성 특성 분석 (ANOVA, PCA분석)2023-05-30 12:21:08Code Show All Code Hide All Code 유기막의 점탄성 특성 측정 water.choi 2022 9 14 유체 구분 Rheometer를 이용하여 shear rate를 변경시키면서 viscosity 변화량을 본다. include_graphics("./images/rheometer.jpg") 점도 측정방법 원통형 사이에 유체를 넣거나, 원판 사이에 유체를 넣고, 회전 속도를 변경하면서 stress 변화랴을 통해 점도를 측정한다. include_graphics("./images/thixo.gif") # 10의 지수승으로 변환하는 함수 만듦 l
- [Machine Learning] 여러가지 모델 한번에 적용해서 분석하기2023-05-29 09:29:40여러가지 머신 러닝 모델이 있다. 각각이 최적인 데이터가 있으므로 보통 5가지 정도를 넣어 돌려보고 가장 적합한 것을 선택한다. 물론 각각 하이퍼 파라미터값을 바꾸면 최적화 정도가 다르겠지만 간단히 돌려보는 예제를 해 보려고 한다. 사용하는 모델은 아래 다섯가지다. 1. 결과 보기 : 대부분은 랜덤포레스트가 가장 좋은 경우가 많다. 2. R^2 을 찾아서 예측력을 보는 것도 중요하지만, 각각의 모델이 어떤 변수들을 중요하게 생각하는 중요도 분석을 함께 하는 것이 좋다. 3. 코드 분석 #패키지 불러오기 library(tidyverse) library(dplyr) library(caret) library(ModelMetrics) library(randomForest) library(stringr) libr..
- Multi slit 구조에서 빛의 회절을 시뮤레이션 해 보기2023-05-29 08:45:34반도체, 디스플레이에서 노광 공정을 하다 보면 마스크 폭 사이즈가 작아 회절 효과를 자주 보게 된다. 역시 빛은 파동이라는 진리를 마주 하게 된다. 이걸 GPT를 통해 R로 시뮬레이션 해 보았다. 1. GPT : 365nm UV 빛이 있고, Open/Space size가 마이크로미터로 변하면서 빛의 회절 효과를 보는 r 코드 # Define variables d
- Optical Density(OD)에 따른 빛의 침투 깊이 시뮬레이션2023-05-29 08:39:39감광성 유색 유기막 재료를 개발할 때 자주 쓰이는 용어가 OD 이다. 흡광도라고 하고, 입사한 빛이 물질을 지나고 나서 얼마나 감소하는지를 비율로 나타내고, 거기에 상용로그값을 취한 것이다. 기준은 두께 1um 에서 ... 즉, OD 1.0 은 빛이 100이 입사되고 물질을 지나서 나오는 빛이 10이면 10% 투과율을 가진다. 이때 OD가 1이다. OD 2.0 은 1% 투과율을 가지는 재료이므로 더 Dark 한 재료이다. https://ko.wikipedia.org/wiki/%ED%9D%A1%EA%B4%91%EB%8F%84 흡광도 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. ko.wikipedia.org 그러면 깊이에 따라 uv 파장대의 빛이 입사되면 어디까지 도달하는지 알고 싶..
- 대한민국 인구분포 피라미드 그래프 그리기(pyramid)2023-05-29 08:03:19통계청 사이트에서 연도별 대한민국 인구 데이터를 불러와서 나이대별, 성별로 전처리를 한 후 아래와 같이 그려보는 연습을 해 보았다. 일단 데이터와 동영상을 아래 첨부에 붙였다. 여기서 사용할 패키지는 "pyramid" 이다. 일본인이 만들었군. http://minato.sip21c.org/swtips/Rgraphics.html#PYRAMID 統計処理ソフトウェアRについてのTips/グラフィクス ●グラフィックデバイスによって異なる。 中間さんのAI_UCS2.Rをsource()を使うなどして先に実行してからグラフィックデバイスを開き,par(family="Japan1GothicBBB")をしてグラフ出力すべき。はしご minato.sip21c.org 그럼 어떻게 코딩을 했는지 살펴보자 1. 패키지 설치 및 불러오기 instal..
728x90
반응형