- Correlation analysis (상관 관계 분석)2021년 05월 08일 15시 02분 37초에 업로드 된 글입니다.작성자: r-code-for-data-analysis
install.packages("corrplot")
첫 번째 코드부터 에러...
뭐지?
> install.packages("corrplot")
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:
https://cran.rstudio.com/bin/windows/Rtools/
Warning in install.packages :
'lib = "C:/Program Files/R/R-3.6.0/library"' is not writable
Warning in install.packages :
디렉토리 'C:\Users\nakch\OneDrive\??'를 만들 수 없습니다. 그 이유는 'Invalid argument'입니다.
Error in install.packages : unable to create ‘C:/Users/nakch/OneDrive/??/R/win-library/3.6’
구글링을 통해 해결
우선 폴더 하나를 만들자
C:\myRproject\Library
그리고 폴더 설정
> .libPaths("c:/myRproject/Library")
https://m.blog.naver.com/rickman2/221449799786
[R 공부하기] R 라이브러리 Package 설치 오류(Error) - libPaths 설정하기
0. R 라이브러리 문제 원인 R의 강력한 기능 중 하나는 다양한 라이브러리가 존재한다는 것입니다. 그러...
blog.naver.com
이제 제대로 설치됨.
그럼 불러오기
> library(corrplot)
corrplot 0.84 loaded
경고메시지(들):
패키지 ‘corrplot’는 R 버전 3.6.3에서 작성되었습니다
이건 또 뭔가... 뭐가 이렇게 에러가 많은지...
그리고 구글링
에러 원인은 백신 프로그램...
그래서 알약을 종료하고 다시 실행하니 제대로 수행됨.
이제 시작인데, 이렇게 구글링 하면서 하나씩 해결해야 하나?
https://m.blog.naver.com/jjy0501/221300556843
R 패키지 설치 및 업데이트 오류 (1)
R 패키지를 설치하거나 업데이트 하다보면 여러 가지 문제가 생기는 경우들이 있습니다. 이 경우 아예 R...
blog.naver.com
드디어 이제부터 상관관계 분석 시작
mtcars의 데이터 셋을 불러와서 (R 에 기본 내장되어 있음)
gear 와 carb (연료 분사 정도)의 상관관계를 분석하는 것이다.
명령어는 간단하다. cor(변수1, 변수2)
install.packages("corrplot")
library(corrplot)
a=mtcars
a
mcor2=cor(a$gear,a$carb)
mcor2
> mcor2
[1] 0.2740728
결과는 0.27로 낮은 상관관계가 있음.
다음은 이걸 xy 산점도로 그래프 그리기
install.packages("lattice")
library(lattice)
xyplot(gear~carb, data=a)
xy 그래프는 xyplot(x변수~y변수, data=xy가 있는 dataframe 변수)
여기서 dataframe 은 a로 두었음
다음은 두 변수의 1차 회귀 분석
lm=plot(a$gear, a$carb)
abline(lm(a$gear~a$carb))
1차식을 만들기 위해 linear model의 약자인 lm 변수를 사용함
1차 함수는 abline(변수(x~y)) 를 사용
xyplot 보다 plot이 좀 더 투박함.
어쨌든 두 변수간 관계가 없어 보임
그럼 mtcars의 data 들간의 상관관계를 전부 볼 수는 없을까?
mcor=cor(mtcars) #모든 변수들끼리 상관관계 분석
mcor
자기 자신과는 1의 상관관계를 가지고, 다른 변수들 간의 양의 상관관계, 음의 상관관계 정도를 볼 수 있음
round(mcor,2) #상관관계를 소수점 둘째 자리로 정리
숫자로 보기 어려우니, 상관 관계 그래프를 색과 사이즈로 표현
파란색으로 갈수록 양의 상관관계, 빨간색은 음의 상관관계, 사이즈가 크면 강한 상관관계...
오.. 이것 매우 편하군.
disp와 wt는 강한 양의 상관관계를 가지고,
mpg와 cyl, disp, wt는 강한 음의 상관관계를 가짐을 알 수 있다.
corrplot(mcor)
산점도 그래프로 그리려면 그냥
plot(mtcars)
R 프로그램의 장점.. 그래프 그리기가 매우 편함.
사실 R 프로그램의 꽃은 ggplot이다.
뉴질랜드의 해들리 위컴이 박사학위로 데이터 시각화 ggplot을 만들었다고 한다.
예전에 그의 논문을 찾아보았는데... 정말 엄청났다.
http://had.co.nz/thesis/practical-tools-hadley-wickham.pdf
한 사람에 의해 만들어진 R의 ggplot
마치 파이썬이 여러 명의 천재들에 의해 완성된 것이 19세기, 20세기 초의 양자역학과 비슷하다고 하면 R은 두 교수 이후로 해들리 위컴에 의해 완성되었다고 할 수 있었다. 마치 아인슈타인처럼...
어쨌든 실행해 보자.
qplot이란 그래프 그리는 명령어는 qplot(x변수, y변수, data= )로 표현한다. x, y를 컴마로 표현한 것이 좀 더 직관적이다.
install.packages("ggplot2")
library(ggplot2)
qplot(gear,carb, data=a)
다음은 자동차 무게(wt)와 연비(mpg)와의 상관관계를 보자
cor(a$wt, a$mpg)
> cor(a$wt, a$mpg)
[1] -0.8676594
그리고 무게에 따른 연비 그래프를 그리되, carb 로 분류해서 색을 표시하자.
qplot(wt, mpg, data=a, color=factor(carb))
코드 정리
install.packages("corrplot")
library(corrplot)
a=mtcars
a
mcor2=cor(a$gear,a$carb) #상관계수 구하기
mcor2
install.packages("lattice")
library(lattice)
xyplot(gear~carb, data=a)
lm=plot(a$gear, a$carb) #회귀 분석(1차)
abline(lm(a$gear~a$carb)) #회귀분석 1차식 그래프 그리기
mcor=cor(mtcars) #모든 변수들끼리 상관관계 분석
mcor
round(mcor,2) #상관관계를 소수점 둘째 자리로 정리
corrplot(mcor) #상관관계 그래프
plot(mtcars) #모든 변수들 간의 상관관계 보기
install.packages("ggplot2")
library(ggplot2)
qplot(gear,carb, data=a)
cor(a$wt, a$mpg)
qplot(wt, mpg, data=a, color=factor(carb)) #qplot으로 보기
728x90반응형'데이터 분석' 카테고리의 다른 글
점탄성 특성 분석 (ANOVA, PCA분석) (0) 2023.05.30 [Machine Learning] 여러가지 모델 한번에 적용해서 분석하기 (0) 2023.05.29 Multi slit 구조에서 빛의 회절을 시뮤레이션 해 보기 (0) 2023.05.29 Optical Density(OD)에 따른 빛의 침투 깊이 시뮬레이션 (0) 2023.05.29 대한민국 인구분포 피라미드 그래프 그리기(pyramid) (0) 2023.05.29 댓글