본문 바로가기

R

데이터 분석 시작기-3 (패키지 이해하기)

패키지란?

함수들을 한곳에 모아 놓은 하나의 꾸러미라고 할 수 있습니다.

그래프를 만들고, 텍스트 데이터를 만드는 등 여러 함수를 통해 실행할 수 있습니다. 

예를 들어, R 속에 들어 있는 다양한 패키지 중 ggplot2라는 것을 통해 여러 가지 함수를 사용할 수 있습니다.

 

다만!

 

패키지 설치하기 >> 패키지 로드하기 >> 함수 사용하기

 

이 세 단계가 어우러져야 합니다! 이때, 패키지 설치는 R을 설치하고 단 한 번이면 컴퓨터 속에 들어있지만, 패키지 로딩은 R studio를 새로 시작할 때마다 반복해야 합니다.(*매우 귀찮습니다 그리고 종종 까먹습니다,,ㅎㅎ)

 

ggplot2 패키지 설치 및 로딩

위에 사진과 같이 install.packages("ggplot2")는 패키지를 설치하는 과정, library(ggplot2)는 패키지를 로딩하는 과정입니다. 우리는 이 과정에서 library(ggplot2)를 매번 새로 켤 때마다 실행해 줘야 된다는 것입니다!

 

패키지를 로딩했으니, 들어있는 함수들을 사용해 봅시다!

먼저, x라는 변수를 만들기 위해 combine 함수를 사용하였고, qplot()이라는 패키지 속 내재된 함수를 사용하여 그래프를 만들었습니다!

이것들과 유사하게 qplot()을 활용하여 여러 가지 변수가 담긴 그래프를 만들 수 있습니다!

qplot(data = mpg, x = hwy)  # mpg라는 데이터를 활용하여 x축을 hwy라는 변수에 대해 그래프 출력
qplot(data = mpg, x = cty)  # mpg라는 데이터를 활용하여 x축을 cty라는 변수에 대해 그래프 출력
qplot(data = mpg, x = drv, y =hwy)  # mpg라는 데이터를 활용하여 x축을 drv라는 변수, y축을 hwy에 대해 그래프 출력

(점 모양)
qplot(data = mpg, x = drv, y =hwy, geom = "line") 위의 그래프를 선으로 만드는 코드.

 

이번에는 함수들의 꾸러미인 패키지에 대해 알아보았습니다!

항상 데이터 분석을 배워가면서 어려운 점이 많은 것 같습니다. 이러한 분야를 한 번도 도전해 보지 않고, 단순히 이론적인 부분을 외우는 공부만 하다 보니 외워야만 하는 불안감도 같이 따라오고요, 이는 주변 코딩하는 친구들에게 많이 도움을 받고 있습니다! 

더 잘해보기 위해 오늘도 한 걸음 나아가 보겠습니다!