본문 바로가기

전체 글

(19)
데이터 분석 시작기-3 (패키지 이해하기) 패키지란? 함수들을 한곳에 모아 놓은 하나의 꾸러미라고 할 수 있습니다. 그래프를 만들고, 텍스트 데이터를 만드는 등 여러 함수를 통해 실행할 수 있습니다. 예를 들어, R 속에 들어 있는 다양한 패키지 중 ggplot2라는 것을 통해 여러 가지 함수를 사용할 수 있습니다. 다만! 패키지 설치하기 >> 패키지 로드하기 >> 함수 사용하기 이 세 단계가 어우러져야 합니다! 이때, 패키지 설치는 R을 설치하고 단 한 번이면 컴퓨터 속에 들어있지만, 패키지 로딩은 R studio를 새로 시작할 때마다 반복해야 합니다.(*매우 귀찮습니다 그리고 종종 까먹습니다,,ㅎㅎ) 위에 사진과 같이 install.packages("ggplot2")는 패키지를 설치하는 과정, library(ggplot2)는 패키지를 로딩하는..
데이터 분석 시작기-2 (Variable and Function) # 데이터 분석을 위한 간단한 개념 변수는 '변하는 수' 소득 성별 학점 국적 100만원 남 4.27 대한민국 200만원 여 4.38 대한민국 300만원 남 4.44 대한민국 소득 / 성별 / 학점은 변하는 수(variable), 국적은 변하지 않는 상수(constant)입니다. 우리는 변하는 수인 변수 간의 어떤 관계가 있는지 파악하는 것이 주 목적입니다. 위 그림은 우리가 주로 만들고자 하는 변수를 R에서 만들어 가는 것입니다. 이렇게 만든 변수를 사칙연산을 통해 연산할 수도 있으며, 여러 가지 활용을 할 수 있습니다. 위 그림은 단순히 a, b 등 알파벳에 변수를 집어넣는 것이 아니라, 실제로 우리가 흔히 사용하는 score, grade 등 영어로 된 변수를 생성하는 모습을 간단히 var1, var..
데이터 분석 시작기-1 유전체 분석을 위해 새로운 프로그래밍 언어를 배우고자 다짐했습니다! 처음 시작하는 언어는 R 언어, 여러 과학 분야에서 데이터 분석에 많이 쓰인다고 합니다. 대학원 진학을 생각하고 있는 필자로서, 새로운 언어를 배우는데 많은 분들이 티스토리를 통해 자신만의 이야기를 담아 가는 것을 보고 시작하기로 다짐했습니다! 포스트를 하면서 다뤄볼 책은 이지스퍼블리싱의 "Do it! 쉽게 배우는 R 데이터 분석"입니다. 잘부탁드립니다!