일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 변동분해
- 이항분포
- 반복있음
- 산점도
- r
- 회귀분석
- 반복없음
- 가설검정
- 이원배치 분산분석
- 데이터 과학
- 에세이
- css
- 티스토리챌린지
- 추정
- 오블완
- version 1
- 정규분포
- 두 평균의 비교
- 분산분석
- 확률
- 경제학
- 통계학
- html
- 글쓰기
- 인공지능
- 고정효과모형
- JavaScript
- version 2
- 혼합효과모형
- 변량효과모형
- Today
- Total
생각 작업실 The atelier of thinking
13. R 과 R Studio 본문
Chapter 13. R 과 R Studio
1. R
(1) R 이란 ?
요즘 통계학에서는 R과 같은 통계프로그램의 중요도가 더욱 높아지고 있습니다.
R은 통계학과 데이터 분석 분야에서 널리 사용되는 강력한 프로그래밍 언어로, 데이터 처리, 시각화, 통계 모델링, 머신러닝 등 다양한 기능을 제공합니다. 이에 따라 R은 많은 통계학자, 데이터 과학자, 연구자들 사이에서 광범위하게 사용되고 있습니다.
R의 인기는 다양한 이유로 설명될 수 있습니다.
첫째, R은 오픈 소스이며 무료로 사용할 수 있습니다. 이는 사용자들에게 접근성과 유연성을 제공하며, 통계학 및 데이터 분석 분야에 대한 더 많은 사람들이 참여하고 기여할 수 있는 환경을 조성합니다.
둘째, R은 풍부한 패키지와 라이브러리 생태계를 갖추고 있습니다. R의 사용자들은 다양한 통계 및 데이터 분석 기능을 제공하는 수많은 패키지를 활용할 수 있습니다. 이러한 패키지들은 통계 모델링, 데이터 시각화, 기계 학습 등 다양한 분야에서 신속하고 효율적인 분석을 가능하게 합니다.
셋째, R은 통계학의 전통과 학문적인 기반을 갖추고 있습니다. R은 통계학자들이 통계 이론과 방법론을 적용하고 연구 결과를 검증하기 위해 필요한 다양한 통계적 기능을 제공합니다.따라서 R은 통계학의 연구, 교육, 실무 등 다양한 측면에서 중요한 도구로 인정받고 있습니다.
마지막으로, R은 커뮤니티와 사용자들 간의 지속적인 지원과 지식공유가 활발하게 이루어지고 있습니다. 이는 사용자들이 문제를 해결하고 새로운 기능과 기술을 배우며 지속적으로 개발과 혁신을 이루어 낼 수 있는 환경을 제공합니다.
따라서, R과 같은 통계프로그램은 현대 통계학과 데이터 분석 분야에서 필수적인 도구로 인정받고 있습니다. R의 활용은 데이터의 이해와 분석, 통계적 추론 및 모델링, 의사결정에 큰 도움을 주며, 효율적인 분석과 연구를 수행할 수 있는 기반을 제공합니다.
(2) R 설치하기
▶ 운영체제에 맞게 선택하면 됩니다.
▶ Window 용
▶ R 초기화면
2. R Studio
R Studio는 R을 편리하게 사용하기 위한 통합개발 환경(IDE) 프로그램으로 무료버전 RStudio Desktop을 다운로드 받을 수 있습니다.
(1) 설치하기
https://posit.co/download/rstudio-desktop/
RStudio를 설치한 후 RStudio 프로그램을 열어보면 다음과 같은 화면을 볼 수 있습니다.
RStudio의 화면은 여러 개의 구획으로 이루어져 있으며, 일반적으로 보이는 구획은 다음과 같습니다.
- 콘솔 : R 명령을 입력하고 결과가 출력됩니다.
- 환경 : 현재 세션에서 사용 가능한 각 객체를 보여줍니다.
- 파일 : 디렉터리의 파일을 보여줍니다.
▶ 한글이 깨져 나온다면,
Tools > Global Options > Code > Saving 을 선택한 후
Defaulting text encoding을 UTF-8 으로 변경하고 Apply 버튼 클릭합니다.
▶ 파일을 통한 작업
모든 분석은 프로젝트별로 별도의 디렉터리를 만들어서 관리하는 것이 편리합니다.
File > New Project > New Directory > New Project 를 선택한 후,
대화상자에서
프로젝트-디렉터리 이름 : "Leaning R"
상위 디렉터리 : browsing을 통해서 적절한 디렉터리 선정합니다.
Working Dirctory 를 시작과 함께 설정해 놓으면 작업하기가 한 결 수월합니다.
Session > Set Working Directory > Choose Directory 에서 위 프로젝트를 선정하면 작업준비 끝납니다.
이제 File > New File > R Script 를 선택하면 아래와 같이 파일이 열립니다.
4 등분된 화면으로 작업을 하게 됩니다.
(2) R studio 실행하기
- 코드를 작성합니다.
- 실행하고자 하는 코드를 선택하고 Run을 클릭하거나 Cntr+Enter를 사용하면 됩니다.
- 실행 결과는 console 화면에서 확인할 수 있습니다. code를 직접 console 창에 입력해서 사용할 수도 있습니다.
# 1.자료 불러오기
pie <- scan("pie.txt", what="character")
table(pie)
▶ scan( ) 함수
R에서 데이터 파일이나 텍스트 파일에서 데이터를 읽을 때 사용합니다.
기본적으로 텍스트 파일을 한 줄씩 읽어 들이고, 각 줄에서 공백이나 구분이나 구분자를 기준으로 데이터를 분리하여 벡터로 반환합니다.
다양한 데이터 유형을 지원하며, 문자열, 숫자, 논리값 등을 읽을 수 있습니다.
데이터 파일에서 누락된 값, 잘못된 값, 문자열로 표현된 논리값 등을 처리할 수 있는 다양한 옵션을 제공합니다.
scan(file = "", what = double(), n = -1, sep = "", quote = "\"'", dec = ".",
na.strings = "NA", flush = FALSE, fill = TRUE, strip.white = FALSE, quiet = FALSE,
skip = 0, multi.line = TRUE, comment.char = "#", allowEscapes = FALSE,
fileEncoding = "", encoding = "unknown")
file : 데이터를 읽어올 파일 이름 또는 URL
what : 읽어들일 데이터의 유형을 지정
n : 읽어들일 데이터의 개수를 지정
sep : 데이터를 구분하는 구분자
quote : 문자열을 묶는 따옴표 기호
dec : 소수점 기호를 지정
na.strings : 누락된 값을 나타내는 문자열
'통계학 이야기' 카테고리의 다른 글
14-2. R 을 이용한 자료 요약 (0) | 2023.09.01 |
---|---|
14-1. R 을 이용한 자료 요약 (0) | 2023.08.31 |
12. 데이터 시각화의 중요성을 알려주는 사례 (1) | 2023.08.28 |
11. 자료의 요약 (0) | 2023.08.28 |
10. 자료 정리 (1) | 2023.08.28 |