이 글은 R 변수 개념, 값 저장 방법, 변수 연산, 변수명, 자료형태 등을 담고 있습니다.
R 변수 개념
- 변수: 값을 저장하는 저장소를 의미, 변수에 저장한 값은 언제나 변경 가능.
- 변수명만 혹은 print(변수명) 입력: 변수 저장 값 및 연산 결과 출력.
Alt + - 를 누르면, 대입연산자 <- 입력됨. 이는 "우측을 좌측에 대입하라"는 의미. 변수에 값 저장 시 사용.
* '=' 로도 저장 가능하나, <- 로 입력하자.
R 변수 여러 값 저장
c()
- c변수에 여러 값 저장 시 사용.
- c() 미입력 시 에러 발생.
*c: combine
콜론Colons(:)
- 변수에 여러 값 저장 시, 콜론 입력으로 저장 값의 범위 지정.
- 콜론 사용 시, c() 입력 없어도 사용 가능
seq()
- 일정 간격으로 연속 나열, 즉 등차수열 저장.
seq(1, 7): 1부터 7까지 1 증가.
seq(1, 7, by=2): 1부터 7까지 2 증가, 공차 2를 의미.
디폴트는 1 증가지만, 파라미터 추가로 (by= 입력) 2 증가됨.
*파라미터: 옵션을 의미, 파라미터를 추가하다=옵션을 설정하다.
R 변수 연산
- 변수 간 연산은 같은 자료형끼리만 가능(숫자+숫자).
- 변수 간 연산 시, 변수 내 같은 위치에 있는 숫자끼리 연산됨.
- 따라서 길이가 같은 변수끼리만 연산 가능하며, 길이 다르면 에러 발생.
- 예외: 길이가 달라도 변수 길이가 배수 관계면 연산 가능.
v1과 v2 모두 길이가 같으므로, 같은 위치의 값끼리 더하기 연산 가능.
*1+9, 2+8, 3+7, 4+6
a1과 a2의 길이가 다를 때는 좌측 사진처럼 에러 발생.
반면, a1과 a2의 길이가 배수 관계일 때는 우측 사진처럼 연산 가능.
*1+9, 2+8, 3+9, 4+8
R 변수명
- 첫 번째 글자: 영문자 혹은 마침표로 시작.
- 두 번째 글자: 영문, 마침표(.), 숫자, 언더바(_) 사용 가능.
- 변수명 중간에 빈칸 사용 불가 (ex. ab c 불가).
- 영문 대소문자를 구분하므로, a와 A는 다르다.
R 변수 자료형태(데이터 타입)
문자형
- 작은/큰 따옴표로 감싸줘야 문자형으로 인식
- 따옴표 미입력 시 에러 발생.
v1 <- apple처럼 따옴표 미입력 시 에러 발생, v1 <- "apple"은 저장 가능.
숫자형
- 정수, 실수 사용 가능 (ex. 1, 0.1, 0.25...)
- 따옴표 입력 시 문자로 인식되어 숫자 연산 불가
"1"처럼 따옴표 입력 시, 문자 1로 인식하기에 숫자 연산 불가.
논리형
- TRUE(T), FALSE(F)를 입력한다.
- 논리형에 따옴표는 사용하지 않는다.
v1과 v2는 "abc"로 동일하기에 TRUE 출력되었으나, v3는 "a"이기에 v1과 다르므로 FALSE 출력.
날짜형
- as.Date() 사용.
- 기본 형식은 YYYY-MM-DD.
특수값
- NULL: 아직 정의되지 않음(미정), 비어있다는 의미. 따라서 자료형태는 없음, 길이도 0이다.
- NA: 결측값 Missing Value, 찾을 수 없는 값.
- NAN: 수학적 정의가 불가함을 의미.
- Inf, -Inf: 양의 무한대, 음의 무한대
class()
- 자료형태/데이터 구조 확인 시 class() 사용
- 숫자형: numeric
- 문자형: character
- 매트릭스(행+열): matrix
- 데이터프레임: data.frame
- 리스트: list
- 배열: array, 만약 2차원이면 matrix로 출력
- 함수: function
- 테이블: table
'R, RStudio' 카테고리의 다른 글
R 데이터 구조 벡터(vector) 기본 정리 (0) | 2023.11.27 |
---|---|
RStudio 자간 넓어질 때(띄어쓰기 간격), 글자 이상하게 입력될 때 (0) | 2023.09.19 |
Rstudio 작업 디렉토리(작업 폴더 경로 설정) 변경, 확인 쉬운 방법 (0) | 2023.09.05 |