R언어

상태
시작 전
담당자
날짜
숫자
0
매트릭스와 데이터프레임은 2차원 자료를 저장하기 위한 대표적인 자료구조
1차원 자료 : 학생들의 몸무게와 같이 단일 주제의 값들을 모아 놓은 것
2차원 자료 : 키, 몸무게, 나이와 같이 한 사람에 대한 여러 주제로 데이터를 수집한 형태
매트릭스와 데이터프레임의 차이 : 매트릭스에 저장도니는 모든 자료의 종류가 동일한 반면 데이터프레임에는 서로 다른 종류의 데이터가 저장

2차원 자료의 저장

테이블에서 가로줄 방향은 행, 또는 관측값
세로줄 방향은 열, 컬럼, 변수
가로와 세로가 교차되는 것을 셀이라고 함

매트릭스의 정의

매트릭스 : 2차원 테이블 형태의 자료 구조
매트릭스의 모든 셀에 저장되는 값은 동일한 종류이어야 함
매트릭스는 보통 숫자로만 구성된 2차원 자료를 저장하고 처리하는 데 이용
x <- 1:4 # 벡터 x 생성 y <- 5:8 # 벡터 y 생성 z <- matrix(1:20, nrow=4, ncol=5) # 매트릭스 z 생성 m1 <- cbind(x,y) # x와 y를 열 방향으로 결합하여 매트릭스 생성 m2 <- rbind(x,y) # x와 y를 행 방향으로 결합하여 매트릭스 생성 m3 <- rbind(m2,x) # 매트릭스 m2와 벡터 x를 행 방향으로 결합 m4 <- cbind(z,x) # 매트릭스 z 와 벡터 x를 열 방향으로 결합
R
복사

데이터프레임의 개념

숫자형 벡터, 문자형 벡터 등 서로 다른 형태의 데이터를 2차원 데이터 테이블 형태로 묶어서 저장하고 분석하는 데 사용되는 자료
외관상으로는 매트릭스와 차이가 없지만 매트릭스에 저장되는 모든 값들이 동일한 자료형인 것과는 달리 데이터 프레임에는 서로 다른 자료형의 값들이 함께 저장
city <- c("Seoul","Tokyo","Washington") # 문자로 이루어진 벡터 rank <- c(1,3,2) # 숫자로 이루어진 벡터 city.info <- data.frame(city,rank) # 데이터프레임 생성 city.info # city.info의 내용 출력
R
복사
문자로 이루어진 city라는 벡터와 숫자로 이루어진 rank라는 벡터 생성
두 개의 벡터를 data.frame()함수로 묶어 city.info라는 데이터 프레임을 생성
벡터들이 열 방향으로 결합됨
iris 데이터셋
iris는 150그루의 붓꽃에 대해 4개 분야의 측정 데이터와 품종 정보를 결합하여 만든 데이터셋
iris의 내용을 출력하는 방법은 iris라고 입력
4개의 숫자형 열과 1개의 문자형 열이 결합되어 만들어진 데이터프레임

데이터 입출력

1.
데이터 처리 과정 : 데이터 입력 → 정보 추출 → 처리 결과 출력 console로 처리 결과 출력 : print(), cat()
2.
변수로 데이터 입력하고 파일로 출력하는 방법 파일로 처리 결과 출력, sink(’파일명’, append = T)
3.
입력 화면을 통해서 데이터 입력하고 콘솔로 출력 install.packages('svDialogs') # 패키지 설치 library(svDialogs) user.input <- dlgInput('Input income')$res user.input as.numeric() = 문자 데이터를 숫자 데이터로 변경
작업 폴더 관련 함수