데이터 프레임
데이터 프레임에서 가로는 행(row)라고 하고 세로는 열(column)이라고 한다.
데이터 분석하는 사람들의 약속이자 관행: - 세로, 열에는 변수를 입력 - 데이터 한건 한건은 행 입력
하나의 열은 하나의 벡터이다. 즉, 매출월 벡터, 요일 벡터, 점포벡터, 성별 벡터, 구매 건수 벡터 인것 이다.
컬럼명
names()를 통해 데이트 프레임의 컬럼명을 확인한다.
매출월, 요일, 점포, 성별, 구매건수 5가지 컬럼명을 확인 할 수 있다.
names(매출)
[1] "매출월" "요일" "점포" "성별" "구매건수"
데이터의 전체 데이터 형태 확인하기: dim( ) 함수
dim()을 통해 전체 데이터의 형태(행 ,열)를 확인한다.
[1] 2520 5은 매출 데이터가 2520행 5열의 형태라는 뜻이다.
dim(매출)
[1] 2520 5
하나의 열벡터 출력하기
데이터 프레임$변수
$ 뒤에 나오는 변수열을 벡터로 보여준다.
매출$구매건수
[1] 21451 24922 8835 13720 10826 43319 2471 10457 17081 18583 6833 33803 [13] 2265 32637 49704 33882 45928 23123 28571 22597 8386 3414 44846 13692 [25] 46510 27044 34966 41706 615 48015 34036 4238 48480 5802 43844 19384 [37] 45484 37483 43539 28638 45173 10102 34339 20495 47135 29043 31131 43904 [49] 4965 47399 26026 38362 24443 5040 25888 29762 10173 15292 4994 16475 ...
벡터로 다룰 수 있다.
[1:10]로 구매건수의 1행부터 10행까지 10개의 원소 벡터가 출력된다.
매출$구매건수[1:10]
[1] 21451 24922 8835 13720 10826 43319 2471 10457 17081 18583
데이터 프레임 인덱싱
[행, 열]으로 조작한다.
[행, 열]에서 열을 c('열 이름1', '열 이름2',,) 형태로 직접 입력하여 인덱싱 할 수 있다.
매출 데이터 프래임의 행은 1행부터 10행, 열은 1열부터 3열까지 슬라이싱한다.
매출[1:10, 1:3]
매출월 요일 점포 1 1 월 a 2 1 화 b 3 1 수 c 4 1 목 d 5 1 금 e 6 1 토 f 7 1 일 g 8 1 월 h 9 1 화 i 10 1 수 j
슬라이싱 결과를 매출일부 변수에 저장한다
매출일부 = 매출[1:10, 1:3]
매출건수는 각 10건씩, 열은 점포와 구매건수를 뽑아 매출일부에 저장한다.
매출일부 = 매출[1:10, c('점포', '구매건수')]