구문
sample(x, size, replace = FALSE, prob = NULL)
sample.int(n, size = n, replace = FALSE, prob = NULL)
예제
x <- c("a","b","c","d","e")
#비복원 추출 샘플링
sample(x)
[1] "e" "c" "b" "a" "d"
#비복원 추출 샘플링( 추출 수 지정 )
sample(x,3)
[1] "d" "e" "a"
#복원 추출 샘플링
sample(x,3,replace=T)
[1] "a" "d" "a"
#가중치 부여를 통해 TrainSet 70% TestSet 30%로 데이터 분리
y <- rnorm(1000, 10)
flag <- sample(1:2,length(y),replace=T,prob=c(0.7,0.3))
TrainSet <- y[flag==1]
TestSet <- y[flag==2]
length(TrainSet)
[1] 701
length(TestSet)
[1] 299
댓글 없음:
댓글 쓰기