728x90 Programming/R4 [Programming][R] 작업 중간(workspace) 파일 저장하기 작업 중간에 결과를 저장하지 않고 R을 종료하면, 파일이 저장되지 않아 처음부터 다시 프로그램을 수행해야 하는 상황이 생긴다. 이때, 작업 중간중간 결과를 저장하는 쉬운 방법에 대해 알아보자! SAVE로 저장하기 model_xgboost.bak 2022. 2. 4. [Programming][R] 데이터 타입 변환하기 1부터 10까지의 숫자를 이용하여 다양하게 데이터 타입을 변경해보자. x 2022. 1. 31. [Programming][R]sample( ) 난수 생성하기(set.seed( ) 활용) 난수(Random number) 란? 난수는 일정한 범위 안에서 무작위로 추출된 수를 의미한다. 영어로 Random number로 쓰이는 것처럼 예측할 수 없고, 정해지지 않은 임의로 추출되는 수이다. R에서 난수 생성하는 방법 sample( ) 함수를 이용해서 R에서 난수를 생성할 수 있다. sample(x, size, replace = FALSE, prob = NULL) x: 생성하고자 하는 난수의 범위. size: 추출하려는 난수의 개수. replace: 복원 추출 여부. (TRUE: 중복해서 추출/ FALSE: 중복 없이 추출. 기본값은 FASLE이다.) prob: 추출되는 원소의 확률 가중치 벡터. sample(1:50, size = 7, replace = FALSE) [1] 15 11 8 7 .. 2022. 1. 31. [Programming][R] 랜덤 포레스트(Random Forest) R로 구현하기 패키지 설치 랜덤 포레스트를 사용하기 위해서 'randomForest' 패키지를 설치하고, 라이브러리로 불러온다. install.packages("randomForest") library(randomForest) randomForest 패키지에 대한 자세한 설명은 아래 첨부에서 확인할 수 있다 :) https://cran.r-project.org/web/packages/randomForest/randomForest.pdf 모델링 먼저, ntree와 mtry 파라미터를 이용하여 최적의 랜덤 포레스트 모델을 찾는다. ntree: 증가시킬 수 있는 가지의 수로, 모델에서 만들 의사결정 나무의 개수를 의미한다. mtry: 나무에서 분할할 때 랜덤 하게 표본 추출되는 변수의 수이다. 기본 값은 sqrt(변수의 수.. 2021. 12. 22. 이전 1 다음 반응형