본문 바로가기

머신러닝2

[caret] caret을 활용한 머신러닝 모델 구축 caretcaret은 tidymodels 이전에 R에서 주로 사용되던 머신러닝 패키지 입니다. caret은 Classification and REgression Training의 약자로 분류와 회귀문제를 해결하기 위한 패키지 입니다. caret에는 다양한 머신러닝 알고리즘을 구현 할 수 있습니다. 해당예제에서는 palmerpenguins패키지의 penguins data를 사용해서 caret으로 기본적인 머신러닝 모델을 만들어 보겠습니다. 해당 예제는 penguin의 성별을 예측하는 이진분류 문제 입니다. 1. 패지키 로드 # 패키지 로드 library(MLDataR)library(caret)library(tidyverse)library(palmerpenguins)2. 데이터 탐색dplyr의 glimp.. 2023. 8. 7.
[dplyr] select, filter, mutate, summarise로 데이터 다루기 dplyr는 R에서 데이터를 다루기 위해 필수적으로 익혀야 할 패키지입니다. 데이터를 구성하는 row와 colum 들을 자유롭게 접근하기 위한 다양한 함수들이 있습니다. 우선, R에서 데이터를 구성하는 타입은 기본적으로 data.frame입니다. matrix 형태로도 데이터를 다룰 수 있지만, dplyr를 적용하기 위해서는 data.frame 형태여야 합니다. data.frmae은 row와 column으로 구성 되어 있고, 각 column의 타입은 달라도 상관 없습니다. 1. data 먼저, 필요한 패키지를 불러오고, 사용할 데이터를 탐색합니다. 사용할 데이터는 MLDataR 패키지의 heartdisease입니다. MLDataR은 머신러닝용 데이터를 모아놓은 패키지입니다. 패키지 로드 후, dplyr의 .. 2023. 7. 26.