반응형

R 6

[R] Aggregate, Order&Sort

aggregate aggregate(var1 ~ var2, data= x, FUN = func, ...) var1에는 function으로 계산된 변수가 들어갑니다. var2에는 grouping을 위한 변수가 들어갑니다. var2를 기준으로 var1에 function을 적용한 값을 출력합니다. 결과값을 dataframe 형태로 리턴합니다. cyl을 기준으로, mpg의 평균을 리턴 aggregate(var1 ~ (var2+var3), data = x, FUN = func, ...) cyl과 am을 기준으로 mpg의 평균값을 구해서 리턴 aggregate(cbind(var1,var2) ~ var3, data = x, FUN = func, ...) mpg과 qsec의 평균값을 cyl을 기준으로 구해서 리턴 or..

R 2022.07.21

[R] Functions & Conditional, Iterative Statement(if,for) & Vectorized Operation

Function 함수 (function)는 어떠한 동작을 자동으로 수행하는 루틴의 개념입니다. ex) print(), mean(), max(), etc. 입력 값을 주면, 함수를 거쳐 결과값으로 출력됩니다. R에서는 이미 존재하는 함수뿐만 아니라 사용자가 함수를 만들어서 사용할 수 있습니다. 함수를 만들어서 사용하는 것이 빈번하지는 않지만, 함수를 이해하기 위해서는 그 방식을 알고 있어야 할 필요가 있습니다. FunctionName

R 2022.06.29

[R] String Concatenation (paste, paste0, gsub)

paste() paste(x1, x2, sep, collapse ...) 여러 값을 한 문자열로 연결합니다. 2개 이상의 백터에서 요소별로 요소를 연결합니다. 나열된 원소 사이에 공백을 두고 결과값을 출력합니다. sep 옵션은 나열된 원소 사이에 들어갈 값을 결정할 수 있습니다. collapse 옵션은 결과값이 두개 이상일 때, 각각의 결과값에 원하는 값을 주어서 이어붙일 때 사용할 수 있습니다. paste0() paste0(x1, x2, sep, collapse ...) paste 함수와 비슷하지만 나열된 원소 사이에 공백을 두지 않는다는 차이점이 있습니다. paste 함수와 paste0함수를 함께 사용하여 원하는 결과값을 출력할 수도 있습니다. gsub() gsub(oldPattern, newPatt..

R 2022.06.28

[R] Finding, Dividing values (which, cut, quantile)

which() which(x, condition) x값에 맞는 자리의 인덱스를 반환해주는 함수 myindex에서는 인덱싱 값을 리턴해주고, x 안에서 myindex를 인덱싱하면, 실제 값을 리턴 할 수 있습니다. which.max(x) & which.min(x) x의 최솟값과 최댓값의 인덱스를 리턴해주는 함수 cut() cut(x, breaks, right, ...) x의 범위를 구간으로 나누고, 어느 구간에 속하는지 x의 값을 코드화합니다. breaks: x를 나눌 간격을 나타내는 옵션입니다. right: right 옵션이 True이면[default], 왼쪽 값을 포함하고, False이면 오른쪽 값을 포함합니다. breaks 옵션을 c(0,2,4,6)로 정의 했기에 나누는 구간이 0 ~ 2, 2~4, ..

R 2022.06.28

[R] DataFrame Manipulation(split, subset, merge)

Split() split(df, split_var, ...) 분할 변수를 사용하여 데이터 프레임을 목록으로 분할하는 함수 두가지 컬럼을 기준으로 데이터를 분리하고 싶으면 list로 지정하면 됩니다. ex) split(mtcars, list(mtcars$cyl,mtcars$mpg)) subset() subset(df, condition, select, ...) 기준점을 잡고 데이터를 subset 할 수 있습니다. (condition) select 옵션은 특정 열을 선택할 때 사용됩니다. 특정 열을 선택하지 않을 수도 있습니다. (select 옵션 인자에 '-'를 붙여줌 ) merge() merge(df1, df2, all, ...) 두개의 데이터 프레임을 공통 변수를 가진 하나의 데이터 프레임으로 결합 a..

R 2022.06.28

[R] Matrix, Dataframe, List

Matrix(행렬) R에서 행렬은 동일한 데이터 유형(숫자, 문자)의 요소를 고정된 개수의 행과 열로 배열한 집합입니다. 행과 열로만 작업하기 때문에 행렬을 2차원 배열(2D)라고 합니다. matrix() 행렬의 첫 번째 인수는 R이 행렬의 행과 열에 정렬할 요소입니다. byrow 인수는 행렬이 행에 의해 채워진다는 것을 말합니다. 만약 열로 채우길 원한다면 byrow = FALSE로 두시면 됩니다.(default) nrow 인수는 행렬이 가지고 있어야 할 행의 수를 나타냅니다. colnames(),rownames(): 행과 열의 이름을 지정해주는 함수 rowSums(),colSums(): 행과 열의 합을 구해주는 함수 rowMeans(),colMeans(): 행과 열의 평균을 구해주는 함수 rbind(..

R 2022.06.27
반응형