R

[R] Finding, Dividing values (which, cut, quantile)

에릭 Kim 2022. 6. 28. 02:59
반응형

which()

 

which(x, condition) 

  • x값에 맞는 자리의 인덱스를 반환해주는 함수

 

 

myindex에서는 인덱싱 값을 리턴해주고, x 안에서 myindex를 인덱싱하면, 실제 값을 리턴 할 수 있습니다.

 

 

which.max(x) & which.min(x) 

  • x의 최솟값과 최댓값의 인덱스를 리턴해주는 함수

 

 

cut()

 

cut(x, breaks, right, ...)

  • x의 범위를 구간으로 나누고, 어느 구간에 속하는지 x의 값을 코드화합니다. 
  • breaks: x를 나눌 간격을 나타내는 옵션입니다. 
  • right: right 옵션이 True이면[default], 왼쪽 값을 포함하고, False이면 오른쪽 값을 포함합니다. 

 

 

breaks 옵션을 c(0,2,4,6)로 정의 했기에 나누는 구간이 0 ~ 2, 2~4, 4~6가 됩니다.

right 옵션은 정의하지 않았기 때문에 default값인 right = TRUE가 되고, 오른쪽 값을 포함하는 의미인 (x,y]형태로 값이 반환됩니다. ( right = FALSE인 경우는 [x,y) )

 

quantile()

 

quantile(x, prob, ...)

  • 주어진 확률에 해당하는 표본 분량을 생성합니다. 

 

 

Example

 

 

cut_points라는 변수에 mtcars$mpg를 구분할 확률을 정의합니다.

efficiency라는 변수를 만든 후, cut함수를 사용합니다. 이때, breaks는 이전에 만들어 둔 cut_points라는 변수를 사용하고, include.lowest = T를 선언함으로써 가장 낮은 값 또한 포함되도록 합니다. 

mtcars 데이터의 결과 값을 확인해보면 Duster 360의  fuel_efficiency만 오른쪽 값과 왼쪽 값이 []로 둘 다 포함되어 있는 것을 볼 수 있는데, 이는 include.lowet를 TRUE로 설정하였기 때문입니다.  

반응형