R группировка данных по факторам и уровням


Я пытаюсь сделать таблицу частот, которая группирует значения в ограниченное число ячеек.

Скажем, у меня есть данные

X <- c(1,2,3,4,3,9, 20)

Я могу сделать таблицу частот такой, что она показывает все пустые ячейки следующим образом:

(factor(X, levels = c(0:max(X))))

Вместо того, чтобы показывать частоту каждого возможного значения, я хотел бы разбить значения >5 так, чтобы уровни в таблице были: 0, 1, 2, 3, 4, 5, and >5.

Как я могу это сделать?

2 3

2 ответа:

Сначала нужно преобразовать вектор так, чтобы он имел уникальную запись для, затем вы можете добавить недостающие уровни в функции factor():

X <- c(1,2,3,4,3,9,20)
X <- ifelse(X>5,">5",X)
X <- factor(X,levels=c(0:5,">5"))

Это приводит к следующему:

X [1] 1 2 3 4 3 >5 >5 Уровни: 0 1 2 3 4 5 >5

Саша уже дал вам рабочий ответ, но для дальнейшего использования вы можете ознакомиться с функцией cut, которая предназначена для разбиения непрерывной переменной на куски.

x <- cut(x, c(-Inf, 0:5, Inf), labels=c(0:5, ">5"))