Оператору ifelse заявление с несколькими условиями с помощью dplyr::мутации/мутации, если
Я хотел бы создать новую переменную, которая будет 1
, если любая из переменных из набора переменных является 1
или 0
в противном случае, используя функции dplyr::mutate
и base any
.
Набор данных:
df <- structure(list(ID = 1:2, METFORMIN = c(0L, 0L), SULPHONYLUREA = c(0L, 0L), MEGLITINIDE = c(0L, 0L), ACARBOSE = c(0L, 0L),
THIAZOLIDINEDIONE = c(0L, 0L), DPP4_INHIBITOR = c(0L, 0L), SGLT2_INHIBITOR = c(1L, 1L), GLP1_RA = c(0L, 0L)),
.Names = c("ID", "METFORMIN", "SULPHONYLUREA", "MEGLITINIDE", "ACARBOSE", "THIAZOLIDINEDIONE", "DPP4_INHIBITOR",
"SGLT2_INHIBITOR", "GLP1_RA"), class = "data.frame", row.names = c(NA, -2L))
Структура Данных:
# ID METFORMIN SULPHONYLUREA MEGLITINIDE ACARBOSE THIAZOLIDINEDIONE DPP4_INHIBITOR SGLT2_INHIBITOR GLP1_RA
# 1 0 0 0 0 0 0 1 0
# 2 0 0 0 0 0 0 1 0
Желаемая Структура Данных:
# ID METFORMIN SULPHONYLUREA MEGLITINIDE ACARBOSE THIAZOLIDINEDIONE DPP4_INHIBITOR SGLT2_INHIBITOR GLP1_RA ORALDM
# 1 0 0 0 0 0 0 1 0 1
# 2 0 0 0 0 0 0 1 0 1
Код 1:
df %>% mutate(ORALDM = if_else(any(METFORMIN:GLP1_RA) == 1, 1, 0))
Это не дает желаемого результата и приводит к ошибке:
Предупреждающие сообщения: 1: In Метформин: GLP1_RA: численное выражение имеет 2 элемента: только первый используемый 2: в метформине: GLP1_RA: численный выражение имеет 2 элемента: только первый используемый
Код 2:
df %>% mutate_if(predicate(any(METFORMIN:GLP1_RA) == 1), 1)
Это также дает ошибку:
Ошибка в предикате (any (METFORMIN: GLP1_RA) = = 1): не удалось найти функция "предикат"
1 ответ:
Продвижение моих комментариев к ответу. С:
df %>% mutate(ORALDM = +(rowSums(.[2:9]) > 0))
Или С (Если вы хотите использовать имена переменных):
df %>% mutate(ORALDM = +(rowSums(select(df, METFORMIN:GLP1_RA)) > 0))
Вы получаете:
ID METFORMIN SULPHONYLUREA MEGLITINIDE ACARBOSE THIAZOLIDINEDIONE DPP4_INHIBITOR SGLT2_INHIBITOR GLP1_RA ORALDM 1 1 0 0 0 0 0 0 1 0 1 2 2 0 0 0 0 0 0 1 0 1
Та же идея реализована с данными .таблица :
library(data.table) dt <- setDT(copy(df)) dt[, ORALDM := +(rowSums(.SD) > 0), .SDcols = METFORMIN:GLP1_RA][]
Примечание: вместо того, чтобы использовать
+
, вы также можете использоватьas.integer
иas.numeric
.