data-manipulation

Я хотел бы создать новую переменную, которая будет 1, если любая из переменных из набора переменных является 1 или 0 в противном случае, используя функции dplyr::mutate и base any. Набор данных: df <- structure(list(ID = 1:2, METFORMIN = c(0L, 0L), SULPHONYLUREA = c(0L, 0L), MEGLITINIDE = c(0L, 0L), A...

Я работаю с python. Я пытаюсь разбить набор данных на 1000 диапазонов элементов и найти среднее значение, включая сайты, которые не представлены как 0.0. Ниже приведен пример этих данных. X 2699528 0.000786782 X 2699555 0.493415 X 2699559 0.000786782 X 2699625 0.0748873 X 2699645 0.0712507 X 2699...

Как получить данные из этой формы (длинное представление данных): import pandas as pd df = pd.DataFrame({ 'c0': ['A','A','B'], 'c1': ['b','c','d'], 'c2': [1, 3,4]}) print(df) Выход: c0 c1 c2 0 A b 1 2 A c 3 3 B d 4 К этой форме: c0 c1 c2 0 A b 1 2 A c 3 3 A ...

Уважаемые эксперты по пандам силы: Я пытаюсь реализовать функцию для выравнивания столбца фрейма данных, который имеет элемент типа list, я хочу, чтобы для каждой строки фрейма данных, где столбец имеет элемент типа list, все столбцы, кроме указанного столбца, подлежащего выравниванию, были продублированы, ...

Я видел много вопросов, которые касаются этой темы, но пока не нашел ответа. Если я пропустил вопрос, который действительно отвечает на этот вопрос, пожалуйста, отметьте это и укажите нам на вопрос. Сценарий: у нас есть эталонный набор данных, у нас есть методы вменения, мы систематически удаляем значения и...

Все, Я надеялся, что кто-то сможет найти решение моей проблемы, которая не обязательно вызывает головную боль, но, на данный момент, предполагает возможность человеческой ошибки при создании набора данных для проекта, над которым я работаю. Набор данных, который я использую сейчас, представляет собой напра...

У меня есть такой фрейм данных: A B Ind 1 10 8 1 2 9 10 2 3 7 1 2 4 19 20 1 5 . . . Как я могу суммировать столбцы на основе значения Ind? If Ind==1, sum from column A, if Ind==2, sum from column B. Например, выходные данные для первых 4 строк должны быть 10+10+1+19=3...

Использование набора данных biofam, входящего в состав TraMineR: library(TraMineR) data(biofam) lab <- c("P","L","M","LM","C","LC","LMC","D") biofam.seq <- seqdef(biofam[,10:25], states=lab) head(biofam.seq) Sequence 1167 P-P-P-P-P-P-P-P-P-LM-LMC-LMC-LMC-LMC-LM...

дан массив n объекты, скажем, это массив строк, и имеет следующие значения: foo[0] = "a"; foo[1] = "cc"; foo[2] = "a"; foo[3] = "dd"; что мне нужно сделать, чтобы удалить / удалить все строки / объекты, равные "а" в массиве?...