missing-data

У меня есть следующий пример: import numpy as np import pandas as pd idx1 = pd.period_range('2015-01-01', freq='10T', periods=1000) idx2 = pd.period_range('2016-01-01', freq='10T', periods=1000) df1 = pd.DataFrame(np.random.randn(1000), index=idx1, columns=['A']) df2 = pd.DataFrame(np...

На этот вопрос уже есть ответ здесь: удалите строки со всеми или некоторыми NAs (пропущенными значениями) в данных.каркас 15 ответов У меня есть такой фрейм данных col_1 col_2 col_3 col_4 12344 53445 34335 AAA 1254...

Я хотел бы приписать значения для наблюдений NA в начале массива, используя линейную аппроксимацию следующих двух не-NA наблюдений для экстраполяции отсутствующего значения. Затем проделайте то же самое для наблюдений NA в конце массива, используя предыдущие два наблюдения, не относящиеся к NA. Воспроизводи...

Я видел много вопросов, которые касаются этой темы, но пока не нашел ответа. Если я пропустил вопрос, который действительно отвечает на этот вопрос, пожалуйста, отметьте это и укажите нам на вопрос. Сценарий: у нас есть эталонный набор данных, у нас есть методы вменения, мы систематически удаляем значения и...

Я хотел бы добавить случайный NA к данным.фрейм в R. до сих пор я рассматривал эти вопросы: R: произвольно вставить NAs в кадр данных пропорционально Как добавить случайные NAs в кадр данных Добавление случайных пропущенных значений в полный фрейм данных (в R) Здесь было представлено много решений,...

Из help("NA"): Существуют также константы NA_integer_, NA_real_, NA_complex_ и NA_character_ других атомарных векторных типов, которые поддерживают отсутствующие значения: все это зарезервированные слова в языке R. Мой вопрос в том, почему нет NA_logical_ или подобного, и что с этим делать. В част...

Я хотел бы сделать следующее: Объедините в фрейм данных два вектора, которые имеют разную длину содержат последовательности, найденные также в другом векторе содержат последовательности, не найденные в другом векторе Последовательности, которые не найдены в другом векторе, никогда не длиннее 3 элемент...

Мне нужно заменить недостающие значения в поле " шаги "медианой" шагов", вычисленной за этот конкретный день (группа по" дате"), с удаленными значениями NA. Я уже ссылался на этот Поток , но мои значения NA не заменяются. Может кто-нибудь помочь мне выяснить, где я ошибаюсь? Я бы предпочел использовать базов...

Я хотел бы соответствовать случайной модели леса, но когда я звоню library(randomForest) cars$speed[1] <- NA # to simulate missing value model <- randomForest(speed ~., data=cars) Я получаю следующую ошибку Error in na.fail.default(list(speed = c(NA, 4, 7, 7, 8, 9, 10, 10, 10, : missing values ...

вот небольшой фрагмент кода, который я написал, чтобы сообщить переменные с пропущенными значениями из фрейма данных. Я пытаюсь придумать более элегантный способ сделать это, что, возможно, возвращает данные.кадр, но я застрял: for (Var in names(airquality)) { missing <- sum(is.na(airquality[,Var])) ...