Как получить доверительный интервал или меру дисперсии прогноза при использовании xgboost для классификации?


Как получить доверительный интервал или меру дисперсии прогноза при использовании xgboost для классификации?

Так, например, если xgboost предсказывает вероятность события равную 0.9, то как можно получить уверенность в этой вероятности?

Также предполагается, что эта уверенность гетероскедастична?

1 3

1 ответ:

Для получения доверительных интервалов для модели xgboost необходимо обучить несколько моделей (для этого можно использовать бэггинг). Каждая модель даст ответ для тестовой выборки-все ответы сформируют распределение, из которого можно легко вычислить доверительные интервалы, используя базовую статистику. Вы должны создать распределение ответов для каждого тестового образца.