Построение оценок PCA с помощью цвета


Я делаю PCA и хотел бы построить первый главный компонент против второго в R:

pca<-princomp(~.,data=data, na.action=na.omit
plot(pca$scores[,1],pca$scores[,2])

Или, возможно, несколько основных компонентов:

pairs(pca$scores[,1:4])

Однако точки черные. Как правильно добавить цвет к графикам? Сколько цветов мне нужно? По одному для каждого основного компонента, который я строю? Или по одной для каждой строки в моей матрице данных?

Спасибо

Правка:

Мои данные выглядят так:

> data[1:4,1:4]
                          patient1                     patient2                     patient3                     patient4
2'-PDE                    0.0153750                    0.4669375                   -0.0295625                    0.7919375
7A5                       2.4105000                    0.3635000                    1.8550000                    1.4080000
A1BG                      0.9493333                    0.2798333                    0.7486667                    0.7500000
A2M                       0.2420000                    1.0385000                    1.1605000                    1.6777500

Так будет ли это уместно:

plot(pca$scores[,1:4], pch=20, col=rainbow(dim(data)[1]))
1 3
pca

1 ответ:

Вот некоторые примеры графиков СПС. Взято из здесь .

z1 <- rnorm(10000, mean=1, sd=1); z2 <- rnorm(10000, mean=3, sd=3); z3 <- rnorm(10000, mean=5, sd=5); z4 <- rnorm(10000, mean=7, sd=7); z5 <- rnorm(10000, mean=9, sd=9); mydata <- matrix(c(z1, z2, z3, z4, z5), 2500, 20, byrow=T, dimnames=list(paste("R", 1:2500, sep=""), paste("C", 1:20, sep=""))) 

summary(pca) 
summary(pca)$importance[, 1:6] 

x11(height=6, width=12, pointsize=12); par(mfrow=c(1,2)) 

mycolors <- c("red", "green", "blue", "magenta", "black") # Define plotting colors. plot(pca$x, pch=20, col=mycolors[sort(rep(1:5, 500))]) 

plot(pca$x, type="n"); text(pca$x, rownames(pca$x), cex=0.8, col=mycolors[sort(rep(1:5, 500))]) 

Вы можете использовать пары

pairs(pca$x[,1:5], col = mycolors) 

Строит диаграмму рассеяния для первых двух главных компонент плюс соответствующие собственные векторы, которые хранятся в PCA$rotation.

library(scatterplot3d) 
scatterplot3d(pca$x[,1:3], pch=20, color=mycolors[sort(rep(1:5, 500))]) 

То же, что и выше, но строит первые три главных компонента в трехмерной диаграмме рассеяния.

library(rgl); rgl.open(); offset <- 50; par3d(windowRect=c(offset, offset, 640+offset, 640+offset)); rm(offset); rgl.clear(); rgl.viewpoint(theta=45, phi=30, fov=60, zoom=1); spheres3d(pca$x[,1], pca$x[,2], pca$x[,3], radius=0.3, color=mycolors, alpha=1, shininess=20); aspect3d(1, 1, 1); axes3d(col='black'); title3d("", "", "PC1", "PC2", "PC3", col='black'); bg3d("

В дальнейшем создается интерактивная 3D точечная диаграмма с открытым GL. Для этого необходимо установить библиотеку rgl. Спасать снимок графика можно сделать с помощью команды rgl.снимок ("тест.формат PNG").

require(GGally)
ggpairs(pca$x[,1:5])