Как отсортировать один вектор на основе значений другого


у меня есть вектор x, который я хотел бы отсортировать на основе порядка значений в векторе y. два вектора не имеют одинаковой длины.

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

ожидаемый результат будет:

[1] 4 4 4 2 2 1 3 3 3
7 90

7 ответов:

вот один лайнер...

y[sort(order(y)[x])]

[edit:] это разбивается следующим образом:

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders

Как насчет этого

x[order(match(x,y))]

вы можете конвертировать x в упорядоченный фактор:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

очевидно, что изменение ваших чисел в факторы может радикально изменить способ, которым код вниз по течению реагирует на x. Но поскольку вы не дали нам никакого контекста о том, что произойдет дальше, я подумал, что предложу это как вариант.

Как насчет?:

rep(y,table(x)[as.character(y)])

(у Яна, наверное, еще лучше)

[ Edit: очевидно, Ян был правильный подход, но я оставлю это для потомков.]

вы можете сделать это без циклов путем индексирования на вашем векторе Y. Добавьте увеличивающееся числовое значение в y и объедините их:

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

в случае, если вам нужно получить заказ на "y" независимо от того, если это цифры или символы:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

по шагам:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

в результате в Z: 4 4 4 2 2 1 3 3 3

важные шаги:

  1. for (i в y) -- циклы над интересующими элементами.

  2. z

  3. rep(i, sum (x==i)) -- повторяет I(текущий элемент интереса) сумму (x==i) раз (количество раз, когда мы нашли i в x).