Объединить два списка в R


у меня есть два списка

first = list(a = 1, b = 2, c = 3)
second = list(a = 2, b = 3, c = 4)

Я хочу, чтобы объединить эти два списка, так что конечный продукт

$a
[1] 1 2

$b
[1] 2 3

$c
[1] 3 4

есть простая функция для этого?

6 68

6 ответов:

если списки всегда имеют ту же структуру, что и в Примере, то более простым решением является

mapply(c, first, second, SIMPLIFY=FALSE)

Это очень простая адаптация функции modifyList от Sarkar. Поскольку он рекурсивен, он будет обрабатывать более сложные ситуации, чем mapply будет, и он будет обрабатывать несоответствующие ситуации с именами, игнорируя элементы во "втором", которые не находятся в "первом".

appendList <- function (x, val) 
{
    stopifnot(is.list(x), is.list(val))
    xnames <- names(x)
    for (v in names(val)) {
        x[[v]] <- if (v %in% xnames && is.list(x[[v]]) && is.list(val[[v]])) 
            appendList(x[[v]], val[[v]])
        else c(x[[v]], val[[v]])
    }
    x
}

> appendList(first,second)
$a
[1] 1 2

$b
[1] 2 3

$c
[1] 3 4

вот два варианта, первый:

both <- list(first, second)
n <- unique(unlist(lapply(both, names)))
names(n) <- n
lapply(n, function(ni) unlist(lapply(both, `[[`, ni)))

и второй, который работает, только если они имеют одинаковую структуру:

apply(cbind(first, second),1,function(x) unname(unlist(x)))

оба дают желаемый результат.

вот некоторый код, который я закончил писать, основываясь на ответе @Andrei, но без элегантности/простоты. Преимущество заключается в том, что он позволяет более сложное рекурсивное слияние, а также отличается между элементами, которые должны быть связаны с rbind и те, которые связаны с c:

# Decided to move this outside the mapply, not sure this is 
# that important for speed but I imagine redefining the function
# might be somewhat time-consuming
mergeLists_internal <- function(o_element, n_element){
  if (is.list(n_element)){
    # Fill in non-existant element with NA elements
    if (length(n_element) != length(o_element)){
      n_unique <- names(n_element)[! names(n_element) %in% names(o_element)]
      if (length(n_unique) > 0){
        for (n in n_unique){
          if (is.matrix(n_element[[n]])){
            o_element[[n]] <- matrix(NA, 
                                     nrow=nrow(n_element[[n]]), 
                                     ncol=ncol(n_element[[n]]))
          }else{
            o_element[[n]] <- rep(NA, 
                                  times=length(n_element[[n]]))
          }
        }
      }

      o_unique <- names(o_element)[! names(o_element) %in% names(n_element)]
      if (length(o_unique) > 0){
        for (n in o_unique){
          if (is.matrix(n_element[[n]])){
            n_element[[n]] <- matrix(NA, 
                                     nrow=nrow(o_element[[n]]), 
                                     ncol=ncol(o_element[[n]]))
          }else{
            n_element[[n]] <- rep(NA, 
                                  times=length(o_element[[n]]))
          }
        }
      }
    }  

    # Now merge the two lists
    return(mergeLists(o_element, 
                      n_element))

  }
  if(length(n_element)>1){
    new_cols <- ifelse(is.matrix(n_element), ncol(n_element), length(n_element))
    old_cols <- ifelse(is.matrix(o_element), ncol(o_element), length(o_element))
    if (new_cols != old_cols)
      stop("Your length doesn't match on the elements,",
           " new element (", new_cols , ") !=",
           " old element (", old_cols , ")")
  }

  return(rbind(o_element, 
               n_element, 
               deparse.level=0))
  return(c(o_element, 
           n_element))
}
mergeLists <- function(old, new){
  if (is.null(old))
    return (new)

  m <- mapply(mergeLists_internal, old, new, SIMPLIFY=FALSE)
  return(m)
}

вот мой пример:

v1 <- list("a"=c(1,2), b="test 1", sublist=list(one=20:21, two=21:22))
v2 <- list("a"=c(3,4), b="test 2", sublist=list(one=10:11, two=11:12, three=1:2))
mergeLists(v1, v2)

в результате:

$a
     [,1] [,2]
[1,]    1    2
[2,]    3    4

$b
[1] "test 1" "test 2"

$sublist
$sublist$one
     [,1] [,2]
[1,]   20   21
[2,]   10   11

$sublist$two
     [,1] [,2]
[1,]   21   22
[2,]   11   12

$sublist$three
     [,1] [,2]
[1,]   NA   NA
[2,]    1    2

Да, я знаю - возможно, не самое логичное слияние, но у меня есть комплекс параллельных цикл, который я должен был создать более настраиваемый .combine функции для, и поэтому я написал этот монстр :-)

list3 <- append(list1, list2) также будет работать

В общем можно,

merge_list <- function(...) by(v<-unlist(c(...)),names(v),base::c)

отметим, что by() решение возвращает attribute D список, так что он будет печатать по-другому, но все равно будет список. Но вы можете избавиться от атрибутов с attr(x,"_attribute.name_")<-NULL. Вы, вероятно, также можете использовать aggregate().