Наиболее эффективный способ создания InputStream из OutputStream


эта страница:http://blog.ostermiller.org/convert-java-outputstream-inputstream описывает, как создать InputStream из OutputStream:

new ByteArrayInputStream(out.toByteArray())

другие альтернативы-использовать PipedStreams и новые потоки, что является громоздким.

мне не нравится идея копирования многих мегабайт в новый массив байтов в памяти. Есть ли библиотека, которая делает это более эффективно?

EDIT:

по совету Лоуренса Гонсалвеса, я попробовал PipedStreams и оказалось, что с ними не так уж сложно справиться. Вот пример кода в clojure:

(defn #^PipedInputStream create-pdf-stream [pdf-info]
  (let [in-stream (new PipedInputStream)
        out-stream (PipedOutputStream. in-stream)]
    (.start (Thread. #(;Here you write into out-stream)))
    in-stream))
5 77

5 ответов:

Если вы не хотите копировать все данные в буфер в памяти сразу, то вам придется иметь свой код, который использует OutputStream (производитель) и код, который использует InputStream (потребитель) либо чередуются в одном потоке, либо работают одновременно в двух отдельных потоках. Наличие их работы в одном потоке, вероятно, намного сложнее, чем использование двух отдельных потоков, гораздо более подвержено ошибкам (вам нужно будет убедиться, что потребитель никогда блоки, ожидающие ввода, или вы будете эффективно тупик) и потребовали бы, чтобы производитель и потребитель работали в одном цикле, который кажется слишком тесно связанным.

Так что используйте второй поток. Это действительно не так сложно. Страница, на которую вы ссылались, имела прекрасный пример:

  PipedInputStream in = new PipedInputStream();
  PipedOutputStream out = new PipedOutputStream(in);
  new Thread(
    new Runnable(){
      public void run(){
        class1.putDataOnOutputStream(out);
      }
    }
  ).start();
  class2.processDataFromInputStream(in);

есть еще одна библиотека с открытым исходным кодом под названием EasyStream это касается труб и резьбы прозрачным способом. Это не очень сложно, если все идет хорошо. Проблемы возникают, когда (глядя на пример Лоуренса Гонсалвеса)

класс1.putDataOnOutputStream (out);

выдает исключение. В этом примере поток просто завершается и исключение теряется, в то время как внешний InputStream может быть усеченный.

Easystream занимается распространением исключений и другими неприятными проблемами, которые я отлаживал около года. (Я хранитель библиотеки: очевидно, что мое решение является лучшим ;) ) Вот пример того, как его использовать:

final InputStreamFromOutputStream<String> isos = new InputStreamFromOutputStream<String>(){
 @Override
 public String produce(final OutputStream dataSink) throws Exception {
   /*
    * call your application function who produces the data here
    * WARNING: we're in another thread here, so this method shouldn't 
    * write any class field or make assumptions on the state of the outer class. 
    */
   return produceMydata(dataSink)
 }
};

есть введение где объясняются все другие способы преобразования OutputStream в InputStream. Стоит посмотреть.

простое решение, которое позволяет избежать копирования буфера является создание специального назначения ByteArrayOutputStream:

public class CopyStream extends ByteArrayOutputStream {
    public CopyStream(int size) { super(size); }

    /**
     * Get an input stream based on the contents of this output stream.
     * Do not use the output stream after calling this method.
     * @return an {@link InputStream}
     */
    public InputStream toInputStream() {
        return new ByteArrayInputStream(this.buf, 0, this.count);
    }
}

запись в указанный выше выходной поток по мере необходимости, а затем вызов toInputStream для получения входного потока через базовый буфер. Считайте выходной поток закрытым после этой точки.

Я думаю, что лучший способ подключить InputStream к OutputStream-это через piped streams - доступно в java.io пакет, как следует:

// 1- Define stream buffer
private static final int PIPE_BUFFER = 2048;

// 2 -Create PipedInputStream with the buffer
public PipedInputStream inPipe = new PipedInputStream(PIPE_BUFFER);

// 3 -Create PipedOutputStream and bound it to the PipedInputStream object
public PipedOutputStream outPipe = new PipedOutputStream(inPipe);

// 4- PipedOutputStream is an OutputStream, So you can write data to it
// in any way suitable to your data. for example:
while (Condition) {
     outPipe.write(mByte);
}

/*Congratulations:D. Step 4 will write data to the PipedOutputStream
which is bound to the PipedInputStream so after filling the buffer
this data is available in the inPipe Object. Start reading it to
clear the buffer to be filled again by the PipedInputStream object.*/

на мой взгляд есть два основных преимущества для Этот код:

1-нет никакого дополнительного потребления памяти, кроме буфера.

2 - Вам не нужно обрабатывать очереди данных вручную

Я обычно стараюсь избегать создания отдельного потока из-за повышенной вероятности взаимоблокировки, повышенной сложности понимания кода и проблем, связанных с исключениями.

вот мое предлагаемое решение: ProducerInputStream, который создает контент в кусках повторными вызовами produceChunk ():

public abstract class ProducerInputStream extends InputStream {

    private ByteArrayInputStream bin = new ByteArrayInputStream(new byte[0]);
    private ByteArrayOutputStream bout = new ByteArrayOutputStream();

    @Override
    public int read() throws IOException {
        int result = bin.read();
        while ((result == -1) && newChunk()) {
            result = bin.read();
        }
        return result;
    }

    @Override
    public int read(byte[] b, int off, int len) throws IOException {
        int result = bin.read(b, off, len);
        while ((result == -1) && newChunk()) {
            result = bin.read(b, off, len);
        }
        return result;
    }

    private boolean newChunk() {
        bout.reset();
        produceChunk(bout);
        bin = new ByteArrayInputStream(bout.toByteArray());
        return (bout.size() > 0);
    }

    public abstract void produceChunk(OutputStream out);

}