размещенный экземпляр BigQuery


Есть ли способ разместить большое программное обеспечение для запросов на сервере моей компании? Компания не хочет, чтобы данные были где-то еще, кроме собственного дата-центра.

Каковы альтернативы BigQuery? (облако, а также размещенные)

2 3

2 ответа:

Есть ли способ разместить большое программное обеспечение для запросов на сервере моей компании?

Google Big Query является реализацией документа Google Dremel Paper, но предлагается как услуга и не доступна в качестве программного обеспечения для установки в помещении.

Каковы альтернативы большого запроса? (облако, а также размещенные)

Apache Drill является реализацией вышеупомянутого Dremel, но только что начал и может занять некоторое время, чтобы материализовать.

Cloudera недавно анонсировала Imapala для запросов в реальном времени на Hadoop. Проверьте блог для получения более подробной информации.

было бы интересно узнать некоторые другие альтернативы для запросов в реальном времени на больших данных.

Edit : вот интересная статья изInfoWorld о том же.

Hive и Pig-два распространенных решения для создания запрашиваемой системы, но поскольку вы упомянули большой запрос Google, я предполагаю, что вы имеете в виду запросы в реальном времени.

В дополнение к решениям реального времени, упомянутым Правином, существуют некоторые обходные пути для ускорения других ориентированных на столбцы решений путем записи избыточных хранилищ нормализованным способом. Подумайте об этом следующим образом: вы можете "предварительно объединить" данные в семейство столбцов, если вы понимаете, что вы торгуете быстрым доступом против избыточный объем и более медленная скорость вставки.

- т.