размещенный экземпляр BigQuery
Есть ли способ разместить большое программное обеспечение для запросов на сервере моей компании? Компания не хочет, чтобы данные были где-то еще, кроме собственного дата-центра.
Каковы альтернативы BigQuery? (облако, а также размещенные)
2 ответа:
Есть ли способ разместить большое программное обеспечение для запросов на сервере моей компании?
Google Big Query является реализацией документа Google Dremel Paper, но предлагается как услуга и не доступна в качестве программного обеспечения для установки в помещении.
Каковы альтернативы большого запроса? (облако, а также размещенные)
Apache Drill является реализацией вышеупомянутого Dremel, но только что начал и может занять некоторое время, чтобы материализовать.
Cloudera недавно анонсировала Imapala для запросов в реальном времени на Hadoop. Проверьте блог для получения более подробной информации.
было бы интересно узнать некоторые другие альтернативы для запросов в реальном времени на больших данных.
Edit : вот интересная статья изInfoWorld о том же.
Hive и Pig-два распространенных решения для создания запрашиваемой системы, но поскольку вы упомянули большой запрос Google, я предполагаю, что вы имеете в виду запросы в реальном времени.
В дополнение к решениям реального времени, упомянутым Правином, существуют некоторые обходные пути для ускорения других ориентированных на столбцы решений путем записи избыточных хранилищ нормализованным способом. Подумайте об этом следующим образом: вы можете "предварительно объединить" данные в семейство столбцов, если вы понимаете, что вы торгуете быстрым доступом против избыточный объем и более медленная скорость вставки.
- т.