mapreduce
какие сценарии оправдывают использование " карта и уменьшить"? есть ли .NET реализация этого алгоритма? ...
одним из основных примеров, который используется для демонстрации силы MapReduce является terasort benchmark. У меня возникли проблемы с пониманием основ алгоритма сортировки, используемого в среде MapReduce. для меня сортировка просто включает в себя определение относительного положения элемента по отноше...
в карту уменьшить Программирование сократить этап перебирание, сортировка и сокращения по частям. Сортировка-дело дорогостоящее. что цель тасовать и сортировать участок в редукторе в карте уменьшает программировать?...
Я много слышу о map / reduce, особенно в контексте массово параллельной вычислительной системы Google. Что именно это такое?...
в mapreduce каждая задача reduce записывает свои выходные данные в файл с именем part-r-nnnnn здесь nnnnn - идентификатор раздела, связанный с задачей сокращения. Делает map / reduce объединить эти файлы? Если да, то как?...
Я использую Tomcat 7 в Eclipse на Windows. При запуске Tomcat, я получаю следующее информационное сообщение: Apr на основе Apache Tomcat родной библиотеки, которая позволяет оптимальную производительность в производственных средах не был найден на java.библиотека.путь Что это значит и как я могу предост...
при использовании MongoDB $in предложение, Всегда ли порядок возвращаемых документов соответствует порядку аргумента массива?...
в Hadoop v1 я назначил каждый слот 7 mapper и reducer размером 1 ГБ, мои mappers & reducers работают нормально. Моя машина имеет память 8G, процессор 8. Теперь с YARN, при запуске того же приложения на той же машине, я получил ошибку контейнера. По умолчанию у меня есть такие настройки: <property&...
Я обычно работаю с текстовыми файлами размером ~20 Гб, и я очень часто считаю количество строк в данном файле. то, как я делаю это сейчас, это просто cat fname | wc -l, а это занимает очень много времени. Есть ли решение, которое было бы намного быстрее? Я работаю в высокопроизводительном кластере с устано...
У меня есть большой CSV-файл, содержащий список магазинов, в котором одно из полей является ZipCode. У меня есть отдельная база данных MongoDB под названием ZipCodes, в которой хранятся широта и долгота для любого заданного почтового индекса. в SQL Server я бы выполнил хранимую процедуру InsertStore, которая...