Параллельное производство электроэнергии в Эрланге?
Есть много примеров реализаций генерации набора powerset в Java, Python и других, но я до сих пор не могу понять, как работает реальный алгоритм.
Каковы шаги, предпринятые алгоритмом для генерации набора мощности P (S) набора S?
(например, набор мощности {1,2,3,4} равен {{}, {1}, {2}, {1,2}, {3}, {1,3}, {2,3}, {1,2,3}, {4}, {1,4}, {2,4}, {1,2,4}, {3,4}, {1,3,4}, {2,3,4}, {1,2,3,4}}.)
UPD: я нашел это объяснение, но все равно я его не понимаю. Я пытаюсь понять алгоритм генерации набора мощности, потому что хотел бы написать его параллельную реализацию - следующая последовательная реализация Erlang имеет огромный стек и не может насчитывать более 30 элементов, установленных на машине с 8 ГБ ОЗУ:
powerset(Lst) ->
N = length(Lst),
Max = trunc(math:pow(2,N)),
[[lists:nth(Pos+1,Lst) || Pos <- lists:seq(0,N-1), I band (1 bsl Pos) =/= 0] || I <- lists:seq(0,Max-1)].
UPD2:
Этот фрагмент возвращает все подмножества множества [a, b, c], кроме [a, b, c]:
generate_all_subsets([],Full_list,Result) ->
Result;
generate_all_subsets([Element|Rest_of_list],Full_list,Result) ->
Filtered_list = [X || X <- Full_list, X =/= Element],
?DBG("*Current accumulated result: ~w ~n", [Result]),
Result2 = generate_subsets(Element,Filtered_list,[],[]),
?DBG("Generated new result: ~w ~n", [Result2]),
New_result = lists:append(Result,Result2),
?DBG("Got new accumulated result: ~w ~n", [New_result]),
generate_all_subsets(Rest_of_list,Full_list,New_result).
generate_subsets(Main_element,[],Accumulated_list,Result) ->
Result;
generate_subsets(Main_element,[Element|Rest_of_set],Accumulated_list,Result) ->
?DBG("*Generating a subset for ~w ~n", [Main_element]),
New_accumulated_list = lists:flatten([Element|Accumulated_list]),
New_result = [New_accumulated_list|Result],
?DBG("Added ~w to the result: ~w ~n", [New_accumulated_list,New_result]),
generate_subsets(Main_element,Rest_of_set,New_accumulated_list,New_result).
Я не уверен, что этот фрагмент является правильный.
1 ответ:
Вот довольно простая версия, которая работает намного лучше, чем версия из rosettacode:
generate([]) -> [[]]; generate([H|T]) -> PT = generate(T), [ [H|X] || X <- PT ] ++ PT.
Если вы хотите еще более высокую производительность, вы можете попробовать это:
generate([]) -> [[]]; generate([H|T]) -> PT = generate(T), generate(H, PT, PT). generate(_, [], Acc) -> Acc; generate(X, [H|T], Acc) -> generate(X, T, [[X|H]|Acc]).
Но в любом случае я сомневаюсь, что вы сможете построить powerset из набора 30 элементов. По моим расчетам, он может потреблять более 16 ГБ. В моей второй версии может быть некоторое повторное использование списков хвостов, но это не поможет достаточно. Я думаю, что вы можете даже не решить большую проблему, если вы будете реализовывать ее как параллельную алгоритм, потому что будет копирование сообщений.