Что такое функторы C++ и их использование?
Я постоянно слышу много о функторах в C++. Может ли кто-нибудь дать мне обзор того, что это такое и в каких случаях они могут быть полезны?
15 ответов:
Функтор-это в значительной степени просто класс, который определяет оператор(). Это позволяет создавать объекты, которые "выглядят как" функция:
// this is a functor struct add_x { add_x(int x) : x(x) {} int operator()(int y) const { return x + y; } private: int x; }; // Now you can use it like this: add_x add42(42); // create an instance of the functor class int i = add42(8); // and "call" it assert(i == 50); // and it added 42 to its argument std::vector<int> in; // assume this contains a bunch of values) std::vector<int> out(in.size()); // Pass a functor to std::transform, which calls the functor on every element // in the input sequence, and stores the result to the output sequence std::transform(in.begin(), in.end(), out.begin(), add_x(1)); assert(out[i] == in[i] + 1); // for all i
Есть пара приятных вещей о функторах. Во-первых, в отличие от обычных функций, они могут содержать состояние. Приведенный выше пример создает функцию, которая добавляет 42 к тому, что вы ей даете. Но это значение 42 не является жестко заданным, оно было указано в качестве аргумента конструктора, когда мы создавали наш экземпляр функтора. Я мог бы создать еще одну гадюку, которая добавила 27, просто вызывая конструктор с другим значением. Это делает их хорошо настраиваемыми.
Как показывают последние строки, вы часто передаете функторы в качестве аргументов другим функциям, таким как std::transform или другие алгоритмы стандартной библиотеки. Вы можете сделать то же самое с обычным указателем функции, за исключением того, что, как я сказал выше, функторы могут быть "настроены", потому что они содержат состояние, что делает их более гибкими (если бы я хотел использовать указатель функции, мне пришлось бы написать функцию, которая добавила бы ровно 1 к его аргументу. Функтор является общим и добавляет все, с чем вы его инициализировали), и они также потенциально более эффективны. В приведенном выше примере компилятор точно знает, какую функцию
std::transform
следует вызвать. Он должен вызватьadd_x::operator()
. Это означает, что он может встроить этот вызов функции. И это делает его столь же эффективным,как если бы я вручную вызвал функцию для каждого значения вектора.Если бы я передал вместо этого указатель на функцию, компилятор не смог бы сразу увидеть, какой именно функция, на которую он указывает, поэтому, если он не выполняет некоторые довольно сложные глобальные оптимизации, ему придется разыменовать указатель во время выполнения, а затем выполнить вызов.
Небольшое дополнение. Вы можете использовать
boost::function
, чтобы создать функторы из функций и методов, например:class Foo { public: void operator () (int i) { printf("Foo %d", i); } }; void Bar(int i) { printf("Bar %d", i); } Foo foo; boost::function<void (int)> f(foo);//wrap functor f(1);//prints "Foo 1" boost::function<void (int)> b(&Bar);//wrap normal function b(1);//prints "Bar 1"
И вы можете использовать boost:: bind, чтобы добавить состояние к этому функтору
boost::function<void ()> f1 = boost::bind(foo, 2); f1();//no more argument, function argument stored in f1 //and this print "Foo 2" (: //and normal function boost::function<void ()> b1 = boost::bind(&Bar, 2); b1();// print "Bar 2"
И самое полезное, с boost:: bind и boost:: function вы можете создать функтор из метода класса, на самом деле это делегат:
class SomeClass { std::string state_; public: SomeClass(const char* s) : state_(s) {} void method( std::string param ) { std::cout << state_ << param << std::endl; } }; SomeClass *inst = new SomeClass("Hi, i am "); boost::function< void (std::string) > callback; callback = boost::bind(&SomeClass::method, inst, _1);//create delegate //_1 is a placeholder it holds plase for parameter callback("useless");//prints "Hi, i am useless"
Вы можете создать список или вектор функторов
std::list< boost::function<void (EventArg e)> > events; //add some events .... //call them std::for_each( events.begin(), events.end(), boost::bind( boost::apply<void>(), _1, e));
Есть одна проблема со всем этим, сообщения об ошибках компилятора не читаются человеком :)
Функтор-это объект, который действует как функция. В основном, класс, который определяет
operator()
.Реальное преимущество состоит в том, что функтор может удерживать состояние.class MyFunctor { public: int operator()(int x) { return x * 2;} } MyFunctor doubler; int x = doubler(5);
class Matcher { int target; public: Matcher(int m) : target(m) {} bool operator()(int x) { return x == target;} } Matcher Is5(5); if (Is5(n)) // same as if (n == 5) { ....}
Название "функтор" традиционно использовалось втеории категорий задолго до появления на сцене C++. Это не имеет ничего общего с концепцией функтора C++. Лучше использовать name function object вместо того, что мы называем "функтором" в C++. Именно так другие языки программирования называют подобные конструкции.
Используется вместо простой функции:
Особенности:
- объект функции может иметь состояние
- объект функции вписывается в ООП (он ведет себя как любой другой объект).
Минусы:
- вносит в программу дополнительную сложность.
Используется вместо указателя функции:
Особенности:
- объект функции часто может быть встроен
Минусы:
- объект функции не может быть заменен другим типом объекта функции во время выполнения (по крайней мере, если он не расширяет некоторый базовый класс, что, следовательно, дает некоторые накладные расходы)
Используется вместо виртуального функция:
Особенности:
- объект функции (невиртуальный) не требует диспетчеризации vtable и runtime, поэтому в большинстве случаев он более эффективен
Минусы:
- объект функции не может быть заменен другим типом объекта функции во время выполнения (по крайней мере, если он не расширяет некоторый базовый класс, что, следовательно, дает некоторые накладные расходы)
Как уже упоминалось, функтор-это объект, который действует как функция, то есть он перегружает оператор вызова функции.
Функторы обычно используются в алгоритмах STL. Они полезны, потому что могут удерживать состояние до и между вызовами функций, как замыкание в функциональных языках. Например, можно определить функторMultiplyBy
, который умножает свой аргумент на заданную величину:class MultiplyBy { private: int factor; public: MultiplyBy(int x) : factor(x) { } int operator () (int other) const { return factor * other; } };
Тогда вы можете передать объект
MultiplyBy
алгоритму, например std:: transform:Еще одно преимущество функтора перед указателем на функцию заключается в том, что вызов может быть встроен в большее число случаев. Если вы передали указатель на функциюint array[5] = {1, 2, 3, 4, 5}; std::transform(array, array + 5, array, MultiplyBy(3)); // Now, array is {3, 6, 9, 12, 15}
transform
, если толькоэтот вызов не был встроен и компилятор не знает, что вы всегда передаете ему одну и ту же функцию, он не может встроить вызов через указатель.
Для новичков, таких как я среди нас: после небольшого исследования я выяснил, что делает код, опубликованный джалфом.
Функтор-это класс или структурный объект, который может быть" вызван " как функция. Это стало возможным благодаря перегрузке() operator
.() operator
(Не знаю, как он называется) может принимать любое количество аргументов. Другие операторы принимают только два, т. е.+ operator
может принимать только два значения (по одному с каждой стороны оператора) и возвращать любое значение, для которого вы его перегружали. Вы можете вписать любое число аргументов внутри() operator
, что и придает ему гибкость.Чтобы создать функтор, сначала вы создаете свой класс. Затем вы создаете конструктор для класса с параметром по вашему выбору типа и имени. За этим в том же операторе следует список инициализаторов (который использует один оператор двоеточия, что я также был новичком), который создает объекты-члены класса с ранее объявленным параметром конструктору. Тогда
() operator
перегружается. Наконец-то ты объявите частные объекты класса или структуры, которые вы создали.Мой код (я нашел имена переменных jalf запутанными)
class myFunctor { public: /* myFunctor is the constructor. parameterVar is the parameter passed to the constructor. : is the initializer list operator. myObject is the private member object of the myFunctor class. parameterVar is passed to the () operator which takes it and adds it to myObject in the overloaded () operator function. */ myFunctor (int parameterVar) : myObject( parameterVar ) {} /* the "operator" word is a keyword which indicates this function is an overloaded operator function. The () following this just tells the compiler that () is the operator being overloaded. Following that is the parameter for the overloaded operator. This parameter is actually the argument "parameterVar" passed by the constructor we just wrote. The last part of this statement is the overloaded operators body which adds the parameter passed to the member object. */ int operator() (int myArgument) { return myObject + myArgument; } private: int myObject; //Our private member object. };
Если что-то из этого неточно или просто неправильно, не стесняйтесь поправлять меня!
Функтор-это функция более высокого порядка, которая применяет функцию к параметризованным(т. е. шаблонным) типам. Это обобщение функцииотображения более высокого порядка. Например, мы могли бы определить функтор для
std::vector
следующим образом:template<class F, class T, class U=decltype(std::declval<F>()(std::declval<T>()))> std::vector<U> fmap(F f, const std::vector<T>& vec) { std::vector<U> result; std::transform(vec.begin(), vec.end(), std::back_inserter(result), f); return result; }
Эта функция принимает
std::vector<T>
и возвращаетstd::vector<U>
, когда задана функцияF
, которая принимаетT
и возвращаетU
. Функтор не обязательно должен быть определен над типами контейнеров, он также может быть определен для любого шаблонного типа, в том числеstd::shared_ptr
:template<class F, class T, class U=decltype(std::declval<F>()(std::declval<T>()))> std::shared_ptr<U> fmap(F f, const std::shared_ptr<T>& p) { if (p == nullptr) return nullptr; else return std::shared_ptr<U>(new U(f(*p))); }
Вот простой пример, который преобразует тип в
double
:Существует два закона, которым должны следовать функторы. Первый-это закон тождества, который гласит, что если функтору дана функция тождества, то она должна быть такой же, как применение функции тождества к типу, то естьdouble to_double(int x) { return x; } std::shared_ptr<int> i(new int(3)); std::shared_ptr<double> d = fmap(to_double, i); std::vector<int> is = { 1, 2, 3 }; std::vector<double> ds = fmap(to_double, is);
fmap(identity, x)
должна быть такой же, какidentity(x)
:Следующий закон-закон композиции, который гласит, что если функтору задана композиция из двух функции, это должно быть то же самое, как применение функтора для первой функции, а затем снова для второй функции. Итак,struct identity_f { template<class T> T operator()(T x) const { return x; } }; identity_f identity = {}; std::vector<int> is = { 1, 2, 3 }; // These two statements should be equivalent. // is1 should equal is2 std::vector<int> is1 = fmap(identity, is); std::vector<int> is2 = identity(is);
fmap(std::bind(f, std::bind(g, _1)), x)
должно быть таким же, какfmap(f, fmap(g, x))
:double to_double(int x) { return x; } struct foo { double x; }; foo to_foo(double x) { foo r; r.x = x; return r; } std::vector<int> is = { 1, 2, 3 }; // These two statements should be equivalent. // is1 should equal is2 std::vector<foo> is1 = fmap(std::bind(to_foo, std::bind(to_double, _1)), is); std::vector<foo> is2 = fmap(to_foo, fmap(to_double, is));
Вот реальная ситуация, когда я был вынужден использовать функтор для решения моей проблемы:
У меня есть набор функций (скажем, 20 из них), и все они идентичны, за исключением того, что каждая вызывает другую конкретную функцию в 3 определенных точках.
Это невероятное расточительство и дублирование кода. Обычно я просто передаю указатель функции и просто вызываю его в 3 местах. (Таким образом, код должен появиться только один раз, а не двадцать раз.)
Но потом я понял, что в каждом дело в том, что конкретная функция требовала совершенно другого профиля параметров! Иногда 2 параметра, иногда 5 параметров и т. д.
Другим решением было бы иметь базовый класс, где конкретная функция является переопределенным методом в производном классе. Но действительно ли я хочу построить все это наследование только для того, чтобы передать указатель функции????
Решение: Итак, я сделал класс-оболочку ("функтор"), который может вызывать любые функции, которые мне нужны. Я настраиваю его заранее (с его параметрами и т. д.), а затем передаю его вместо указателя функции. Теперь вызываемый код может вызвать функтор, не зная, что происходит внутри. Он даже может позвонить несколько раз (мне нужно было позвонить 3 раза.)
Вот он-практический пример, где функтор оказался очевидным и простым решением,которое позволило мне уменьшить дублирование кода с 20 функций до 1.
Кроме используемых в обратном вызове, функторы C++ также могут помочь обеспечитьMatlab подходящий стиль доступа к классуmatrix . СуществуетПример .
Функторы используются в gtkmm для подключения некоторой кнопки GUI к фактической функции или методу C++.
Если вы используете библиотеку pthread, чтобы сделать ваше приложение многопоточным, функторы могут помочь вам.
Для запуска потока одним из аргументовpthread_create(..)
является указатель на функцию, которая будет выполняться в его собственном потоке.
Но есть одно неудобство. Этот указатель не может быть указателем на метод, если это не статический метод , или если вы не укажете его класс , напримерclass::method
. И еще одно, интерфейс вашего метода может быть только:void* method(void* something)
Таким образом, вы не можете запускать (простым очевидным способом) методы из вашего класса в потоке, не делая ничего лишнего.
Очень хороший способ работы с потоками в C++ - это создание собственного класса
Thread
. Если вы хотели запустить методы из классаMyClass
, я сделал следующее: преобразовал эти методы в производные классыFunctor
.Кроме того, класс
Thread
имеет этот метод:static void* startThread(void* arg)
Указатель на это метод будет использоваться в качестве аргумента для вызоваpthread_create(..)
. И то, чтоstartThread(..)
должно получить в arg, - этоvoid*
приведенная ссылка на экземпляр в куче любого производного классаFunctor
, который будет приведен обратно вFunctor*
при выполнении, а затем вызван его методомrun()
.
Чтобы добавить, я использовал объекты функций для подгонки существующего унаследованного метода к шаблону команд; (единственное место, где красота OO paradigm true OCP я чувствовал ); Также добавляя сюда соответствующий шаблон адаптера функции.
Предположим, что ваш метод имеет подпись:
int CTask::ThreeParameterTask(int par1, int par2, int par3)
Мы увидим, как мы можем приспособить его для шаблона команды - для этого, во-первых, вы должны написать адаптер функции-члена, чтобы он мог быть вызван как объект функции.
Примечание-это некрасиво, и может быть вы можете использовать помощников Boost bind и т. д. но если вы не можете или не хотите, это один из способов.
// a template class for converting a member function of the type int function(int,int,int) //to be called as a function object template<typename _Ret,typename _Class,typename _arg1,typename _arg2,typename _arg3> class mem_fun3_t { public: explicit mem_fun3_t(_Ret (_Class::*_Pm)(_arg1,_arg2,_arg3)) :m_Ptr(_Pm) //okay here we store the member function pointer for later use {} //this operator call comes from the bind method _Ret operator()(_Class *_P, _arg1 arg1, _arg2 arg2, _arg3 arg3) const { return ((_P->*m_Ptr)(arg1,arg2,arg3)); } private: _Ret (_Class::*m_Ptr)(_arg1,_arg2,_arg3);// method pointer signature };
Кроме того, нам нужен вспомогательный метод mem_fun3 для вышеуказанного класса, чтобы помочь в вызове.
template<typename _Ret,typename _Class,typename _arg1,typename _arg2,typename _arg3> mem_fun3_t<_Ret,_Class,_arg1,_arg2,_arg3> mem_fun3 ( _Ret (_Class::*_Pm) (_arg1,_arg2,_arg3) ) { return (mem_fun3_t<_Ret,_Class,_arg1,_arg2,_arg3>(_Pm));
}
Теперь, чтобы связать параметры, мы должны написать функцию связывания. Итак, вот оно:template<typename _Func,typename _Ptr,typename _arg1,typename _arg2,typename _arg3> class binder3 { public: //This is the constructor that does the binding part binder3(_Func fn,_Ptr ptr,_arg1 i,_arg2 j,_arg3 k) :m_ptr(ptr),m_fn(fn),m1(i),m2(j),m3(k){} //and this is the function object void operator()() const { m_fn(m_ptr,m1,m2,m3);//that calls the operator } private: _Ptr m_ptr; _Func m_fn; _arg1 m1; _arg2 m2; _arg3 m3; };
И вспомогательная функция для использования класса binder3-bind3:
//a helper function to call binder3 template <typename _Func, typename _P1,typename _arg1,typename _arg2,typename _arg3> binder3<_Func, _P1, _arg1, _arg2, _arg3> bind3(_Func func, _P1 p1,_arg1 i,_arg2 j,_arg3 k) { return binder3<_Func, _P1, _arg1, _arg2, _arg3> (func, p1,i,j,k); }
Теперь мы должны использовать это с классом команд; используйте следующее typedef:
typedef binder3<mem_fun3_t<int,T,int,int,int> ,T* ,int,int,int> F3; //and change the signature of the ctor //just to illustrate the usage with a method signature taking more than one parameter explicit Command(T* pObj,F3* p_method,long timeout,const char* key, long priority = PRIO_NORMAL ): m_objptr(pObj),m_timeout(timeout),m_key(key),m_value(priority),method1(0),method0(0), method(0) { method3 = p_method; }
Вот как вы это называете:
F3 f3 = PluginThreadPool::bind3( PluginThreadPool::mem_fun3( &CTask::ThreeParameterTask), task1,2122,23 );
Примечание: f3 (); вызовет метод task1 - > ThreeParameterTask(21,22,23);.
Как уже было сказано, функторы-это классы, которые можно рассматривать как функции (оператор перегрузки ()).
Они наиболее полезны в ситуациях, когда необходимо связать некоторые данные с повторными или отложенными вызовами функции.
Например, связанный список функторов может быть использован для реализации базовой синхронной сопрограммной системы с низкими накладными расходами, диспетчера задач или прерываемого анализа файлов. Примеры:
/* prints "this is a very simple and poorly used task queue" */ class Functor { public: std::string output; Functor(const std::string& out): output(out){} operator()() const { std::cout << output << " "; } }; int main(int argc, char **argv) { std::list<Functor> taskQueue; taskQueue.push_back(Functor("this")); taskQueue.push_back(Functor("is a")); taskQueue.push_back(Functor("very simple")); taskQueue.push_back(Functor("and poorly used")); taskQueue.push_back(Functor("task queue")); for(std::list<Functor>::iterator it = taskQueue.begin(); it != taskQueue.end(); ++it) { *it(); } return 0; } /* prints the value stored in "i", then asks you if you want to increment it */ int i; bool should_increment; int doSomeWork() { std::cout << "i = " << i << std::endl; std::cout << "increment? (enter the number 1 to increment, 0 otherwise" << std::endl; std::cin >> should_increment; return 2; } void doSensitiveWork() { ++i; should_increment = false; } class BaseCoroutine { public: BaseCoroutine(int stat): status(stat), waiting(false){} void operator()(){ status = perform(); } int getStatus() const { return status; } protected: int status; bool waiting; virtual int perform() = 0; bool await_status(BaseCoroutine& other, int stat, int change) { if(!waiting) { waiting = true; } if(other.getStatus() == stat) { status = change; waiting = false; } return !waiting; } } class MyCoroutine1: public BaseCoroutine { public: MyCoroutine1(BaseCoroutine& other): BaseCoroutine(1), partner(other){} protected: BaseCoroutine& partner; virtual int perform() { if(getStatus() == 1) return doSomeWork(); if(getStatus() == 2) { if(await_status(partner, 1)) return 1; else if(i == 100) return 0; else return 2; } } }; class MyCoroutine2: public BaseCoroutine { public: MyCoroutine2(bool& work_signal): BaseCoroutine(1), ready(work_signal) {} protected: bool& work_signal; virtual int perform() { if(i == 100) return 0; if(work_signal) { doSensitiveWork(); return 2; } return 1; } }; int main() { std::list<BaseCoroutine* > coroutineList; MyCoroutine2 *incrementer = new MyCoroutine2(should_increment); MyCoroutine1 *printer = new MyCoroutine1(incrementer); while(coroutineList.size()) { for(std::list<BaseCoroutine *>::iterator it = coroutineList.begin(); it != coroutineList.end(); ++it) { *it(); if(*it.getStatus() == 0) { coroutineList.erase(it); } } } delete printer; delete incrementer; return 0; }
Конечно, эти примеры не так уж полезны в самих себя. Они только показывают, как функторы могут быть полезны, сами функторы очень просты и негибки, и это делает их менее полезными, чем, например, то, что обеспечивает boost.
Большое преимущество реализации функций в качестве функторов состоит в том, что они могут поддерживать и повторно использовать состояние между вызовами. Например, многие алгоритмы динамического программирования, такие какалгоритм Вагнера-Фишера для вычислениярасстояния Левенштейна между строками, работают путем заполнения большой таблицы результатов. Очень неэффективно выделять эту таблицу каждый раз, когда вызывается функция, поэтому реализация функции в качестве функтора и превращение таблицы в переменную-член может значительно увеличить производительность. повышать производительность.
Ниже приведен пример реализации алгоритма Вагнера-Фишера в качестве функтора. Обратите внимание, как таблица выделяется в конструкторе, а затем повторно используется вoperator()
с изменением размера по мере необходимости.#include <string> #include <vector> #include <algorithm> template <typename T> T min3(const T& a, const T& b, const T& c) { return std::min(std::min(a, b), c); } class levenshtein_distance { mutable std::vector<std::vector<unsigned int> > matrix_; public: explicit levenshtein_distance(size_t initial_size = 8) : matrix_(initial_size, std::vector<unsigned int>(initial_size)) { } unsigned int operator()(const std::string& s, const std::string& t) const { const size_t m = s.size(); const size_t n = t.size(); // The distance between a string and the empty string is the string's length if (m == 0) { return n; } if (n == 0) { return m; } // Size the matrix as necessary if (matrix_.size() < m + 1) { matrix_.resize(m + 1, matrix_[0]); } if (matrix_[0].size() < n + 1) { for (auto& mat : matrix_) { mat.resize(n + 1); } } // The top row and left column are prefixes that can be reached by // insertions and deletions alone unsigned int i, j; for (i = 1; i <= m; ++i) { matrix_[i][0] = i; } for (j = 1; j <= n; ++j) { matrix_[0][j] = j; } // Fill in the rest of the matrix for (j = 1; j <= n; ++j) { for (i = 1; i <= m; ++i) { unsigned int substitution_cost = s[i - 1] == t[j - 1] ? 0 : 1; matrix_[i][j] = min3(matrix_[i - 1][j] + 1, // Deletion matrix_[i][j - 1] + 1, // Insertion matrix_[i - 1][j - 1] + substitution_cost); // Substitution } } return matrix_[m][n]; } };