Метод PDO::fetchAll и методом PDO::fetch в цикле


просто быстрый вопрос.

есть ли разница в производительности между использованием PDO::fetchAll() и PDO:: fetch() в цикле (для больших результирующих наборов)?

я извлекаю в объекты пользовательского класса, если это имеет какое-либо значение.

мое первоначальное необразованное предположение состояло в том, что fetchAll может быть быстрее, потому что PDO может выполнять несколько операций в одном операторе, в то время как mysql_query может выполнять только один. Однако у меня мало знаний в внутренняя работа и документация ничего не говорят об этом, и является ли fetchAll() просто циклом PHP-стороны, сброшенным в массив.

помочь?

7 64

7 ответов:

маленький тест с 200k случайных записей. Как и ожидалось, метод fetchAll работает быстрее, но требует больше памяти.

Result :
fetchAll : 0.35965991020203s, 100249408b
fetch : 0.39197015762329s, 440b

контрольный код :

<?php
// First benchmark : speed
$dbh = new PDO('mysql:dbname=testage;dbhost=localhost', 'root', '');
$dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
$sql = 'SELECT * FROM test_table WHERE 1';
$stmt = $dbh->query($sql);
$data = array();
$start_all = microtime(true);
$data = $stmt->fetchAll();
$end_all = microtime(true);

$stmt = $dbh->query($sql);
$data = array();
$start_one = microtime(true);
while($data = $stmt->fetch()){}
$end_one = microtime(true);

// Second benchmark : memory usage
$stmt = $dbh->query($sql);
$data = array();
$memory_start_all = memory_get_usage();
$data = $stmt->fetchAll();
$memory_end_all = memory_get_usage();

$stmt = $dbh->query($sql);
$data = array();
$memory_end_one = 0;
$memory_start_one = memory_get_usage();
while($data = $stmt->fetch()){
  $memory_end_one = max($memory_end_one, memory_get_usage());
}

echo 'Result : <br/>
fetchAll : ' . ($end_all - $start_all) . 's, ' . ($memory_end_all - $memory_start_all) . 'b<br/>
fetch : ' . ($end_one - $start_one) . 's, ' . ($memory_end_one - $memory_start_one) . 'b<br/>';

одна вещь о PHP, что я нашел, чтобы быть правдой почти всегда это функция, которую вы реализуете сами, почти всегда будет медленнее, чем эквивалент PHP. Это связано с тем, что когда что-то реализовано в PHP, у него нет всех оптимизаций времени компиляции, которые есть у C (в которых написан PHP), и есть высокие накладные расходы на вызовы функций PHP.

@Arkh

// $data in this case is an array of rows;

$data = $stmt->fetchAll();


// $data in this case is just one row after each loop;

while($data = $stmt->fetch()){}


// Try using

$i = 0;

while($data[$i++] = $stmt->fetch()){}

разница в памяти должна стать ничтожной

все тесты, выше которых измеряется "объем памяти", на самом деле неверны по очень простой причине.

PDO по умолчанию загружает все вещи в память, и ему все равно, используете ли вы fetch или fetchAll. Чтобы действительно получить преимущества unbuffered query, вы должны проинструктировать PDO использовать unbuffered queries:

$db->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);

в этом случае вы увидите огромную разницу в памяти скрипта

Как говорил Михай станку, почти нет разницы в памяти, хотя fetchAll бьет fetch + while.

Result : 
fetchAll : 0.160676956177s, 118539304b
fetch : 0.121752023697s, 118544392b

Я получил результаты выше с запуском в то время как правильно:

$i = 0;
while($data[$i++] = $stmt->fetch()){
    //
}

таким образом, fetchAll потребляет меньше памяти, но fetch + пока быстрее! :)

но, конечно, если вы храните извлеченные данные в массиве, использование памяти будет равным?

<?php
define('DB_HOST', 'localhost');
define('DB_USER', 'root');
define('DB_PASS', '');
// database to use
define('DB', 'test');
try
{
   $dbh = new \PDO('mysql:dbname='. DB .';host='. DB_HOST, DB_USER, DB_PASS);   $dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);
   $sql = 'SELECT * FROM users WHERE 1';
   $stmt = $dbh->query($sql);
   $data = array();
   $start_all = microtime(true);
   $data = $stmt->fetchAll();
   $end_all = microtime(true);

   $stmt = $dbh->query($sql);
   $data = array();
   $start_one = microtime(true);
   while($data = $stmt->fetch()){}
   $end_one = microtime(true);

   // Second benchmark : memory usage
   $stmt = $dbh->query($sql);
   $data = array();
   $memory_start_all = memory_get_usage();
   $data = $stmt->fetchAll();
   $memory_end_all = memory_get_usage();

   $stmt = $dbh->query($sql);
   $data = array();
   $memory_end_one = 0;
   $memory_start_one = memory_get_usage();
   while($data[] = $stmt->fetch()){
     $memory_end_one = max($memory_end_one, memory_get_usage());
   }

   echo 'Result : <br/>
   fetchAll : ' . ($end_all - $start_all) . 's, ' . ($memory_end_all - $memory_start_all) . 'b<br/>
   fetch : ' . ($end_one - $start_one) . 's, ' . ($memory_end_one - $memory_start_one) . 'b<br/>';
}
catch ( PDOException $e )
{
   echo $e->getMessage();
}
?>

Result : 
fetchAll : 2.6941299438477E-5s, 9824b
fetch : 1.5974044799805E-5s, 9824b

Я знаю, что это старая тема, но я сталкиваюсь с этим, имея тот же вопрос. Запустив свой собственный простой "бенчмарк" и прочитав то, что здесь писали другие, я пришел к выводу, что это не точная наука, и хотя нужно стремиться писать качественный, легкий код, нет смысла тратить слишком много времени на начало проекта.

мое предложение: соберите данные, запустив код(в бета-версии?) на некоторое время, а затем начать оптимизацию.

в моем простом бенчмарк (только проверенное время выполнения) у меня есть результаты, варьирующиеся от 5% до 50% в обоих направлениях. Я запускаю оба варианта в одном скрипте, но когда я запускаю fetch + while first, это было быстрее, чем fetchall, и наоборот. (Я знаю, что должен был запустить их один и пару сотен раз получить медиану и среднее значение, а затем сравнить, но, как я уже сказал в начале, я пришел к выводу, что в моем случае слишком рано начинать это делать.)