Question

Si j'avais un tableau d'entiers signés par exemple:

Array
(
    [0] => -3
    [1] => 1
    [2] => 2
    [3] => 3
    [4] => 3
)

Pour obtenir des valeurs uniques j'utiliser instinctivement array_unique mais après examen, je pourrais effectuer deux fois array_flip qui aurait le même effet, et je pense que ce serait plus rapide?

array_unique O (n log n) en raison de l'opération de tri, il utilise

array_flip O (n)

Ai-je raison dans mes hypothèses?

UPDATE / Exemple:

$intArray1 = array(-4,1,2,3);
print_r($intArray1);
$intArray1 = array_flip($intArray1);
print_r($intArray1);
$intArray1 = array_flip($intArray1);
print_r($intArray1);

Array
(
    [0] => -3
    [1] => 1
    [2] => 2
    [3] => 3
    [4] => 3
)
Array
(
    [-3] => 0
    [1] => 1
    [2] => 2
    [3] => 4
)
Array
(
    [0] => -3
    [1] => 1
    [2] => 2
    [4] => 3
)
Était-ce utile?

La solution

pour vous benchmarkée: CodePad

Votre intuition sur ce point était correcte!

$test=array();
for($run=0; $run<1000; $run++)
$test[]=rand(0,100);

$time=microtime(true);

for($run=0; $run<100; $run++)
$out=array_unique($test);

$time=microtime(true)-$time;
echo 'Array Unique: '.$time."\n";

$time=microtime(true);

for($run=0; $run<100; $run++)
$out=array_keys(array_flip($test));

$time=microtime(true)-$time;
echo 'Keys Flip: '.$time."\n";

$time=microtime(true);

for($run=0; $run<100; $run++)
$out=array_flip(array_flip($test));

$time=microtime(true)-$time;
echo 'Flip Flip: '.$time."\n";

Sortie:

Array Unique: 1.1829199790955
Keys Flip: 0.0084578990936279
Flip Flip: 0.0083951950073242

Notez que array_keys(array_flip($array)) donnera une nouvelle valeurs clés dans l'ordre, qui, dans bien des cas, peut être ce que vous voulez (identique, sauf beaucoup plus rapide à array_values(array_unique($array))), alors que array_flip(array_flip($array)) est identique (sauf beaucoup plus rapide) à array_unique($array) où les clés restent les mêmes .

Autres conseils

Rien ne vaut mieux que gérer votre propre référence.

➜  8321620  cat first.php
<?php

$arr = array(-3, 1, 2, 3, 3);

for($i = 0; $i <= 1000000; $i++) {
    array_unique($arr);
}
➜  8321620  time php first.php
php first.php  3.24s user 0.01s system 99% cpu 3.251 total
➜  8321620  cat second.php
<?php

$arr = array(-3, 1, 2, 3, 3);

for($i = 0; $i <= 1000000; $i++) {
    array_flip(array_flip($arr));
}
➜  8321620  time php second.php
php second.php  1.50s user 0.01s system 99% cpu 1.514 total

Mise à jour:. Tableau avec 1000 éléments

➜  8321620  cat first.php
<?php

$arr = array();
for($i = 0; $i <= 1000; $i++) {
    $arr[] = rand(0, 1000);
}

for($i = 0; $i <= 10000; $i++) {
    array_unique($arr);
}
➜  8321620  time php first.php
php first.php  27.50s user 0.03s system 99% cpu 27.534 total
➜  8321620  cat second.php
<?php

$arr = array();
for($i = 0; $i <= 1000; $i++) {
    $arr[] = rand(0, 1000);
}

for($i = 0; $i <= 10000; $i++) {
    array_flip(array_flip($arr));
}
➜  8321620  time php second.php 
php second.php  1.59s user 0.01s system 99% cpu 1.604 total

Alors oui, votre hypothèse était correcte.

Attention: cette technique n'est pas un (drop-in de remplacement pour array_unique). Il ne fonctionne que pour les tableaux avec des valeurs sont des clés valides. (Par exemple: chaîne, entier, les choses peuvent se jeter à int). Et certainement ne fonctionne pas pour les tableaux d'objets.

$input = [true, false, 1, 0, 1.2, "1", "two", "0"];
var_export(array_unique($input));
array (
  0 => true,
  1 => false,
  3 => 0,
  4 => 1.2,
  6 => 'two',
)

vs:

var_export(array_keys(array_flip($input)));

PHP Warning:  array_flip(): Can only flip STRING and INTEGER values! 
in php shell code on line 1

array (
  0 => 1,
  1 => 0,
  2 => 'two',
)

vous devez utiliser

array_keys( array_flip( $array ) );

qui prendrait plus de temps

Je array_unique aller. Il a l'avantage d'expliquer ce qu'il se passe.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top