[gull] Parallelize Postgresql request
Marc SCHAEFER
schaefer at alphanet.ch
Sat Oct 12 21:46:40 CEST 2024
Bonjour,
On Fri, Oct 11, 2024 at 08:51:26AM +0200, Marc SCHAEFER via gull wrote:
> Si jamais tu arrivais à faire une requête, par exemple sur les
> tables internes de PostgreSQL -- ou en nous fournissant les données
> et les requêtes -- qui montre le problème, on pourrait tester
> sur nos installations :)
J'ai posé une question à la liste postgresql-general:
> template1=> SELECT COUNT(*) FROM pg_class a, pg_class b, pg_class c;
Une requête un peu stupide mais qui montre bien 1 seul CPU actif.
La réponse:
If you set set min_parallel_table_scan_size = 0 then it uses
parallelism, and completes much faster. The planner generally works
by comparing the estimated cost of various plans (it is a "cost based"
optimiser), but the decision to actually consider parallelism at all
is essentially "rule based", and the rules aren't smart enough for
this query with default settings. pg_class is considered too small to
bother parallelising the scan, and here you have a 3-way cross-join
which generates an enormous of work for each tuple so it is actually
a good idea to parallelise it. I guess people don't actually do that too
often.
Donc c'est bien en direction de l'optimiseur qu'il faut probablement
regarder, tout en étant conscient que l'exemple ci-dessus est tiré
par les cheveux.
More information about the gull
mailing list