Message posté par : Emmanuel Castro (emmanuel.castro(a)laposte.net)
----------------------------------------
-----------------
cquest écrit :
Oui, on peut faire ce type de requête, mais à quel prix en termes de volume de données à
transférer... on peut vite perdre l'intérêt des formats optimisés cloud.
-----------------
Pour un usage efficace du GeoParquet, il faut que celui-ci soit trié géographiquement, ou
par un attribut corrélé avec la géographie.
Dans ce cas, on ne télécharge que les plages de données les plus utiles.
Pour des recherches sur des attributs non trié, GeoParquet permet de ne lire que la
colonne de l'attribut sur laquelle on filtre, ce qui peut aller très très vite (les
outils comme DuckDB ne s'embarasseront pas à lire l'énorme volume que représentent
souvent les géométries).
Exemple de requête en HTTP :
-----------------
Citation :
SELECT geom::text, * exclude geom FROM
'https://static.data.gouv.fr/resources/ban-format-parquet/20250523-102223/adresses-france-10-2024.parquet'
WHERE nom_voie ILIKE '%anglais%'
AND nom_commune LIKE 'Nice'
-----------------
Temps de requête < 2s
Note : il vous faudra très certainement mettre à jour l'URL depuis cette page :
https://www.data.gouv.fr/fr/datasets/ban-format-parquet/
Note 2 : pour le moment, QGIS ne fonctionne bien qu'avec des fichiers en local. Pour
une efficacité maximale, il faut que l'attribut geom soit accompagné de son geom_bbox.
S'il n'est pas disponible, on petit coup de ogr2ogr pour passer de GeoParquet à
GeoParquet.
Attention : souvent, le GDAL de Linux n'a pas le support de GeoParquet (à compiler
soit même ?). Dans la version Windows (OSGeo4Win livré avec QGIS), ça marche nickel.
----------------------------------------
Le message est situé
https://georezo.net/forum/viewtopic.php?pid=373226#p373226
Pour y répondre : donnees(a)ml.georezo.net ou reply de votre messagerie
Pour vous désabonner connectez-vous sur le forum puis Profil / Abonnement
--
Association GeoRezo - le portail géomatique
https://georezo.net