Message posté par : magr
----------------------------------------
Un exemple qui fonctionnait en 2020 (je ne sais pas s'il y a eu des changements de
format...).
-----------------
Code :
-- pour générer la liste des champs dans le CREATE TABLE ci-dessous on fait avec la
console OSGEO4W un
-- head -n 1 geo_sirene.csv --> et on reformate cette ligne avec :
-- passage en minuscule
-- remplace "," par ",\n"
-- remplace "," par " text," sauf : longitude numeric, latitude
numeric, geo_score numeric
-- DROP TABLE ref_sirene.sirene_000_2020;
CREATE TABLE ref_sirene.sirene_000_2020
(
siren text,
nic text,
l1_normalisee text,
l2_normalisee text,
l3_normalisee text,
l4_normalisee text,
l5_normalisee text,
l6_normalisee text,
l7_normalisee text,
l1_declaree text,
l2_declaree text,
l3_declaree text,
l4_declaree text,
l5_declaree text,
l6_declaree text,
l7_declaree text,
numvoie text,
indrep text,
typvoie text,
libvoie text,
codpos text,
cedex text,
rpet text,
libreg text,
depet text,
arronet text,
ctonet text,
comet text,
libcom text,
du text,
tu text,
uu text,
epci text,
tcd text,
zemet text,
siege text,
enseigne text,
ind_publipo text,
diffcom text,
amintret text,
natetab text,
libnatetab text,
apet700 text,
libapet text,
dapet text,
tefet text,
libtefet text,
efetcent text,
defet text,
origine text,
dcret text,
ddebact text,
activnat text,
lieuact text,
actisurf text,
saisonat text,
modet text,
prodet text,
prodpart text,
auxilt text,
nomen_long text,
sigle text,
nom text,
prenom text,
civilite text,
rna text,
nicsiege text,
rpen text,
depcomen text,
adr_mail text,
nj text,
libnj text,
apen700 text,
libapen text,
dapen text,
aprm text,
ess text,
dateess text,
tefen text,
libtefen text,
efencent text,
defen text,
categorie text,
dcren text,
amintren text,
monoact text,
moden text,
proden text,
esaann text,
tca text,
esaapen text,
esasec1n text,
esasec2n text,
esasec3n text,
esasec4n text,
vmaj text,
vmaj1 text,
vmaj2 text,
vmaj3 text,
datemaj text,
latitude numeric,
longitude numeric,
geo_score numeric,
geo_type text,
geo_adresse text,
geo_id text,
geo_ligne text,
geo_l4 text,
geo_l5 text
)
WITH (
OIDS=FALSE
)
TABLESPACE lent;
ALTER TABLE ref_sirene.sirene_000_2020
OWNER TO add;
GRANT ALL ON TABLE ref_sirene.sirene_000_2020 TO add;
GRANT SELECT ON TABLE ref_sirene.sirene_000_2020 TO lecture;
COMMENT ON TABLE ref_sirene.sirene_000_2020
IS 'Données SIRENE France.
Données géocodées avec BAN et BANO (voir
https://github.com/cquest/geocodage-sirene)
Téléchargées depuis
http://data.cquest.org/geo_sirene/last/
le 05/02/2020.';
-- ==================================================================
-- Dans la console psql de PGAdmin ; environ 12 min
-- ==================================================================
\copy ref_sirene.sirene_000_2020 from D:\temp\sirene\geo_sirene.csv with (format csv,
header true, encoding 'UTF-8');
-- ==================================================================
-- FIN console
-- ==================================================================
-- 1 heure
/* ajoute la colonne géométrique */
ALTER TABLE ref_sirene.sirene_000_2020 ADD geom geometry(point, 2154);
/* mise à jour de la colonne géométrique */
UPDATE ref_sirene.sirene_000_2020 SET geom =
st_transform(st_setsrid(st_makepoint(longitude, latitude), 4326), 2154);
/* création de l'index géométrique */
CREATE INDEX sirene_000_2020_geom ON ref_sirene.sirene_000_2020 USING gist (geom);
/* siret */
ALTER TABLE ref_sirene.sirene_000_2020 ADD COLUMN siret character varying(14);
UPDATE ref_sirene.sirene_000_2020 SET siret = siren || nic;
ALTER TABLE ref_sirene.sirene_000_2020
ADD CONSTRAINT sirene_000_2020_pk PRIMARY KEY (siret);
-- durée 30 min
CREATE INDEX sirene_000_2020_apen700_idx ON ref_sirene.sirene_000_2020 USING btree
(apen700 varchar_pattern_ops);
CREATE INDEX sirene_000_2020_apet700_idx ON ref_sirene.sirene_000_2020 USING btree
(apet700 varchar_pattern_ops);
CREATE INDEX sirene_000_2020_natetab_idx ON ref_sirene.sirene_000_2020 USING btree
(natetab);
CREATE INDEX sirene_000_2020_tefet_idx ON ref_sirene.sirene_000_2020 USING btree (tefet);
CREATE INDEX sirene_000_2020_tefen_idx ON ref_sirene.sirene_000_2020 USING btree (tefen);
CREATE INDEX sirene_000_2020_nj_idx ON ref_sirene.sirene_000_2020 USING btree (nj);
CREATE INDEX sirene_000_2020_nomen_long_gin ON ref_sirene.sirene_000_2020 USING gin
(nomen_long gin_trgm_ops);
CREATE INDEX sirene_000_2020_l1_normalisee_gin ON ref_sirene.sirene_000_2020 USING gin
(l1_normalisee gin_trgm_ops);
CREATE INDEX sirene_000_2020_l2_normalisee_gin ON ref_sirene.sirene_000_2020 USING gin
(l2_normalisee gin_trgm_ops);
CREATE INDEX sirene_000_2020_siege_idx ON ref_sirene.sirene_000_2020 USING btree (siege);
CREATE INDEX sirene_000_2020_depcomen_idx ON ref_sirene.sirene_000_2020 USING btree
(depcomen);
--Doc :
https://www.sirene.fr/static-resources/doc/dessin_L2_description_complete.p…#39;;
COMMENT ON COLUMN ref_sirene.sirene_000_2020.siren IS 'Identifiant de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nic IS 'Numéro interne de classement de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l1_normalisee IS 'Première ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l2_normalisee IS 'Deuxième ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l3_normalisee IS 'Troisième ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l4_normalisee IS 'Quatrième ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l5_normalisee IS 'Cinquième ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l6_normalisee IS 'Sixième ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l7_normalisee IS 'Septième ligne de
l’adressage de l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l1_declaree IS 'Première ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l2_declaree IS 'Deuxième ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l3_declaree IS 'Troisième ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l4_declaree IS 'Quatrième ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l5_declaree IS 'Cinquième ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l6_declaree IS 'Sixième ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.l7_declaree IS 'Septième ligne de
l’adressage déclaré pour l’établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.numvoie IS 'Numéro dans la voie';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.indrep IS 'Indice de répétition';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.typvoie IS 'Type de voie de localisation
de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libvoie IS 'Libellé de voie de
localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.codpos IS 'Code postal';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.cedex IS 'Code CEDEX';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.rpet IS 'Région de localisation de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libreg IS 'Libellé de la région';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.depet IS 'Département de localisation de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.arronet IS 'Arrondissement de
localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ctonet IS 'Canton de localisation de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.comet IS 'Commune de localisation de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libcom IS 'Libellé de la commune de
localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.du IS 'Département de l''unité
urbaine de la localisation de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tu IS 'Taille de l''unité
urbaine';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.uu IS 'Numéro de l''unité
urbaine';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.epci IS 'Localisation de
l''établissement dans un établissement public de coopération intercommunal';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tcd IS 'Tranche de commune
détaillée';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.zemet IS 'Zone d''emploi';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.siege IS 'Qualité de siège ou non de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.enseigne IS 'Enseigne ou nom de
l''exploitation';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ind_publipo IS 'Indicateur du champ du
publipostage';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.diffcom IS 'Statut de diffusion de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.amintret IS 'Année et mois
d''introduction de l''établissement dans la base de diffusion';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.natetab IS 'Nature de
l''établissement d''un entrepreneur individuel';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libnatetab IS 'Libellé de la nature de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.apet700 IS 'Activité principale de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libapet IS 'Libellé de
l''activité principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dapet IS 'Année de validité de
l''activité principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tefet IS 'Tranche d''effectif
salarié de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libtefet IS 'Libellé de la tranche
d''effectif de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.efetcent IS 'Effectif salarié de
l''établissement à la centaine près';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.defet IS 'Année de validité de
l''effectif salarié de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.origine IS 'Origine de la création de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dcret IS 'Année et mois de création de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ddebact IS 'Date de début
d’activité';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.activnat IS 'Nature de
l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.lieuact IS 'Lieu de l''activité
de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.actisurf IS 'Type de magasin';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.saisonat IS 'Caractère saisonnier ou non
de l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.modet IS 'Modalité de l''activité
principale de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.prodet IS 'Caractère productif de
l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.prodpart IS 'Participation particulière à
la production de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.auxilt IS 'Caractère auxiliaire de
l''activité de l''établissement';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nomen_long IS 'Nom ou raison sociale de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.sigle IS 'Sigle de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nom IS 'Nom de naissance';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.prenom IS 'Prénom';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.civilite IS 'Civilité des entrepreneurs
individuels';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.rna IS 'Numéro d’identification au
répertoire national des associations';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nicsiege IS 'Numéro interne de classement
de l''établissement siège';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.rpen IS 'Région de localisation du siège
de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.depcomen IS 'Département et commune de
localisation du siège de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.adr_mail IS 'Adresse mail';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.nj IS 'Nature juridique de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libnj IS 'Libellé de la nature
juridique';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.apen700 IS 'Activité principale de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libapen IS 'Libellé de
l''activité principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dapen IS 'Année de validité de
l''activité principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.aprm IS 'Activité principale au registre
des métiers';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.ess IS 'Appartenance au champ de
l’économie sociale et solidaire';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dateess IS 'Date ESS';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tefen IS 'Tranche d''effectif
salarié de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.libtefen IS 'Libellé de la tranche
d''effectif de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.efencent IS 'Effectif salarié de
l''entreprise à la centaine près';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.defen IS 'Année de validité de
l''effectif salarié de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.categorie IS 'Catégorie
d''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.dcren IS 'Année et mois de création de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.amintren IS 'Année et mois
d''introduction de l''entreprise dans la base de diffusion';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.monoact IS 'Indice de monoactivité de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.moden IS 'Modalité de l''activité
principale de l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.proden IS 'Caractère productif de
l''entreprise';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esaann IS 'Année de validité des
rubriques de niveau entreprise en provenance de l''Enquête Sectorielle
Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.tca IS 'Tranche de chiffre
d''affaires pour les entreprises enquêtées par l''Enquête Sectorielle
Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esaapen IS 'Activité principale de
l''entreprise issue de l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec1n IS 'Première activité secondaire
déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec2n IS 'Deuxième activité secondaire
déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec3n IS 'Troisième activité
secondaire déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.esasec4n IS 'Quatrième activité
secondaire déclarée dans l''Enquête Sectorielle Annuelle';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj IS 'Nature de la mise à jour
(création, suppression, modification)';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj1 IS 'Indicateur de mise à jour
n°1';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj2 IS 'Indicateur de mise à jour
n°2';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.vmaj3 IS 'Indicateur de mise à jour
n°3';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.datemaj IS 'Date de traitement de la mise
à jour';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.longitude IS 'en degrés décimaux,
WGS84';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.latitude IS 'en degrés décimaux,
WGS84';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_score IS 'indice de similarité
fournit par le moteur de géocodage';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_type IS '"housenumber" = n°
trouvé, "interpolation" = n° interpolé, "street" = voie trouvée,
"locality" = lieu-dit (ou position de la mairie) pour les adresses indiquées
"MAIRIE" ou "HOTEL DE VILLE", "municipality" = position de
la commune car l''adresse n''a pas été trouvée.';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_adresse IS 'libellé de
l''adresse trouvée';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_id IS 'id dans le référentiel BAN, ou
BANO (si commence par "BANO_")';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.geo_ligne IS 'ligne d''adresse
géocodée (G = géographique, N = normalisée, D = déclarée)';
COMMENT ON COLUMN ref_sirene.sirene_000_2020.siret IS 'SIRET (clé primaire)';
-- DROP VIEW ref_sirene.sirene_000;
CREATE OR REPLACE VIEW ref_sirene.sirene_000 AS
SELECT *
FROM ref_sirene.sirene_000_2020;
ALTER TABLE ref_sirene.sirene_000
OWNER TO add;
GRANT ALL ON TABLE ref_sirene.sirene_000 TO add;
GRANT SELECT ON TABLE ref_sirene.sirene_000 TO lecture;
COMMENT ON VIEW ref_sirene.sirene_000
IS 'Vue pointant sur la version la plus récente de SIRENE';
-----------------
----------------------------------------
Le message est situé
https://georezo.net/forum/viewtopic.php?pid=345965#p345965
Pour y répondre : donnees(a)ml.georezo.net ou reply de votre messagerie
Pour vous désabonner connectez-vous sur le forum puis Profil / Abonnement
--
Association GeoRezo - le portail géomatique
https://georezo.net