L’ouverture des données dans le monde municipal

Communication au Colloque de l’AGMQ, 3 mai 2011, Québec.

À l’aide de cartes heuristiques, j’ai expliqué les principes qui guident l’ouverture des données à un auditoire d’utilisateurs expérimentés de données géospatiales et d’applications géomatiques. En deuxième partie, j’ai fait la synthèse des quelques pratiques exemplaires en implantation de services de données ouvertes.

Voir plus loin pour le synopsis de la conférence et les schémas heuristiques

Communication sur l'ouverture des données dans le monde municipal

Synopsis de la conférence et schémas heuristiques


Schéma maître en format PDF dynamique.

Schéma associé :
Dix principes-guides de la libération des données

=============================================================
L’ouverture des données dans le monde municipal

Colloque de l’AGMQ,3 mai 2011, Québec

(cc) Diane Mercier, Ph.D.
Chargée de projet sur les données ouvertes
Ville de Montréal, http://ville.montreal.qc.ca
=============================================================

————————————————————-
1 Plus que des formats de fichier
————————————————————-

1.1 Transparence gouvernementale c. gouvernement ouvert
L’ouverture des données publiques n’est pas seulement la transparence gouvernementale, mais une démarche plus flexible afin de rendre un gouvernement de plus en plus ouvert. 

1.1.1 Transparence gouvernementale
La transparence gouvernementale est soutenue principalement par la mise à disposition de données sous des formats ouverts et des licences d’utilisation plus ou moins ouvertes. Les démarches de divulgation proactive répondent à ce point de vue (data.gc.ca; loi 76, décret 408-2008)

1.1.1.1 Formats ouverts
1.1.1.2 Licence ouverte

1.1.1.2.1 CIPPIC
Au Canada anglais, régi par le « Common Law », les villes d’Ottawa, Toronto, Edmonto et Vancouver ont demandé au CIPPIC des conseils sur la licence ouverte. Le groupe d’experts a préparé une recommandation pour la Ville d’Ottawa

1.1.1.2.2 data.gc.ca
La licence sur le site du gouvernement du Canada comporte des limites à l’ouverture telle que définit par l’Open Knowledge Foundation.
Voici un extrait significatif d’un frein à la réutilisation
« 3.0 Octroi de licence4. vous ne désassembliez, dégroupiez, sauf aux fins spécifiques de regrouper les données pour assurer la compatibilité du logiciel, ou tentiez en quelque sorte de désassembler, en tout ou en partie, les données publiées dans le cadre du Portail de données ouvertes du GC, ou ne fusionniez ou liez les données du Portail à d’autres produits ou bases de données qui permettent d’identifier une personne, une famille ou un ménage, ou qui soient structurées de manière à donner l’impression que vous avez reçu ou avez accès à des renseignements détenus par le Canada au sujet d’une personne, d’une famille ou d’un ménage, au sujet d’un organisme ou d’une entreprise identifiable. »
[Source : http://www.data.gc.ca/default.asp?lang=Fr&n=46D15882-1]

1.1.2 Gouvernement ouvert
Une gouvernement ouverte respecte les dix principes-guide de la libération des données publiques
Extrait du mandat confié au Groupe de travail sur les données ouvertes :
« Concrètement, pour un gouvernement ouvert il s’agit de  :
Publier l’information municipale en ligne dans le réseau Internet;
Améliorer la qualité de l’information municipale;
Créer et institutionnaliser la culture du gouvernement ouvert;
Créer et faciliter un cadre de politique sur le gouvernement ouvert;
Réutiliser et ajouter de la valeur aux informations municipales par d’autres logiciels, applications et services. 

Cette démarche devrait se faire dans le respect des capacités financières, humaines, matérielles et informationnelles de la Ville de Montréal.» 

1.1.2.1 Participation et interaction avec le milieu
Cette démarche implique une communication ouverte et l’animation du milieu : citoyens, groupes communautaires et associatifs, entreprises, universités.

1.1.2.2 Réutilisation ouverte
L’objectif ultime de l’ouverture des données est la réutilisation et l’innovation.

1.2 Les dix principes-guides de la libération des données publiques

1.2.1 Données publiques
Encadrement : Politique sur la sécurité de l’information de la Ville de Montréal (2005)Rendre les données publique implique l’implantation de stratégies de déclassification.Toutes données collectées et gérées par une administration publique ET

1.2.1.1 Non nominatives
1.2.1.2 Non confidentielles
1.2.1.3 Non de sécurité
1.2.1.4 Sans autre droit d’auteur, ni brevet

1.2.2 Principes de l’ouverture
Avec des stratégies de libération en fonction des capacités et de la maturité de l’organisation publique.

1.3 Qu’est-ce qu’on libère?

1.3.1 Critères de libération

1.3.1.1 Priorités publiques
Par exemple, Plan d’action de la Ville, Orientations budgétaires

1.3.1.2 Déjà diffusées dans le Web
Ajouter de la valeur pour susciter encore d’autres valeurs

1.3.1.3 Développement économique
Particulièrement des PME. Encourager l’entrepreneuriat (Techno Montréal, Montréal Métropole Numérique)

1.3.1.4 La demande du milieu
Citoyens, associations et organismes communautaires

1.3.1.4.1 Citoyens
1.3.1.4.2 Communautaire et associatif
1.3.1.4.3 Entreprises et universités

1.3.1.5 Contextualisées
L’unicité des données publiques : l’espace, le temps et la sémantique
Sémantique : RDF, vocabulaire, FOAF (réseaux sociaux) 

1.3.2 Lesquelles?
Dans sa Politique sur la sécurité de l’information, la Ville de Montréal a défini les données, l’information et les documents en conformité avec la Loi sur les archives du Québec.(Données brutes, Documents, Documents technologiques, Documents multimédia, Documents conteneurs)

1.3.2.1 Données géospatiales
1.3.2.2 Données statistiques
1.3.2.3 Données d’élection
1.3.2.4 Événements
1.3.2.5 Fonds documentaires
1.3.2.6 etc.

1.4 Que répondre aux objections de qualité
[Source principale : FING 2011 : 41] 

On ne peut présupposer de l’usage d’une donnée, d’une
information ou d’une connaissances, car le contexte change

continuellement.
Mes données ne sont pas de qualité, car elles :

1.4.1 Erreurs
« Qui prétend ne jamais en faire ? Et même avec de nombreuses erreurs, les données peuvent tout de même intéresser les réutilisateurs : certaines sont très faciles à corriger, elles peuvent intéresser à titre de comparaison, etc. En outre, on constate que la publication de données peut, dans certains cas, conduire les utilisateurs eux-mêmes à les corriger, au plus grand bénéfice de l’acteur public. Le producteur aurait en revanche intérêt, pour tout jeu de données, à indiquer un taux d’erreur, même grossier. »

1.4.2 Incomplètes
« Il est très probable qu’elles soient en réalité complètes sous un certain angle : par exemple restreintes à une zone géographique bien définie. Mêmes « incomplètes », ces données peuvent être utiles aux réutilisateurs pour initier un travail. Là encore, le producteur doit documenter clairement la couverture de ses données. »

1.4.3 Imprécises
« La précision recherchée ne dépend que de l’usage. Aux réutilisateurs de dire si la précision leur convient. »

1.4.4 Anciennes
« Des données périmées pour leur usage initial peuvent néanmoins intéresser de nombreux acteurs (chercheurs, étudiants, consultants) désireux d’effectuer par exemple des travaux de synthèse, d’analyse historique, etc. »

1.4.5 Mise à jour irrégulière
« Là encore, elles peuvent présenter un intérêt pour des usages d’analyse comparative, de travaux de synthèses ou autres. »

1.4.6 Format non standard
« Si le format est documenté, ce n’est pas un problème. Si les réutilisateurs y voient un intérêt, convertir des données bien documentées d’un format à un autre n’est pas si difficile. »

1.4.7 Format mal documenté
« Un réutilisateur vraiment intéressé trouvera toujours moyen de le faire a posteriori. Peut-être une bonne occasion pour vous de dialoguer avec ces réutilisateurs pour produire une documentation de qualité. »

1.4.8 Inintéressantes
« Chiche ! Dans tous les cas, ne pas préjuger à l’avance qu’elles n’intéressent personne. »

1.4.9 Déjà tarifées
Par ailleurs, le budget de fonctionnement pour gérer la tarification est généralement plus élevé que les recettes elles-même. De plus, les recettes sont déposées dans un fond général sans lien avec la gestion des données.

1.4.10 Mal interprétées
« C’est présupposer que les citoyens, les entrepreneurs, les universitaires sont incompétents! Il est plus avantageux d’avoir plusieurs interprétations pour avoir une plus juste conclusion. »

1.4.11 Problème d’éthique
En fusionnant ou défusionnant des éléments d’un ensemble de données, il serait possible d’idenfier des individus. Il s’agirait alors de choisir un niveau de granularité adéquat. »

1.4.12 En avez-vous d’autres?

1.4.1

1.4.1.1 Métadonnées
Les métadonnées et les mécanismes sémantiques (par exemple, l’usage de RDF) peuvent résoudre ces difficultés de façon élégante.

————————————————————-
2 La réutilisation et l’interaction
————————————————————-

Utiliser ou réutiliser c’est imitier, adapter et innover

L’objectif de cette démarche est de permettre au public de connaître, de comprendre, d’enrichir les données relatives au territoire, d’imaginer et de
proposer des services permettant de rendre la cité plus efficace, plus conviviale, plus respectueuse de son environnement, plus dynamique et attractive. [Montpellier : http://www.a-brest.net/article7647.html

2.1 Valeurs ajoutées aux biens communs

2.2 Développement de la littératie
2.2.1 Milieu
2.2.2 Employés

2.3 Gains en performance
Impact sur les méthodes de travail des employés et des gestionnaires municipaux

2.4 Maturité de l’organisation

2.5 Amélioration des services

2.6 Améliorer le référencement et le repérage
Une meilleure exploitation des ressources intellectuelles

2.7 Soutien à la réutilisation, la participation et l’interaction
Implique la concertation avec le milieu.

2.8 Journalisme des données
Visualisation des connaissances dans le temps et l’espace.

2.8.1 Many Eyes / IBM

2.9 Données liées et agents intelligents
Le Web sémantique (Web 3.0) et le Web intelligent (Web 4.0)

————————————————————-
3 Feuille de route
(pratiques exemplaires)
————————————————————-

Des pratiques exemplaires se présentent maintenant à nous. C’est de notre responsabilité de les réutiliser.

Ces pratiques peuvent être catégorisées ainsi : centrée utilisateur, centrée technologie et centrée processus.

Le meilleur choix consiste à faire concorder maturité et culture organisationnelle avec l’orientation de la pratique.

3.1 Cook County, avril 2011 (Chicago, É.-U.)
Centrée utilisateurs
3.1.1 Ordonnance
3.1.2 Mise en ligne du portail de données ouvertes
3.1.3 Encourager et soutenir le développement d’applications ar la base (concours et ateliers)
3.1.4 Amélioration continue
« Open government is a growing, maturing movement »

3.2 Paris, février 2011
Centrée utilisateurs
3.2.1 La préparation par une équipe de projet
3.2.2 Rencontres et échanges avec les services gestionnaires
3.2.3 Mise en ligne des jeux de données
3.2.3.1 Le catalogue
Constitué de fiches descriptives d’ensemble de données avec leur métadonnées. Peut regrouper plusieurs catalogues spécialisés, par exemple catalogue de données géospatiales
3.2.3.2 Le portail
Constitué : du catalogue, d’outil de soutien à l’utilisation (FAQ, Wiki, guide d’utilisation, etc.) d’outil d’interaction (commentaires, etc.) liens vers le milieu
3.2.3.3 Le portail de portails
EtaLab
3.2.4 Animation du dispositif
Implique la création de nouveaux rôles d’intermédiaires…. les professionnels de l’information
3.2.4.1 Aide et aide contextuelle
3.2.4.2 Commentaires
3.2.4.3 Boîte à suggestions
3.2.4.4 FAQ, wiki, blogues, forums
3.2.4.5 Concertation avec le milieu

3.3 FING.ORG, janvier 2011
Centrée utilisateur
3.3.1 Etape 1 : Esquisser les enjeux, repérer les potentiels de création de valeur
3.3.2 Etape 2 : Ouvrir des premiers jeux de données
3.3.3 Etape 3 : Accompagner : stimuler, valoriser, aider, dialoguer

3.4 G4+, décembre 2010
Centrée TI
3.4.1 Phase 1 : Open Data Start Up, Publishing information on website
3.4.2 Phase 2 : Open Data Transactional, Providing Data Catalogue Services
3.4.3 Phase 3 : Creating an Multi-functional Open Data Portal
3.4.4 Phase 4 : Open Data Transformation, Achiving Open Data Enterprise
3.4.5 Phase 5 : Full integration with Open Data Community

3.5 LiberTIC, 2010
Centrée utilisateurs
3.5.1 Militer
3.5.2 Démonter
3.5.3 Convaincre
3.5.4 Agir
3.5.5 Créer
3.5.1
3.5.1.1 Communiquer
3.5.1.2 Participer
3.5.1.3 Animer

3.6 W3C
Centrée contenu et processus

————————————————————-
4 Conclusion
————————————————————-

Il n’y a pas de recette magique. Les pratiques exemplaires sont là pour être réutilisées. Elles sont des guides qui, l’ouverture une fois implantée,reflètera les capacités et la maturité de l’organisation publique et du milieu.

Ce n’est pas une course. Ceux qui suivent profitent de l’expérience et des connaissances de ceux qui les ont précédés et ainsi développement les biens communs de façon durable.

Le Directeur général de la Ville de Montréal, M. Louis Roquet, a confié un mandat au Groupe de travail sur les données ouvertes le 11 mars dernier. M. Michael Applebaum, président du Comité exécutif de la Ville de Montréal, a déposé le mandat au Conseil municipal du 21 mars.Le mandat consiste à faire une analyse stratégique de l’ouverture des données publiques de la Ville et de proposer un plan d’action pour les années à venir.

Les travaux du groupe de travail se poursuivent normalement. L’analyse stratégique et le plan d’action préliminaires seront remis au Directeur général à la fin juin. Le rapport final est prévu vers la fin du mois de septembre.

4.1 Contact
Pour communiquer avec Diane Mercier, Ph.D.
Courriel institutionnel : dmercier [arobas] ville [point] montreal [point] qc [point] ca
Courriel personnel : diane [arobas] dianemercier [point] com
Pour suivre l’auteure :
Site sémantisé :     http://dianemercier.com
LindedIn :   http://www.linkedin.com/in/dianemercier
Twitter :  @carnetsDM
Zotero : http://www.zotero.org/dmercier
Viadeo : http://www.viadeo.com/fr/profile/diane.mercier
Facebook : http://www.facebook.com/carnetsDM

Vus : 665
Publié par Diane Mercier : 78