Mon article sur les données de prix des logements neufs dans l'ouvrage anniversaire du CECIM: Verrax E. (dir.) (2019), 50 ans et après?, Lyon, CECIM Editions.
A l’heure de la ville intelligente, la data se multiplie et fonde la création de services urbains innovants. Les marchés du logement surfent sur la tendance : les données de prix et de loyers sont de plus en plus nombreuses et accessibles ; leur production et leur diffusion empruntent au numérique ; leur fourniture s’inscrit dans l’élaboration d’une offre renouvelée de services immobiliers. Cependant, l’ensemble des données constitué garde une part de stabilité tant dans ses composantes que dans ses méthodes. Surtout, il est éclaté. Le flou persiste sur les dynamiques de prix et de loyers, entretenant le manque de transparence des marchés immobiliers. Le numérique ouvre-t-il des perspectives nouvelles en la matière ? La réponse par les données relatives au logement neuf.
Les données immobilières en France : riches et nombreuses mais éclatées et encore lacunaires
Sur les marchés du logement, les références de prix et de loyer constituent les données immobilières les plus stratégiques. Elles font l’intérêt de tous : Etat, collectivités, particuliers, promoteurs, agents immobiliers, investisseurs, banques, médias, opérateurs de données, start-ups, etc.. ; et répondent à de nombreux enjeux : d’information et de transparence ; d’accompagnement du marché et d’évaluation des politiques publiques ; de veille concurrentielle et d’appui à la décision ; de suivi de la construction, secteur déterminant au plan macro-économique ; de financement de l’offre et de solvabilisation de la demande ; d’expertise et de gestion d’actif ; d’innovation en termes de service, etc.. A l’ère du numérique, qui produit prix et loyers et avec quelle méthode ? Qu’en est-il plus particulièrement dans le champ de construction neuve ?
En France, la production des principales références de prix et de loyers repose sur une dizaine de producteurs proposant une large couverture du territoire. Des opérateurs locaux s’y ajoutent en tant que chaînons de réseaux nationaux, à l’instar des observatoires des loyers instaurés par la loi ALUR et des prix dans le neuf de la Fédération des promoteurs immobiliers (FPI), première organisation de la profession. L’ensemble s’organise autour de lignes de partage reproduisant l’organisation du marché, entre achat et location, neuf et ancien, collectif et individuel, commercialisation intermédiée et non intermédiée. Aucun producteur ne renseigne tous les segments du marché à la fois et la plupart n’en couvrent qu’un ou deux en moyenne. L’information immobilière s’en trouve précise mais éclatée. Elle est riche mais difficile à embrasser, entretenant le flou sur les dynamiques des marchés. Par ailleurs, des segments majeurs restent mal renseignés. C’est notamment le cas de l’investissement locatif et de ses loyers, alors même qu’il représente un à deux tiers des logements produits dans le neuf par an.
Les données sur la construction neuve, des dispositifs spécifiques de production
Parmi les data immobilières, les données de prix dans le neuf dessinent un ensemble à part. A quelques exceptions près, elles sont l’affaire de spécialistes, installés dans le paysage depuis 25 à 50 ans. Leur production a toujours été assurée par la puissance publique et le secteur privé à la fois. L’inauguration en 1971 d’ECLN, dispositif du service statistique du ministère du logement, deux années seulement après la création du Cecim, organisme privé, l’illustre de toute évidence.
Les dispositifs de production du public et du privé ont en commun de porter sur les ventes réalisées en VEFA par les promoteurs immobiliers. Ils ne renseignent pas les prix des maisons dans le diffus. Une raison en est que ces logements (140 000 par an en moyenne) n’ont précisément pas de prix (hors revente rapide), du fait que leur production distingue l’achat du terrain, objet de la transaction immobilière et la construction, objet d’un permis de construire.
Entre le public et le privé, une différence tient à la couverture du marché : tandis que le public renseigne l’ensemble de la France, le privé s’organise en observatoires locaux, d’abord indépendants (et parfois concurrents), puis réunis pour la plupart au sein du réseau de la FPI. Dans le privé, la FPI offre un point d’accès aux données agrégées produites par les observatoires. Mais l’ancrage local de la production ajoute à l’éclatement des données fines. Il rend leur accès difficile, d’autant qu’il est encore payant.
Un socle méthodologique commun, la permanence des partis pris historiques
Les producteurs de données de prix dans le neuf reposent sur un socle méthodologique commun, du moins très proche. Cette proximité assure la cohérence de l’information produite mais elle ne pare pas à son éclatement et au manque de transparence qui en découle.
Dans le neuf, le prix des logements est effectivement établi à partir d’une méthode commune à l’ensemble des producteurs : l’enquête, réalisée à la source, auprès des promoteurs immobiliers. Son principal avantage tient aux possibilités de contrôle qu’elle offre à toutes les étapes de la production, de la constitution de la base d’observation à la consolidation des résultats, en passant par le recueil de l’information. A l’ère du numérique, les remontées empruntent la voie de la dématérialisation et le scraping des sites de commercialisation des promoteurs commence à apporter des compléments d’informations qui permettent de gagner en fraîcheur et en finesse. Mais rien n’y change vraiment encore : le travail alla mano reste un gage de qualité et conserve donc sa place au cœur des dispositifs de production. Rien ne se substitue à la connaissance fine du logement et de ses marchés. Sans expertise, il n’y a pas de données propres. En forçant le trait, on pourrait même dire qu’aujourd’hui, mieux vaut encore être un bon connaisseur du marché qu’un bon data scientist. Non, la data ne remplacera pas l’expertise, elle en tirera sa robustesse.
Dans le neuf également, le prix s’exprime toujours en net vendeur (hors frais de transaction et d’enregistrement) et distingue le collectif de l’individuel groupé. Il correspond au prix de réservation dans tous les cas, et se décompose en deux indicateurs supplémentaires dans le cas des observatoires privés locaux : prix d’offre et prix de vente. L’ensemble repose sur un travail de catégorisation en grande partie commun à tous les producteurs de données, y compris hors du champ de la production neuve. Les catégories utilisées apparaissent « données » tant elles sont incontournables mais en réalité, ce sont des constructions.
A y regarder de près en effet, aucune n’est exempte de spécifications qui préforment, voire réduisent le champ d’observation. On a vu par exemple que les prix du neuf ne renvoyaient pas à toutes les ventes de logements neufs mais aux ventes de logements réalisées en VEFA par les promoteurs immobiliers ; qu’il couvrait l’individuel groupé mais pas le diffus ; qu’il rencontrait d’abord le prix de réservation. A titre d’exemple, on pourrait ajouter qu’il distingue les appartements des maisons, les logements vendus en accession des logements vendus aux investisseurs, les ventes au détail des ventes en bloc, etc. L’impression d’évidence, le « réalisme » produit par les catégories à l’œuvre est tel qu’elles paraissent destinées à se reproduire encore et toujours, au risque même de tordre les données qui ne s’y conforment pas a priori.
La puissance publique : son rôle central, son potentiel disruptif
L’ouverture récente des données de transactions de la DGFIP (base DVF) ouvre de nouvelles et riches perspectives pour conforter les bases d’enquêtes sur la commercialisation des logements neufs et compléter automatiquement les relevés des prix conclus. Cependant, DVF ne distingue pas le neuf de l’ancien formellement ; elle n’offre pas des données de marchés toutes faites, mais des données d’origine fiscale qu’il s’agit de convertir pour les faire entrer dans les catégories de l’observation de la commercialisation des logements neufs. Même les VEFA, alors qu’elles sont affaire de fiscalité, n’y sont pas toujours renseignées comme telles et peuvent se trouver rangées dans la catégorie des ventes ordinaires. Une raison en est que les régimes de TVA et de la taxation de publicité foncière sont dissociés et que le second correspond au critère déterminant du traitement de l’acte par les opérateurs, laissant le premier inégalement enregistré.
Le cas de DVF rappelle que même les données dites brutes ne sont pas neutres mais rattachées à un périmètre de compétences, un cadre de production et une intention d’usage qui, bien qu’atténués par les ajustements préalables à leur ouverture, rendent leur utilisation particulièrement délicate. Avec les données, il n’y a rien de magique et l’open data n’y a rien changé. L’avènement du numérique non plus.
Cependant, le potentiel disruptif de la libération des données brutes de DVF reste entier dans le champ de l’information immobilière. La puissance publique offre les sources réputées les plus légitimes et a longtemps suspendu les acteurs à leur ouverture avant d’ouvrir les vannes. A l’ère du numérique, même la proptech en dépend, comme le démontre l’usage central que les start-ups immobilières font des données publiques déjà ouvertes dans d’autres domaines. Une raison en est que ces données, de par leur statut public, ajoutent à la valeur de l’information dont elles abondent le système de production.
L’utilisation de DVF pourrait conforter le développement de nouvelles données susceptibles de compléter, voire de concurrencer les informations aujourd’hui disponibles. Mais elle n’ouvre pas seulement la voie aux start-ups, elle concerne aussi les producteurs historiques de données de prix. Avec DVF en effet, la donnée de prix conclu n’est plus un facteur de différenciation mais un référentiel commun. La plus-value est à chercher ailleurs, dans la vente non pas de données mais de services permettant de les exploiter plus facilement, telle que l’économie numérique le suggère.
Conclusion : les producteurs historiques bousculés par les start-ups ?
Aujourd’hui, les opérateurs historiques de données de prix dans le neuf sont bousculés par les agrégateurs de données. Pour l’heure, les données des agrégateurs ne se substituent pas aux données existantes, elles les complètent tout au plus. Il faut dire que les agrégateurs ne produisent pas de références de prix et de loyers. Ils campent sur deux autres terrains : celui de la prospection immobilière et foncière ; celui de l’estimation et de la prédiction automatiques. En revanche, ils utilisent les données existantes et les versent, aux côtés de données de contexte en tout genre, dans des modèles mathématiques qui visent deux objectifs encore hors d’atteinte des producteurs historiques : produire des données rafraîchies et actualisées à un instant T, celui de la consultation ; offrir des données à l’échelle du logement, celle de la prospection et de l’investissement.
Pour l’heure, le marché de la donnée immobilière distingue donc deux types de contributeurs : ceux qui comptent les logements et enregistrent leur prix ; ceux qui anticipent les évolutions de marché. Pour les premiers, un enjeu consisterait à répondre à l’urgence de la fast data. En effet, si la valeur des biens est étroitement liée au contexte conjoncturel de leur commercialisation, elle ne peut encore aujourd’hui se mesurer que dans le rétroviseur du fait du temps, qui se compte en semaines voire en mois, imparti à la remontée des informations depuis la source. Les acteurs de l’immobilier sont habitués à ce manque de synchronie. Mais le besoin de le dépasser se fait croissant dans un contexte marqué par une concurrence accrue et par une accélération des temps de négociation. Le défi n’est pas des moindres. Il est au cœur des évolutions à attendre dans les prochaines années. Pour le gagner et infléchir les courbes par la data même, les outils offerts par le numérique, à commencer par le scraping, légal jusqu’à nouvel ordre, et le sourcing automatique, doivent être intégrés aux dispositifs historiques.
Un second enjeu consisterait à attaquer pleinement le virage serviciel indiqué par le numérique. Il s’agirait de développer de nouveaux outils de consultation des données, en évitant l’écueil de la standardisation qui s’opère actuellement autour des solutions offertes par la datavisualisation notamment. Il s’agirait de libérer les données des cadres trop figés qui les enferment encore trop souvent. Les acteurs de l’industrie immobilière manipulent tous les mêmes données et pourtant, ils fondent leurs analyses stratégiques sur des indicateurs de marché et des échelles différents, y compris au sein d’une même entreprise. Offrons-leur la possibilité de manipuler les données et de délimiter eux-mêmes le contour de leur propre champ d’observation ! Rendons-leur la transparence du marché ! Cela les inciterait à y concourir à leur tour.
Références:
Benyayer L.-D., Chignard S. (2015), Datanomics. Les nouveaux business models des données, France, Editions Fyp.
Desrozières A. (1993), La Politique des grands nombres. Histoire de la raison statisti
que, Paris, La Découverte, coll. « Textes à l’appui ».
GNDVF (2015), Guide d’accompagnement sur le service Demande de valeurs foncières (DVF) : http://www.groupe-dvf.fr/wp-content/uploads/2018/10/DVF-GuideAccompagnement_2017-12-01.pdf. Guide en cours de refonte et d’actualisation (avril-mai 2019).
Juillard C. (2019), Le tournant numérique des données immobilières : permanences et recompositions, étude publiée avec le soutien d'iread, de LIFTI, du PUCA et d'Urbanics
Mabi C. (2015), « La plate-forme data.gouv.fr ou l’open data à la française », Informations sociales, n°191 ; Courmont A. (2015), « Open data et recomposition du gouvernement urbain… », op. cit.