Generació d’indicadors estadístics propers als usuaris (I). L’experiència d’ Eixos.cat, observatori econòmic mòbil.

Aquest article parla de la generació d’indicadors estadístics que orientin la presa de decisió econòmica dels usuaris, a partir de dades del seu entorn geogràfic immediat. Ha estat publicat en el blog e2013 Any Internacional de l’Estadística.

Quin servei?

Eixos.cat és un observatori econòmic digital creat per l’empresa Planol.info a Barcelona el 2011. Com a tal, analitza i fa seguiment de l’activitat econòmica de les ciutats i els PAE (polígons d’activitat econòmica) per a l’elaboració d’estudis de mercat, fent servir una plataforma digital web i web mòbil. Ofereix un servei de classificació i catalogació del comerç urbà, els locals buits, les empreses, les activitats industrials, naus buides o tancades i els equipaments, edificis administratius i el transport públic, elaborat principalment mitjançant treball de camp. (http://ca.wikipedia.org/wiki/Eixos.cat)

Vam iniciar el desenvolupament de l’observatori econòmic Eixos.cat a mitjan 2010, amb l’objectiu de crear un servei d’informació adreçat als agents econòmics que operen al territori.Els oferíem una solució que els pogués ser d’utilitat en la comprensió de l’entorn geogràfic que condiciona la presa de decisió en les operacions i les inversions que realitzen.Amb alguns d’aquests agents ja hi treballàvem, i d’altres els vam visitar amb una presentació esquemàtica i una versió-demostració del servei, per saber quin interès hi podrien tenir.

Les administracions públiques locals hi estaven potencialment interessades. La majoria d’ajuntaments, per exemple, no tenien una imatge definida i actualitzada de com estaven els comerços i els PAE. Però, sobretot, perquè no podien oferir informació fiable als emprenedors i als inversors que operaven al territori que, o bé s’havien de pagar els estudis a uns preus considerables, o bé, si no s’ho podien permetre, operaven a cegues. El problema era doble: no es disposava de dades suficientment fiables per a elaborar la informació necessària, i tampoc es disposava de bons mecanismes de publicació i de navegació d’aquestes dades per part dels usuaris finals, els emprenedors i els inversors.

Les cadenes d’establiments també hi estaven interessades. Els seus caps es passaven la major part del temps voltant pel territori, tot cercant oportunitats de localització per als nous establiments. No delegaven aquesta tasca feixuga perquè no volien intermediaris, sinó estar en contacte directe amb la realitat. No es fiaven d’allò que no havien vist amb els seus propis ulls. Per això la idea de disposar d’un observatori mòbil els va semblar bé: podrien contrastar amb la realitat qualsevol informació donada per l’observatori, en qualsevol moment, allí on es trobessin.

Pel camí, ens vam trobar amb d’altres clients: emprenedors i franquiciats, interessats en l’estudi detallat de petites àrees geogràfiques, i empreses multinacionals com ara Navteq / Here i Google, que es van interessar per la contractació de la producció de dades de qualitat en grans àrees geogràfiques, que els podíem oferir dins del model de servei de l’0bservatori.

Un cop finalitzada aquesta primera prospecció entre els clients potencials, teníem un objectiu ben clar: calia cuinar informes basats en indicadors estadístics distribuïts en el territori, que permetessin detectar bones oportunitats i zones de risc elevat per a la inversió. I, per a fer una bona cuina d’indicadors, calia treballar amb bons ingredients, dades fresques i fiables, i amb un procés transparent, que l’usuari final pogués seguir i validar en qualsevol moment, en qualsevol punt del procés.

Actualment el servei d’ Eixos.cat dóna suport a la presa de decisió de tots aquests agents i els permet detectar oportunitats presents en el territori, responent a preguntes com:

On poso el meu negoci?

Funcionarà el meu negoci en aquesta localització?

Quants negocis competidors tinc al meu voltant?

Quins carrers comercials funcionen millor? quins estan deprimits?

Quins PAE tenen més atractiu per als inversors?

Quin grau d’especialització té aquesta àrea geogràfica?

Image

Imatge 1: diagrama de funcionament del servei de l’observatori econòmic Eixos.cat.

Quines dades?

Quan vam posar en marxa el servei, l’escenari d’obtenció de les dades era aquest:

– disposàvem de fonts de dades obertes de l’administració pública (el cadastre espanyol, Institut Cartogràfic de Catalunya, INE, Idescat i algunes més), la majoria provinents de les infraestructures de dades espacials, principalment, la Infraestructura de Dades Espacials de Catalunya.

– disposàvem de bones bases cartogràfiques d’ús gratuït, provinents de Google Maps, de Nokia Maps (avui, HERE) i de Open Street Map.

– tot i que disposàvem de dades de les activitats comercials / empresarials provinents de les administracions públiques locals i, previ pagament, d’alguns organismes oficials (registre mercantil espanyol, cambres de comerç), de seguida ens vam adonar que no eren dades suficientment fiables.

Per a usos determinats com és ara valorar la localització d’un negoci, o entendre com funciona una àrea geogràfica des del punt de vista comercial, cal un volum de dades considerable.

Per començar, una classificació exhaustiva de negocis competidors, negocis que afavoreixen l’activitat a establir, locals tancats o buits, oferta immobiliària de locals comercials, accessos al públic i transports públics propers, població… De fet, cal un conjunt de dades tan complet com es pugui obtenir.

Així, per tal d’oferir informació fiable a un usuari final, dins de la lògica de servei de Eixos.cat, calia superar diversos esculls.

El primer de tots, disposar de dades fiables de la localització i classificació econòmica de tots els negocis de l’àrea geogràfica a estudiar.

En termes geogràfics, els paràmetres de qualitat mínims que es demanen són aquests:

– precisió en la localització geogràfica, en metres (<20m ja comença a ser acceptable)

– dades d’actualització recent (<12 mesos)

Quan es disposa de dades d’aquesta qualitat o superior, la correspondència amb la realitat se situa en un percentatge elevat, un 80% o més. Això vol dir, ras i curt que, de cada 100 coses que es diuen, almenys 80 són veritat.

Algú pot pensar que les administracions públiques, les cambres de comerç i d’altres organismes maneguen dades d’empreses, i que això hauria de valer per a un servei com el nostre, però no és així. A continuació, us expliquem per què diem això. (veure la Nota 1, al final de l’article)

El segon escull a superar era disposar d’un sistema de visualització i consulta que permetés els usuaris poder navegar d’una forma àgil i útil entre totes aquestes dades, en temps real d’actualització, allà on es trobessin.

Per això, aquest sistema havia de ser un aplicatiu web, accessible també des de suport mòbil.

En l’actualitat, Eixos.cat opera de forma normal sobre una infraestructura de dades, un conjunt de fonts de dades disperses en el territori, provinents d’organitzacions diverses, públiques i privades, que aporten informació complementària, en mode generalment gratuït, però també en mode de pagament.

Alhora, Eixos.cat també comparteix dades i bases cartogràfiques pròpies en aquestes infraestructures de dades.

Aquestes són les fonts de dades principals que fa servir Eixos.cat:

Dades de captació directa mitjançant treball de camp

Són dades capturades sobre el terreny per un operari tècnic, mitjançant un aplicatiu instal·lat en un dispositiu mòbil.

Bases cartogràfiques IDE / WMS (servei web de mapes)

Google Maps –> no descarregable, ús mòbil on-line

Nokia Maps –> no descarregable, ús mòbil on-line

Open Street Map –> descarregable, ús mòbil on-line / off-line

Cadastre espanyol –> descarregable, ús mòbil on-line / off-line

ICC –> descarregable, ús mòbil on-line / off-line

Open Data

Cadastre espanyol

Registre municipal d’empreses (provinent d’altes i baixes de llicències d’activitat i tributs municipals)

Equipaments públics i edificis administratius (gencat.cat)

Transports (gencat.cat)

Estadístiques de població de l’ Idescat

Sensors electrònics

Encara en proves, però les espectatives són molt altes en la mesura que:

– constitueixin una malla de punts suficientment densa i extensa

– se serveixin les dades directament des d’un servidor web, en un flux constinu, amb el mínim filtrat possible respecte de la dada original generada pel sensor.

Els sensors electrònics poden estar distribuïts en el territori, a mode de malla de punts fixes que emeten dades les 24 hores del dia, o bé poden estar integrats en dispositius mòbils, com és el cas del sistema Roadroid, que capta l’estat del paviment de les vies per a vehicles i les voreres per a vianants, a partir del sensor de gravetat del dispositiu mòbil. (www.roadroid.com)

roadroid

Imatge 2: vista sobre el mapa de l’estat de les vies de trànsit de vehicles de l’Eixample de Barcelona.

Quins indicadors?

A Eixos.cat utilitzem una quinzena d’indicadors d’especialització en l’activitat econòmica, que agrupen cadascun al voltant d’una desena de sub-indicadors.

Els indicadors que produeix l’observatori econòmic Eixos.cat depenen de:

– l’extensió geogràfica de la capa de dades

– la continuïtat / exhaustivitat geogràfica

– la classificació única, amb sub-índex comparables i agrupables

A partir d’aquests indicadors i sub-indicadors primaris, definim indicadors que es deriven del creuament dels sub-indicadors entre ells, i que donen lectures complementàries en les àrees geogràfiques estudiades.

Són aquests:

“Clusters” o nuclis geogràfics d’especialització econòmica, que agrupen els negocis que exerceixen la mateixa activitat comercial dins d’una mateixa àrea geogràfica, que varia depenent de l’escala a la que es realitza la consulta.

IATC, índex d’aprofitament del teixit comercial, percentatge de locals comercials ocupats per negocis vs. el total de locals comercials d’una àrea geogràfica donada.

IAC, índex d’atracció comercial, percentatge d’establiments comercials de venda de productes i serveis d’ús no-quotidià vs. el total de locals comercials d’una àrea geogràfica donada.

IATPAE, índex d’aprofitament del teixit del PAE

IAPAE, índex d’atracció (d’inversió) del PAE

Com funcionen?

Al 2012 vam fer una campanya de recollida de dades, mitjançant treball de camp, que ens va permetre tenir dades del comerç de tot el territori Català: de totes les capitals de província i de comarca, i de totes les ciutats de l’àrea metropolitana de Barcelona.

A priori ja havíem establert uns mecanismes de classificació que poguessin orientar lectures d’interès en clau econòmica, els indicadors. El fet de disposar d’una massa de dades suficient per a ser crítica, ens va permetre aplicar els indicadors i entendre’n el comportament.

Així, vam veure que certs valors d’aquests indicadors econòmics eren crítics, i definien àrees de canvi en el paisatge comercial.

Per exemple, estudiant el paisatge comercial en termes de negocis oberts i negocis tancats vam observar que hi havia una tendència molt clara que canviava en funció de la mida del municipi i de com de rural o urbà era el paisatge.

La tendència era a tenir un percentatge de locals oberts major com més petit era el municipi i més rural era l’entorn.

Alhora, en àrees urbanes majors i més denses, com ara l’Eixample de Barcelona, la tendència era a tenir més locals tancats o buits en proporció al total de locals comercials.

Una possible bona explicació per aquest comportament de l’indicador era en termes d’ “espectatives comercials”. En zona rural, les espectatives comercials no serien tan altes com en el centre d’una gran ciutat, i la tendència seria a generar poques oportunitats d’establiment de negoci, pocs locals comercials, però a aprofitar-los tots amb comerç de productes de primera necessitat (alimentació i d’altres productes de consum quotidià).

D’altra banda, també vam poder observar que, a densistat comercial i urbana semblant, no totes les àrees es comportaven igual, indicant que algunes eren més exitoses que d’altres en termes comercials. Ho vam començar a quantificar amb l’índex d’aprofitament del teixit comercial.

L’índex ens permetia establir una relació directa entre les espectatives comercials d’una zona, reflectides en el total de locals comercials disponibles, i la realitat comercial de la mateixa, els locals comercials realment ocupats sobre el total dels disponibles.

Vam observar que la distribució de resultats, la oscil·lació de valors de l’IATC en el territori, no tenia un comportament linial, els valors finals no es distribuïen homogèniament entre tots els valors possibles (10%,20%,30%,40%…), fet que era d’esperar, i això ens va permetre anar una mica més enllà en la definició de certs valors crítics per a l’indicador.

D’entrada, una tendència general observable era que l’ocupació de locals es mantenia sempre per sobre del 50%, és a dir, que hi havia un cert límit a la divergència entre espectatives i realitat.

També vam poder observar que hi havia zones a on les espectatives s’ajustaven millor a la realitat, amb un valor de IATC més proper a 100%, i d’altres zones on, tot i tenir valors per sobre del 50%, aquests valors s’allunyaven dels valors establerts per a les primeres, però no se n’allunyaven progressivament.

Les zones que anaven bé, comercialment parlant, tenien valors propers al 90% i les zones que no anaven tan bé, tenien valors propers al 70%, però cap d’elles tenia un IATC de 80%.

Aquest valor, el 80%, semblava establir una mena de sotrac o pendent més pronunciada, de manera que, quan l’ IATC d’una zona el vorejava (82%, 77%), si portava tendència ascendent o descendent, súbitament es podia trobar a l’altra banda, sense romandre en el 80%.

Això ho vam fer servir per a establir un valor crític per a l’ IATC, una línia vermella que vam anomenar “efecte persiana“, si els valors eren per sota de 80%, i “expectatives comercials realitzades“, si els valors eren per sobre del 80%.

Que no calia arribar al 50% per a tenir “efecte persiana”, era quelcom que suposàvem i que ara havíem pogut quantificar.

locals_buits

Imatge 3: vista sobre el mapa de locals tancats o buits de l’Eixample de Barcelona.

Com són de propers als usuaris?

Actualment treballem en la posta en marxa d’ EIXOS mobile, el primer observatori econòmic mòbil que ha de permetre fonamentar la presa de decisió econòmica a peu de carrer i amb dades de l’entorn geogràfic de l’usuari.

Aquí us deixem una imatge, a mode d’aperitiu i punt i final de l’article, per a que veieu quina cara fa un servei d’indicadors estadístics basat en la localització geogràfica de l’usuari:

eixos2

Imatge 4: EIXOS mobile

Nota 1

Les administracions públiques locals (ajuntaments, diputacions), els governs i organismes regionals i estatals (registre mercantil, INE, etc.) operen amb bases de dades de tributs i llicències d’activitat (altes i baixes d’activitat econòmica d’empreses i autònoms). Les cambres de comerç, en la mesura que usufructuen aquestes bases de dades per a crear els seus productes de base de dades, també ofereixen dades d’aquesta procedència.

Aquestes bases de dades tenen diverses limitacions a l’hora d’oferir informació d’alta qualitat geogràfica i, per tant, amb un elevat percentatge de correspondència amb la realitat, des del punt de vista d’un usuari final que vol saber què està passant en una àrea geogràfica concreta. Són aquestes:

– hi ha negocis que inicien l’activitat sense haver informat a les administracions, impossibles de detectar si no es fa inspecció directa (com a mínim: -5% de fiabilitat)

– tot sovint els propietaris no informen de les baixes d’activitat (de mitjana, anualment: -10% de fiabilitat)

– no inclouen els locals tancats o buits, allotjament de negocis potencials que es troben ara desocupats o amb un ús no comercial. (de mitjana: 20% del total de negocis, -20% de fiabilitat)

– si es treballa sobre dades publicades per algun organisme públic (per exemple, el registre mercantil) normalment, les dades són de fa més de 12 mesos (de mitjana: -15% de fiabilitat) i, a més, no inclouen les dades dels autònoms (més del 50% del total d’activitats; posem: -50% fiabilitat).

– en molts casos, sols es disposa del nom fiscal del negoci, però no del nom comercial, que és el que permet identificar l’activitat des del punt de vista de l’usuari (de mitjana: 20% dels negocis enregistrats amb el nom fiscal, sense el nom comercial, -20% fiabilitat)

– en molts casos, sols es disposa de l’adreça fiscal del negoci, que és la de la seu central en el cas de cadenes d’establiments o negocis amb filials, o bé acostuma a ser el domicili del propietari del negoci i no l’adreça real del local comercial / nau empresarial (l’adreça a on el propietari vol ser contactat per a temes administratius/tributaris) (de mitjana: 20% enregistraments amb adreça fiscal, -20% fiabilitat)

En el millor dels escenaris possibles, suposant que l’enregistrament de negocis inclogui el nom i l’adreça comercials en tots els casos (dades identificatives del negoci a peu de carrer) i que les dades siguin recents (amb data d’actualització dins dels 30 dies anteriors a la data en que es realitza la consulta) la pèrdua de fiabilitat seria d’un 40%, que caldria restar a la fiabilitat de partida, que mai no seria del 100% (el 100%  és la realitat mateixa) sino, posem per cas, d’un 95%.

És a dir, en aquest escenari en condicions òptimes disposaríem d’unes dades que tindrien un 55% de correspondència amb la realitat.

Doncs bé, capturant aquestes dades amb mitjans d’inspecció directa, mitjançant treball de camp, la fiabilitat de partida no inclou tots aquests supòsits de condicions adverses i, per tant, seria d’un 95%.