Cálculo de precios medios de oferta de alquiler con web scraping: el ejemplo de Baleares

/

/

,

Tal y como se comentaba en un artículo anterior, no existe una estadística de precios de alquiler única, robusta y fiable a la que dirigirnos para saber qué está pasando en el mercado de vivienda habitual en régimen de alquiler. Sin embargo, en algún momento es posible que resulte necesario determinar los precios medios a los que se están ofreciendo las viviendas de alquiler. Aquí se propone una metodología propia para hacerlo.

Existen muchas formas de hacer esto, pero gracias a Internet y las nuevas tecnologías es relativamente fácil conseguir algunas cifras de referencia bastante sólidas: los datos están ahí y todo lo que hace falta es una buena estrategia para conseguirlos, tomar algunas decisiones en cuanto a la forma de procesarlos y, por supuesto, ser siempre conscientes de las limitaciones de las que pueden adolecer tanto la información obtenida como la metodología seguida.

A continuación propongo una forma para hacerlo y, además, aprovecho para ilustrarla realizando todo el procedimiento propuesto para determinar los precios medios de alquiler de vivienda habitual en Baleares.

1. Elección de una fuente de datos

La primera decisión a tomar es, precisamente, de dónde obtener los datos. Dado que se trata de precios de oferta de alquiler, habría que determinar dónde se encuentran dichas ofertas o, dicho de otro modo, dónde se publicitan los alquileres.

Las ofertas aparecen en distintos medios y formatos: inmobiliarias, carteles, anuncios clasificados en periódicos y prensa especializada, grupos en diferentes redes sociales, portales inmobiliarios, etc. Como de lo que se trata es de conseguir el mayor volumen de datos posible y que, además, estén estructurados (compartan una información mínima equivalente) está claro que la mejor opción son los portales inmobiliarios. En cuanto al otro requisito, que es obtener el mayor número de datos, habrá que investigar un poco en cuanto al total de anuncios disponibles en cada plataforma. El resultado de esta comparativa para el caso de anuncios de alquileres de vivienda en Baleares es el siguiente:

Por lo tanto, es evidente que Idealista dispone de más anuncios y, por ello, de más propiedades en alquiler para obtener sus datos, por lo que a priori puede proporcionar una visión más completa y acertada de los precios de oferta de alquiler de viviendas.

Si lo que interesa es tener el máximo número de anuncios, ¿no sería mejor extraer todos los anuncios disponibles de las distintas plataformas para contar, así, con muchos más datos? En teoría sí, pero el problema es que muchas propiedades se anuncian en más de una plataforma, por lo que se estarían sobreponderando en el cálculo al estar repetidas. No hay ningún sistema automático que permita, con absoluta certeza, detectar y eliminar estas duplicidades, por lo que se ha optado por tomar una única plataforma, la más populosa, para tener una colección de datos más consistente.

Queda un problema más por solventar: la posibilidad de que también haya anuncios repetidos de una misma finca dentro de una única plataforma. Esto puede suceder especialmente en el caso de anuncios publicados por agencias inmobiliarias, dado que varias pueden estar ofreciendo la misma vivienda. Sin embargo, como las inmobiliarias pagan a las plataformas por poner los anuncios, existe un estímulo importante para no repetir su publicación.

2. Obtención y captura de los datos relevantes

La captura de los datos es un proceso conceptualmente muy sencillo, pero que si se tiene que hacer manualmente puede ser tedioso y largo cuando nos enfrentamos a un listado muy largo de anuncios. Por lo tanto, aunque se pueda hacer así, recorriendo página tras página de la plataforma y copiando los datos principales a una hoja de cálculo, lo cierto es que hacerlo de esta forma supone consumir mucho tiempo y es, además, un procedimiento en el que resulta muy fácil que se cometan errores de transcripción.

Por lo tanto, lo ideal es hacerlo de forma automática, mediante las distintas técnicas de web scraping, que permiten capturar datos presentes en una web y extraerlos de forma agrupada a otros formatos que permiten su explotación. Una tarea repetitiva, sin valor añadido y propensa a los errores se convierte así en un procedimiento automático, que puede completarse en una fracción de tiempo y sin errores.

La web de Idealista contiene diferentes medidas técnicas orientadas, precisamente, a evitar las técnicas de scraping, pero con un poco de imaginación puede lograrse el mismo resultado. En el caso concreto de la captura de datos de ofertas de alquiler de vivienda en Baleares, he diseñado y programado un bot (en la jerga de Internet, un robot lógico, un pequeño programa, para entendernos) muy sencillo que recorre secuencialmente todas las páginas de anuncios y las va almacenando localmente. Así se obtiene la colección de datos en bruto.

A continuación, un segundo programa hecho a medida recorre todas esas páginas web guardadas, identificando cada anuncio y extrayendo la información relevante a una hoja de cálculo sobre la que trabajar posteriormente. Estos programas se conocen también como parsers, que procesan datos y los devuelven en el formato deseado.

Es muy importante aquí capturar los datos relevantes y únicamente estos, porque, precisamente, la legalidad de las técnicas de scraping depende precisamente de su finalidad. Es importante evitar la captura y tratamiento de datos de carácter personal, ya que la normativa aplicable no ofrece dudas al respecto. En este sentido, si lo que interesa es construir una estadística de precios, los datos necesarios que deberían capturarse son los siguientes:

  • Un identificador único de cada anuncio, por si se hacen capturas consecutivas.
  • La tipología de la vivienda (chalet, piso, apartamento, casa…).
  • La ubicación nominal de la misma (municipio, barrio, sin necesidad de mayor detalle).
  • El precio de alquiler mensual.
  • Los metros cuadrados de la vivienda (necesarios para calcular el precio mensual en €/m²).

Con todo lo anterior, se ha conseguido condensar todo el listado de anuncios de una web en una simple hoja de cálculo que recoge, de forma estructurada, únicamente los datos relevantes para hacer las operaciones aritméticas y estadísticas necesarias para obtener una visión de los precios de oferta de vivienda en alquiler en el ámbito geográfico que nos interese.

Por completar este punto, en relación a las técnicas de scraping, insistir en que existen distintas herramientas, incluso comerciales, para realizar esta captura y procesado de datos de distintas webs. En este caso en concreto, he optado por programar directamente un pequeño conjunto de herramientas propias, pero que quede claro que no saber programar no es hoy un obstáculo para beneficiarse de estas técnicas.

De hecho, otras páginas web hacen negocio, precisamente, proporcionando estos datos así obtenidos a terceros, que pagan por acceder a ellos. El big data es un negocio floreciente: obtener listados de precios permite a las empresas tener políticas de pricing o fijación de precios activas, y conseguir además inteligencia competitiva respecto a lo que están haciendo otras empresas del mismo sector. Además, estas grandes colecciones de datos permiten entrenar inteligencias artificiales.

De hecho, Idealista ofrece productos de big data y una API precisamente para poder hacer todo esto de una forma inmediata con sus propias herramientas: Idealista/data. La mayoría de estos servicios son de pago y funcionan mediante suscripción. Otro día hablaré del reverso oscuro del big data, como puede ser el scoring y lo que puede suponer para los ciudadanos.

En cuanto a su legalidad, parece ser que la jurisprudencia empieza a establecer que, en tanto no afecte al normal funcionamiento de la web de la que se extraen los datos (en el sentido de evitar el equivalente a un ataque de denegación de servicios o DoS) y no se capturen ni procesen datos de carácter personal, que requerirían de una autorización previa de su titular, no hay problema en el uso de las técnicas de scraping, dado que, al fin y al cabo, son datos accesibles de forma pública.

3. Selección de los anuncios relevantes

Con todo lo anterior hemos conseguido una foto exacta del total de los anuncios disponibles en la plataforma en una fecha concreta. En el ejemplo, se han obtenido todos los datos de alquiler de vivienda en Baleares publicados en la plataforma y disponibles el día 14 de junio de 2022.

Siguiendo con el caso concreto de Baleares, el resultado del proceso anterior proporciona una tabla con 2.135 filas que recoge ubicación, tipología, precio de alquiler mensual y superficie de las viviendas que se ofrecen en alquiler.

Procede a continuación analizar primero de una forma cualitativa esos datos, de cara a establecer después las hipótesis necesarias para quedarnos con aquellos relevantes para realizar los cálculos oportunos.

Revisando los datos de alquileres obtenidos se observa que, en realidad, confluyen en el listado anuncios de alquiler de vivienda habitual con otros que son de temporada. Además, hay desde fincas rústicas y chalets de lujo en primera línea de mar hasta pequeños estudios en zonas más humildes.

Resulta evidente, por tanto, que hay que filtrar los datos obtenidos para acercarnos al objetivo perseguido en el ejemplo: determinar los precios medios de vivienda de alquiler, entendidos como los correspondientes a vivienda más utilitaria, capaz de cubrir las necesidades de las familias.

Para conseguirlo, hay que fijar una serie de criterios adicionales y, por supuesto, que estos vengan acompañados por un buen razonamiento que justifique la exclusión de los anuncios que no se utilizarán para calcular los precios medios.

No hay que llamarse a engaño: cada uno de estos criterios supone introducir un sesgo sobre la muestra original, por lo que es necesario hacerlo con una lógica adecuada y tener siempre muy presente el efecto que tendrá sobre la determinación de los valores buscados.

En el ejemplo, se han aplicado de forma consecutiva las siguientes hipótesis o criterios:

  • Limitar el listado a aquellas viviendas con una superficie menor o igual a 120 m², entendiendo que las que son mayores a este tamaño pueden corresponder al sector lujo o, como mínimo, superar las necesidades que puede tener una familia media. Por definición, viviendas más grandes serán más caras, y el objetivo de este trabajo es determinar un precio medio de alquiler de vivienda habitual que pueda considerarse de entrada, satisfactorio. Aplicando este criterio, la muestra se reduce de 2.135 anuncios a 1.070, un 50%.
  • Tomar únicamente las viviendas en edificios plurifamiliares, que en la terminología de Idealista son aquellas con tipologías “piso” o “estudio”. Se entiende que pisos y estudios serán en general más asequibles que otras tipologías, como “chalet” o “casa pareada”. Al aplicar este filtro, la muestra se reduce a 847 anuncios, un 40% de la muestra original.
  • Seleccionar los anuncios que tengan un precio por m² inferior a la media, o, lo que es lo mismo, quedarse con las viviendas proporcionalmente más baratas, precisamente para insistir en la idea de que se trata de determinar un precio medio mínimo. Al añadir este criterio al listado obtenido en el punto anterior, el listado se reduce hasta los 576 anuncios, un 27% del listado original.

Sería deseable disponer de alguna forma para discriminar el alquiler de temporada o vacacional del alquiler de vivienda habitual, pero con la estructura de datos de Idealista no se puede hacer algo así con un filtro automático sencillo. Por lo tanto, se asume que los alquileres de temporada se centran en otros tipos de viviendas y que, además, siempre serán más caros que los de vivienda habitual, por lo que no superarán el filtro del precio por m² por debajo de la media.

Está claro que con el uso acumulativo de estos criterios se está rebajando la media aritmética que se habría obtenido en el listado original, pero se hace aquí para conseguir un precio medio de alquiler que sirva de referencia como precio de entrada, es decir, del rango de precios más asequible de entre todo lo anunciado.

Es necesario también comprobar que la muestra sea significativa, que tenga un número suficiente de anuncios como para que los cálculos que se realizan sobre ella tengan sentido y puedan resultar estadísticamente relevantes para caracterizar el mercado en su conjunto.

La cifra de 576 anuncios de alquiler de pisos baratos de hasta 120 m² parece razonable para caracterizar el total de ofertas, dado que supone algo más de una cuarta parte de todos los anuncios de alquiler disponibles en la plataforma, por lo que se supera este criterio

En el caso de que no se superase, habría que replantear las hipótesis de filtrado, para hacerlas menos exigentes o, en todo caso, asumir que no se puede hacer el cálculo de este precio medio de vivienda relativamente asequible.

4. Cálculo del precio medio y otras estadísticas relevantes

Sobre el listado de anuncios que ha superado los criterios de filtrado y selección indicados, se calculan -ahora sí- las diferentes estadísticas que nos interesan. El promedio o la media aritmética de los precios, tanto de la vivienda completa como por m², son los principales estadísticos. Pero conviene añadir otros que nos permitan caracterizar un poco mejor la diversidad de los anuncios.

En la siguiente tabla se incluye una propuesta de las estadísticas que podrían recogerse, junto con el valor correspondiente a la muestra de anuncios.

Indicador/ mes/ m²
Promedio1.125,23 €89,48 €12,80 €
Q1 – 25%880,00 €75,00 €10,68 €
Q2 – 50% – Mediana1.100,00 €90,50 €12,70 €
Q3 – 75%1.300,00 €104,00 €15,00 €
Moda1.200,00 €100,00 €10,00 €
Mínimo450,00 €35,00 €5,61 €
Máximo2.100,00 €120,00 €18,75 €
Desviación típica307,03 €19,85 €2,88 €
Estadísticas de ofertas de alquiler de vivienda en Baleares

Se podrían incluir otros estadísticos calculados sobre los mismos datos, aunque los indicados aportan suficiente información como para entender mínimamente la estructura de la oferta de viviendas en alquiler en Baleares.

También es oportuno representar gráficamente los distintos valores mediante un histograma. A continuación se presenta el resultado en intervalos de precio de 100 €.

Histograma precios oferta alquiler Baleares - junio 2022
Histograma de precios de oferta de alquiler de vivienda en intervalos de 100 €

Como puede verse, la mayoría de anuncios se centran en el intervalo central, como suele ser habitual. De hecho, los alquileres con un precio de entre 800 € y 1.400 € concentran el 70% de los anuncios, siempre de acuerdo con los criterios de filtrado vistos.

La gráfica anterior parece identificar dos polos separados: hay muchos anuncios de pisos de entre 800 € y 1.000 € y hay muchos anuncios de pisos de entre 1.200 € y 1.400 €. Por buscar una explicación rápida, se pueden plantear dos hipótesis:

  • O bien hay dos categorías de pisos, unos más utilitarios en el rango más bajo y otros con una calidad o tamaño diferenciados en torno al rango más alto.
  • O bien puede ser el resultado de lo heterogéneo que resulta el mercado entre islas o incluso dentro de estas.

Para aclarar este aspecto se debería hacer un análisis territorializado, que excede el espacio disponible para realizar este estudio.

Por completar la gráfica anterior, se presenta también un histograma con valores acumulados, que permite una interpretación sencilla de algunas cuestiones:

Histograma acumulado de precios de oferta de alquiler de vivienda, en segmentos de 100 €.
Histograma con precios acumulados por rango.

La interpretación de este gráfico es sencilla: si tomamos la barra correspondiente a 800 €, a la que corresponde un valor del 26%, quiere decir que un 26% del total de los anuncios corresponde a precios inferiores a 900 €. Del mismo modo, se ve que el 80% de todos los anuncios tienen un precio inferior a 1.400 € mensuales.

5. Interpretación de los datos

La interpretación de estos valores debe hacerse con una cierta prudencia, atendiendo a la subjetividad que suponen los criterios del filtrado añadidos en el punto anterior. Ésta es, al fin y al cabo, la parte más importante: extraer conclusiones sobre los datos obtenidos.

A la vista de las estadísticas calculadas, se puede llegar a las siguientes conclusiones:

  • El precio medio de oferta de los alquileres de pisos y estudios en Baleares, tomando únicamente la mitad más barata de todo el listado de anuncios, se sitúa en 1.125 €/m².
  • El precio de alquiler más habitual (más repetido) es de 1.200 € mensuales (moda).
  • El precio por metro cuadrado, en los mismos términos, se fija en 12,80 €/m².
  • Una cuarta parte de los alquileres ofrecidos, partiendo siempre de la mitad cuyo precio está por debajo de la media del conjunto, queda por debajo de 880 € (valor del primer cuartil, Q1, 25%).
  • El promedio del tamaño de estos pisos se sitúa en 89,48 m².

Se podrían extraer otras conclusiones, añadiendo otros elementos de información, pero requieren de una mayor elaboración o de su relación con estadísticas adicionales.

Una conclusión que resulta evidente es que las ayudas al alquiler previstas por el Plan Estatal de Vivienda 2022-2025 y el Bono Joven, de acuerdo con lo previsto en el Real Decreto 42/2022, de 18 de enero, por el que se regula el Bono Alquiler Joven y el Plan Estatal para el acceso a la vivienda 2022-2025, solo subvencionan alquileres de hasta 600 € mensuales, importe que puede incrementarse de forma justificada por parte de las CCAA hasta 900 € mensuales. De acuerdo con los datos obtenidos, solo un 32% de los pisos más baratos del mercado cumplirían este criterio, por lo que la mayoría de familias que formalicen ahora un contrato de alquiler en estas condiciones no podrán beneficiarse de estas subvenciones. Debo insistir de que el listado obtenido corresponde a los pisos cuyo precio está por debajo de la media, por lo que sobre el conjunto del mercado, sin filtrar los anuncios, los precios de hasta 900 € suponen apenas un 11% de la oferta de alquiler de vivienda durante el mes de junio de 2022.

De hecho, la metodología aquí explicada es la que se utilizó para que el Ministerio permitiese aumentar el precio máximo de alquiler para estas ayudas, establecido en 600 € / mes, hasta 900 €, de acuerdo con lo que prevé el Plan Estatal (artículos 8 y 28 del Real Decreto 42/2022).

Artículo 8. Renta arrendaticia o precio de cesión.
La renta arrendaticia o precio de cesión de la vivienda objeto del contrato de arrendamiento o cesión deberá ser igual o inferior a 600 euros mensuales. En esta renta o precio no se incluye el importe que pudiera corresponder a anejos tales como plazas de garaje, trasteros o similares. En el caso de alquiler de habitación esta renta o precio deberá ser igual o inferior a 300 euros mensuales.
Las comunidades autónomas y las ciudades de Ceuta y Melilla podrán incrementar este límite máximo de la renta arrendaticia o precio de cesión hasta 900 euros mensuales cuando así lo justifiquen en base a estudios actualizados de oferta de vivienda en alquiler que acrediten tal necesidad. En el caso de alquiler de habitación este incremento de límite máximo de la renta arrendaticia o precio de cesión podrá ser hasta 450 euros.

Conclusión

Dejando aparte las conclusiones concretas sobre el ejemplo de Baleares, lo cierto es que las técnicas de web scraping permiten obtener con un coste mínimo grandes colecciones de datos actualizados de las que extraer estadísticas relevantes para la toma de decisiones y la gestión. En el ejemplo visto se ha procesado un volumen modesto de datos, pero no habría inconveniente en hacer algo equivalente a mayor escala, o incluso realizar de forma periódica y repetida este proceso para determinar cuál es la evolución de cada uno de los indicadores.

En el caso concreto de Baleares, se podría obtener así una evolución de estos precios de alquiler de pisos como vivienda habitual en la franja baja de precios, para ver cuáles son las tendencias de fondo e, incluso, poder también aislar el fenómeno de la estacionalidad, que normalmente no se puede aislar estadísticamente al no tener una serie lo suficientemente larga y detallada de precios. Metodologías como X-12-ARIMA permitirían, si se dispone de una serie mensual, desestacionalizar los datos y obtener las tendencias subyacentes, e incluso obtener -con todas las precauciones oportunas- un modelo predictivo que, probablemente, sería válido como mínimo a corto plazo.

De hecho, como este trabajo se realizó con una metodología idéntica en marzo de este año, se puede hacer una primera comparativa de aquellos datos con los de junio recién obtenidos. Se reflejan en la tabla siguiente los principales valores y su evolución:

IndicadorMarzo 2022Junio 2022Variación
Anuncios totales3.0862.135-30,82 %
Anuncios incluidos1.535576-62,48 %
Precio mensual (€/mes)1.010,00 €1.125,23 €11,41 %
Precio m² (€/mes x m²)11,77 €12,80 €8,75 %
Evolución de precios de oferta de alquiler de vivienda en Baleares

Se observa fácilmente que en tres meses ha habido una reducción significativa del total de anuncios y también, dentro de estos, de los que cumplen los criterios de vivienda empleados en el estudio. Esto es, hasta cierto punto, previsible, dado que en marzo todavía no ha empezado la temporada turística y hay mayor oferta, al ser el momento previo a la llegada tanto de turistas como de trabajadores de temporada. Además, los anuncios en junio incluyen muchos más alquileres turísticos y de temporada, lo que explica estos datos. Adicionalmente, la reducción de oferta y el aumento de la demanda tensan los precios al alza, recogiendo -siempre de acuerdo con esta metodología- un aumento de precios de más del 11% en tan solo tres meses.

De forma gráfica, queda muy claro que poco se parecen los mercados de marzo y junio, tal y como puede comprobarse en el siguiente gráfico:

Totalización anuncios por rango de precios: marzo y junio.
Número de anuncios por rango de precios. Marzo (gris claro) y junio (gris oscuro).

Como se observa a simplevista, en marzo había más alquileres ofertados y sus precios no superaban los 1.500 €. En junio los precios máximos se han desplazado a la derecha y el número total de anuncios es sensiblemente menor. Se muestra también la misma forma de la curva, en el sentido de que los precios entre 1.000 y 1.100 € son menos populares que los inmediatamente inferiores y superiores. De nuevo, esto alimenta la teoría de que hay un doble mercado, bien sea por la tipología de los pisos, o bien por cuestiones geográficas, correspondiendo un pico a las islas y ciudades más asequibles y otro a los de aquellas con unos niveles de precio más altos.

A la vista de los datos anteriores, queda claro que una estadística adecuada que recogiese la evolución de precios de alquiler de vivienda habitual utilitaria en Baleares debería elaborarse periódicamente para poder así, además, descontar el efecto estacional que tanto afecta a una economía basada en el turismo y con una fuerte estacionalidad. Solo así se podría obtener una imagen clara de cual es la tendencia de fondo del mercado, si bien resulta claro que es, a día de hoy, fuertemente alcista.

Siendo todavía más ambiciosos y recogiendo datos de forma continua durante un plazo más largo se podría incluso tratar de segmentar territorialmente los datos, obteniendo así precios de oferta para cada una de las islas, que, claramente, muestran comportamientos muy heterogéneos, e incluso a nivel de municipios. Podría ser la base para la elaboración de un índice de referencia de precios propio, detallado, actualizado periódicamente, al que vincular algún tipo de medida desde los poderes públicos. O, incluso, para tratar de convencer al Ministerio de que unas subvenciones a la vivienda que establecen unos precios máximos por debajo de la realidad balear son susceptibles de ser mejoradas.

Con este artículo se pretendía un doble objetivo: por una parte, demostrar la viabilidad del web scraping para la obtención sencilla de datos relevantes para la gestión de vivienda; por otra, obtener datos actualizados de un mercado concreto, como es el de Baleares, de una forma didáctica, y analizar de una forma sencilla los resultados.

A los valientes que hayan conseguido acabar esta lectura, agradecerles en todo caso el esfuerzo: no es un artículo corto ni ligero, pero me parecía valioso explicar estas técnicas e ilustrarlas con un ejemplo práctico, como es el cálculo de precios medios de oferta de alquiler de vivienda en Baleares. Por supuesto, los datos obtenidos, las herramientas utilizadas y el resto de detalles de las técnicas seguidas están a disposición de los lectores que tengan interés y contacten directamente conmigo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.