Elija su idioma

Elija su idioma

El sitio web se ha traducido al Español con la ayuda de humanos e IA

Desestimar

Higiene digital: Combatir la saturación de datos

5 mins de lectura
Profile picture for user Julien Coquet

Escrito por
Julien Coquet
Senior Director of Data & Analytics, EMEA

Digital Hygiene: Fighting Data Bloat

Hace unos años, a medida que el almacenamiento digital se hacía más asequible, la actitud de muchas empresas hacia los datos era "almacenarlo todo" Todo. Cada. Datos. Punto.

Luego vinieron los "grandes datos" y la computación en nube, que aportaron aún más datos, más potencia de cálculo y, aparentemente, más oportunidades y conocimientos. Como resultado, el consumo de datos se disparó, impulsado por Internet, las redes sociales y los servicios digitales.

Parafraseando a mi gurú Avinash Kaushikahora tenemos más datos de los que Dios nunca quiso que tuviéramos.

El instinto de almacenarlo todo es comprensible. ¿Por qué tirar los datos? Pero ha habido algunos efectos imprevistos:

  • Aumenta la carga de trabajo asociada a la garantía de calidad de los datos
  • Aumenta el tiempo de procesamiento de los datos
  • Hace que los conjuntos de datos sean más complejos y más difíciles de trabajar
  • La mayoría de los datos son irrelevantes para el análisis de negocio

La decisión de conservar todos los datos fue fácil. Discernir qué datos deben tenerse en cuenta es difícil. Esta fase de consideración se llevará a cabo bien cuando las empresas estén concretando un proyecto de datos (ANTES), bien cuando introduzcan una nueva versión de sus activos digitales (DESPUÉS).

Sólo para audiencias maduras

Imagina que estás elaborando la especificación de tu proyecto y pensando cómo medir su éxito. Lo más probable es que tenga en cuenta los siguientes KPI:

  • Tasa de uso de funciones clave (tasa de conversión)
  • Eficacia de marketing (presupuesto, coste por adquisición)
  • Métricas de vanidad (volumen, usuarios)

¿Le parece demasiado básico? Pues sí. Y, sin embargo, ¡es una base estupenda sobre la que trabajar!

Consejo importante: Su proyecto debe estar en sintonía con el nivel de madurez de su organización.

En primer lugar, tiene que asegurarse de que los datos básicos que pretende recopilar de su sitio web o aplicación tienen eco entre sus jefes de producto, su equipo de marketing o sus analistas. Tienen que entender cómo estos números básicos pueden ayudar a dar forma a su producto o estrategias de marketing.

A continuación, debe establecerse un documento de especificaciones. Una especie de Biblia de la recopilación de datos. Llámelo plan de etiquetado, proyecto de recopilación de datos, documento de diseño de la solución... ¡sea creativo! Ese documento no será inamovible. Evolucionará con su empresa a medida que enriquezca su conjunto de datos para satisfacer sus requisitos de medición. Asegúrese de incluir a las partes interesadas en ese proceso, o de lo contrario...

Sólo después de haber pasado por una fase de especificación de datos exhaustiva podrá plantearse enriquecer sus datos durante los siguientes ciclos de desarrollo. El enriquecimiento de datos puede ser

  • Vertical: más métricas para medir eventos específicos del usuario
  • Horizontal: más dimensiones/atributos para dar más contexto a las métricas

Siga enriqueciendo sus datos para evaluar los KPI que apoyan la medición de sus objetivos empresariales. Dales todo el contexto que puedas para que el análisis sea lo más relevante y procesable posible.

¿Sus datos despiertan alegría?

Todo esto de enriquecer los datos suena muy bien, pero es posible que te encuentres en una fase en la que ya has recopilado demasiados datos. Podría decirse que obtener una tonelada de datos significa obtener el combustible para alimentar el aprendizaje automático, inteligencia artificialo cualquier procesamiento de datos razonablemente avanzado.

Dicho esto, demasiados datos no identificados/no catalogados acabarán generando confusión y costes de almacenamiento/procesamiento. Por ejemplo, si tiene un contrato con un proveedor de análisis digital (digamos Adobe o Google), es muy probable que esté pagando una cuota de suscripción mensual/año basada en el número de visitas que su sistema recopila y procesa en informes, cubos y conjuntos de datos diversos. Además, los equipos de marketing digital no son conocidos por cuestionar el status quo cuando se trata de datos y seguimiento, en particular.

Si se combinan ambas facetas de la limpieza de datos, estamos ante una campaña de optimización que se convierte en un esfuerzo de ahorro de costes. Aquí es donde usted, como empresa, debe empezar a preguntarse: "¿realmente necesito esos datos? ¿Puede mi equipo funcionar sin medir la métrica X y el atributo Y?"

Tomando prestado de Marie Kondo konmari de Marie Kondousted debe conservar sólo los datos que le lleguen al corazón. Identifica las métricas/atributos que ya no te "alegran", agradéceles su servicio antes de deshacerte brutalmente de ellos pulsando con firmeza y satisfacción el botón SUPR.

¿Cómo puede saber si debe descartar un punto de datos específico?

Esto requiere un poco de investigación que se puede hacer en tu repositorio de datos mirando tu estructura de datos (nombres de columnas y valores, por ejemplo). Si no puede decidirse, pregúntese si un punto de datos concreto realmente "desata la alegría" o, en nuestro caso, impulsa el análisis y puede utilizarse como factor en el aprendizaje automático. De hecho, ¡ésta es una buena ocasión para utilizar el aprendizaje automático para averiguarlo!

Introduce tu conjunto de datos en R/Python (inserta aquí tu paquete de aprendizaje automático favorito) y observa los resultados:

Chart 1

También puedes considerar el análisis factorial de otra manera y ver dónde contribuye realmente un factor específico al rendimiento, métrica por métrica:

Factor Analysis

Una vez que hayas terminado de analizar qué puntos de datos todavía pertenecen a tu arquitectura de datos, es hora de podar. Si ha tomado la decisión de eliminar datos existentes, puede ser tan sencillo como eliminar una columna o un conjunto de entradas en una base de datos, un lago de datos o un repositorio de datos. Pero eso es sólo para los datos que ya ha recopilado. ¿Qué ocurre con la recopilación de datos en el futuro?

Si desea cambiar la forma en que se recopilan los datos, debe ir a konmari en sus activos digitales: seguimiento de sitios web, SDK para móviles, dispositivos OTT. Utilizando un sistema de gestión de etiquetas (TMS), puede empezar por desactivar/pausar las etiquetas que ya no necesite antes de eliminarlas de forma segura de futuras versiones:

GA Universal ID

Desde el punto de vista de la gestión, las partes interesadas deben darse a conocer y expresar claramente sus necesidades de datos que puedan recuperarse fácilmente. De este modo, cuando elimines o retires datos que ya no te interesen, no estarás saboteando sin querer los informes de tus colegas.

Por eso necesitabas la Biblia de la recopilación de datos

¿En qué fase de recopilación de datos se encuentra? ¿Antes o después? ¿Básica o compleja?

Related
Pensamiento

Acelera nuestro corazón digital

Reciba nuestro boletín con inspiración sobre las últimas tendencias, proyectos y mucho más.

Gracias por inscribirte

Continue exploring

Media.Monks necesita la información de contacto que usted nos facilita para ponerse en contacto con usted en relación con nuestros productos y servicios. Puede darse de baja de estas comunicaciones en cualquier momento. Para obtener información sobre cómo darse de baja, así como nuestras prácticas de privacidad y el compromiso de proteger su privacidad, por favor revise nuestra Política de Privacidad.

Elija su idioma

Elija su idioma

El sitio web se ha traducido al Español con la ayuda de humanos e IA

Desestimar