El Mundial de Rusia 2018 está siendo escenario global de nuevas tecnologías que evitan la subjetividad en la interpretación de los lances del juego como el VAR, el Ojo de Halcón (un viejo-nuevo conocido para los aficionados al tenis) o GoalRef, el chip inteligente que evita los goles fantasma.
Si hablamos de disrupción tecnológica, no hay mayor cambio que aquel que se cuela en nuestra cotidianidad y un Mundial de Fútbol es el mejor vector de contagio global, tema estrella en tantos medios de comunicación generalistas, especializados y conversaciones informales.
Un cambio menos disruptivo, más gradual, que también acapara comentarios desde muy diversos ámbitos es el constituido por la estadística aplicada al fútbol. Las retransmisiones de los partidos se acompañan de rótulos con estadísticas de posesión del balón, kilómetros recorridos, número de pases… frecuentemente relativizados por jugador o contrastados con hitos históricos.
El periodismo deportivo está transitando de la opinión, basada en un conocimiento intuitivo y basado en la experiencia, a interpretación basada en datos fehacientes.
¿De dónde salen estos datos?
Quizás el avance más llamativo lo constituye la gran especificidad y rapidez con la que se suministran esos datos al espectador, sobreimpresos en pantalla. Seguro que nos hemos preguntado en más de una ocasión cómo se recaban estos datos, quién se encarga de almacenarlos y a qué tratamiento son sometidos para conseguir tal inmediatez en su presentación de forma adecuada al contexto del momento del partido en el que se comparten con la audiencia.
La capacidad de la tecnología actual para registrar gran cantidad de datos (por ejemplo, determinar los kilómetros recorridos por determinado jugador mediante GPS) combinada con los registros de datos históricos expresados de forma computable (número de goles, de partidos jugados, jugadores que han conseguido un hat trick, veces que un jugador ha sido convocado por su selección…) hacen factible la aplicación de big data que van más allá de la presentación de datos curiosos para captar la atención del espectador o reforzar determinada percepción del juego en un momento concreto del partido (como por ejemplo, si “estamos tocando menos balón que el rival”).
El big data aplicado al deporte puede utilizarse, por ejemplo, para identificar y analizar patrones de juego, construir modelos de valoración de jugadores que eviten o limiten la subjetividad de los ojeadores, anticipar y evitar posibles lesiones, predecir el rendimiento a partir de determinadas variables… El análisis de la información es una herramienta poderosa en el ámbito deportivo. El big data persigue una mejor forma de medir, más eficaz que la estadística y con posibilidades que se atisban infinitas en este contexto.
¿Pueden aplicarse técnicas de big data a cualquier registro de información?
No es posible. Por ejemplo, una retransmisión deportiva, una crónica publicada en un periódico impreso u online o un podcast constituyen fuentes documentales que, según el caso, pueden contener datos interesantes. Pero ¿son esos datos computables? ¿es capaz un algoritmo de interpretar el lenguaje natural en el que abundan las elipsis, los dobles sentidos y los recursos estilísticos?
Probablemente no sin un tratamiento previo. Con lo que cabe preguntar ¿estamos perdiendo datos valiosos por el mero hecho de no haber sido registrado nativamente como dato computable? Es en este punto en el que la aplicación de las técnicas de gestión documental como complemento al big data puede marcar la diferencia.
El big data en la Gestión Documental
Tradicionalmente, estos documentos o soportes de información han sido tratados en las unidades de documentación de los medios de comunicación o por parte de las empresas dedicadas a la venta de bases de datos especializadas.
Técnicas documentales como la digitalización combinada con el OCR, la indexación (automática o manual), la clasificación y asignación de puntos de acceso normalizados, entre otros, son un medio para aflorar datos de documentos con un formato desestructurado o no computable.
Un indexador experto que esté realizando el análisis de contenido de la retransmisión de un partido intuirá la importancia de reseñar si, por ejemplo, partido ha sido interrumpido por un espontáneo, si determinado jugador está inmerso en alguna polémica por su vida privada, si alguno de los equipos no “se jugaba nada” en el partido o si los aficionados entonaron determinado cántico a favor o en contra de su equipo o del rival.
El experto en gestión documental sabe que el usuario de su fondo documental puede formular una demanda de información en base a estos criterios para, por ejemplo, elaborar un reportaje o preparar una entrevista.
Esta información digamos “subjetiva” resultante de este análisis documental se va incorporando a una base de datos, pudiendo ser tratada como una variable más a considerar desde la perspectiva del big data para, por ejemplo, determinar los factores que influyen en el rendimiento de la plantilla con el fin de anticiparlos y combatirlos.
Entendemos, por tanto, que los especialistas en gestión documental pueden aportar mucho al big data:
• Extrayendo datos estructurados y semi-estructurados de los documentos (también de los no textuales) e incorporándolos a una base de datos, facilitando su computación;
• Considerando elementos que solo pueden ser ponderados subjetivamente;
Tanto en el ámbito deportivo como en cualquier otro contexto en el que se maneje un alto volumen de documentos como fuente de información y se haya considerado la aplicación de técnicas de big data para la optimización de los procesos.