Experimentando con minería de datos
La minería de datos es un proceso de computación que busca patrones en grandes cantidades de datos. Este proceso ha sido utilizado con algoritmos en conversaciones de Twitter, llamadas de teléfono, patrones de viaje, documentos de salud, entre otras cosas. Esto nos permite comprender mejores cosas como la comunicación, los viajes y la salud.
Pero a la minería de datos se le ha escapado otro grupo de datos históricos un poco más complejo: las fotografías.
Shiry Ginosar de la Universidad de California, Berkely decidió aceptar el reto junto con algunos compañeros y comenzó con una base de datos muy simple – anuarios escolares con fotos desde 1905 que han sido digitalizadas.
El equipo descargó más de 150 mil fotografías de anuario y se quedaron con 37 mil luego de eliminar las que no estaban tomadas con un ángulo completamente frontal. Revisaron más de 800 mil anuarios de 26 estados de EE.UU.
Luego agruparon los retratos por cada década y superpusieron las imágenes para conseguir una cara ‘aproximada’ para cada período, incluyendo también rasgos como peinados, estilos y vestimenta.
Los resultados llevaron a un rasgo en particular.. la sonrisa
Esta imagen contiene un conjunto de rasgos aproximados para cada una de las décadas para hombres y mujeres.
Un rasgo muy particular que se pudo notar en la evolución de las fotos fue la sonrisa. Ginosar y su equipo dicen que en los años después del invento de la fotografía, la mayoría de las personas adoptaron la misma pose que hubieran utilizado para un retrato en pintura – una expresión neutral que se pudiera mantener por un largo período.
«Estándares de etiqueta y belleza dictaban que la boca debía de mantenerse pequeña», por lo que no tenían una amplia sonrisa.
Pero eso cambió en el siglo 20 cuando la fotografía se hizo más popular. Particularmente la compañía Kodak utilizó la publicidad para popularizar la idea de sonreír en las fotos para las imágenes grabaran momentos felices.
«Hoy en día tomamos por sentado que tenemos que sonreír cuando nos van a tomar una foto» Explican Ginosar y su equipo.
Los datos lo prueban todo
El equipo creó un algoritmo para determinar el grado de la curvatura de los labios en las fotografías y comprobó que la sonrisa aumentaba de intensidad con el paso del tiempo.
La data también reveló otra tendencia. «Las mujeres sonríen significativamente y constantemente mucho más que los hombres». Y este descubrimiento ya ha sido discutido durante años.
Sin la técnica de Ginosar, esto sólo se pudiese haber comprobado manualmente, analizando miles de fotos.
«Con el uso de una gran colección de data y un simple detector de sonrisas llegamos a la misma conclusión con un proceso mínimo de anotaciones y ningún esfuerzo manual».
Además de muchos otros cambios en tendencias que encontraron, como los estilos de peinados, encontraron un dato curioso y es que los hombres siempre vestían de traje mientras que la vestimenta de las mujeres cambiaba cada década.
Lo cierto es que es increíble la cantidad de información que se puede encontrar en el análisis de la fotografía.
Sin embargo, la evolución de la sonrisa y los estilos de peinados apenas comienza.