1. Modelación
Para interactuar con los grandes volúmenes de datos, es necesario entender el proceso que los produce. La conducta de compra, la de apareamiento y la de navegación son producidas por procesos de decisión y elección. Los modelos y métodos de las ciencias económicas y la teoría de las decisiones, de la teoría de las redes, de la teoría de la evolución, de la teoría del procesamiento de la información deben dominarse de la misma forma que los estudiantes de física dominan las Leyes de Newton. La famosa ocurrencia de Google de que “en un mundo en el que la información es gratuita y abundante usted no necesita modelos” es equivocada, porque sin un modelo del proceso subyacente que genera los datos, no tenemos manera de saber qué es relevante y qué no, ni tenemos filtros para los conjuntos de información masiva capturada. Pero necesitamos algo más que solo modelos para los fenómenos subyacentes: también necesitamos modelos de los problemas que los grandes volúmenes de datos alimentan: modelos de la algoritmia de los meta-problemas de los grandes datos.
2. Codificación
Los grandes volúmenes de datos resultan esquivos para la mayoría de los graduados de las escuelas de negocios porque están en un territorio al que no pueden acceder: están en el ciberespacio, en bases de datos dispares, codificados por protocolos y lenguajes de programación disímiles. Entonces, se gradúan sintiendo que no tienen habilidades para el juego de talento en el terreno de Big Data. La codificación como habilidad y capacidad es la “clave de acceso” al juego. Es el requisito básico.
3. Percepción
La información no se da, se produce y, en cierto sentido, se construye. Hay que sentirla, percibirla. La ciencia de la medición se dedica a convertir la calidad en cantidad, a transformar un pálpito, una intuición, una percepción, en un dato observable y medible en términos subjetivos. Los estados de ánimo importan para las maneras en que los seres humanos interactúan, como importa el ritmo, el tono y la intensidad de la voz o los niveles de azúcar en sangre. Pero hasta que no podamos medir de forma instantánea lo que pensamos que importa, nos quedaremos escribiendo documentos sobre relaciones entre variables a las que percibimos como inútiles pero que, no obstante, son fácilmente accesibles. La ciencia de la percepción, de la medición, está en sus inicios. Pero las semillas ya fueron sembradas.
Conclusión
La gran oportunidad para las empresas está en la construcción de negocios capaces de explotar y dar sentido a los terabytes de datos generados por los usuarios en el mundo digital. Los nuevos maestros de Big Data serán los reyes del ingenio.
Las 6 “V”
En 2011, el analista de Gartner, Doug Laney, acuñó la definición de las 3 V que componen el término Big Data: Volumen, Velocidad y Variedad.Hoy se han agregado nuevas “V”:
Validez, que tiene que ver con la confiabilidad.
Venue, o campo, que habla de la complejidad que deviene de tener una alta diversidad de fuentes de datos no estructurados.
Y Visualización, una herramienta útil para trasformar análisis complejos en formatos procesables.
Por ejemplo, estas herramientas permiten estudiar datos no estructurados, multidimensionales. Algunas herramientas existentes están construidas sobre HTML5 y hay hasta paquetes de soluciones como Clickview, Microstrategy, Spotfire y Tableau.
Según la consultora, la V más importante es la de valor: ¿cómo las organizaciones extraen verdadero valor de negocios sobre una base sostenible en el tiempo?
Los datos, dice Gartner, deben tener “rostro”: es necesario convertirlos en algo personal; uno debe buscar una relación que tenga significado y sentido.
Chicago lo hizo
Desde seguir estadísticas de crímenes hasta permisos de construcción de edificios, la ciudad de Chicago ha recolectado la suficiente cantidad de información para llenar más de 400 servidores. La alcaldía está usando estos datos para convertir a la ciudad en un mejor lugar para vivir. La ciudad usa software libre para recolectar datos no estructurados, como registros en tiempo real de llamados a la línea 911 e información estructurada de sistemas disímiles de 30 dependencias y departamentos del estado.
El objetivo del portal creado es darle a la ciudad una manera de combinar datos de diferentes dependencias para llegar a nuevas conclusiones. Por ejemplo, si la tasa del crimen está aumentando en un área, los analistas pueden buscar factores casuales, como la densidad de las licencias de venta de alcohol o patrones que han cambiado respecto de la protección policial. Los funcionarios pueden usar los datos para prevención.
Por ejemplo, una investigación reveló que los tachos de basura en una localidad en particular generalmente desaparecían cuando las luces de los callejones se quemaban. Si la ciudad podía reemplazar las luces más rápidamente, evitarían gastar tanto dinero en nuevos tachos.
Beth Comstock, directora de Marketingde GE
“La empresa mantiene un enorme ‘hub’ de datos que incluye la posibilidad de analizar variables para revelar información como cuánta energía gastan sus electrodomésticos y cuánto le costará al comprador utilizarlos.”
Stephen Quinn, director de Marketing de Wal-Mart
“Wal-Mart desarrolló Polaris, un motor de búsqueda semántico que estudia algoritmos para entender lo que desea la gente y, de esa manera, impulsar las ventas. Sobre ese motor está montada la tecnología que denominamos Social Genome Product (con aplicaciones varias como Shopycat, para analizar los comentarios en Facebook), que repasa miles de tuits, mensajes en Facebook, posts en blogs y videos en YouTube de la marca para detectar las intenciones de compra e impulsar el e-commerce.”
Caroline Halliwell, directora de Marketing del Financial Times
“El periódico tiene un equipo de análisis de datos de más de 30 personas divididos en tres grupos: Data Analytics & Campaigns, Data Product Development y Data Technology. Actualmente estamos usando los datos generados por nuestros lectores para aumentar la circulación del diario y crear productos publicitarios gráficos más productivos y competitivos. Todo sucede a través de nuestro sistema de registro, tenemos más de 5 millones de usuarios; cada uno debe declarar su dirección de email, dirección real, código postal, industria en la que opera y cargo. De esta manera, los anunciantes pueden, por ejemplo, dirigir una campaña publicitaria a ejecutivos en la industria de las telecomunicaciones o de RR.HH. en Brasil o cualquier otro país. El sistema también sigue el comportamiento de los lectores para que podamos convertirlos en suscriptores.”