Edward Tufte - La Representación Visual de Información Cuantitativa

April 10, 2024 | Author: Anonymous | Category: N/A
Share Embed Donate


Short Description

Download Edward Tufte - La Representación Visual de Información Cuantitativa...

Description

For Zabdiel Ramos Banda

SEGUNDA EDICIÓN

La Representación Visual de Información Cuantitativa E DWA R D R. TUFTE

Edward R. Tufte

La Representación Visual de Información Cuantitativa Traducción de Elena Abós y Lourdes Romero

Graphics Press • Cheshire, Connecticut

For Zabdiel Ramos Banda

Copyright © 2001 Edward Rolf Tufte Publicado por Graphics Press llc Post Office Box 430, Cheshire, Connecticut 06410 www.tufte.com Todos los derechos de las ilustraciones y el texto reservados a Edward Rolf Tufte. Prohibido copiar, reproducir o traducir esta obra en parte o en su totalidad sin permiso por escrito del editor, excepto extractos breves para reseñas o estudios académicos. También queda estrictamente prohibido su uso mediante sistemas de almacenamiento y recuperación, adaptación electrónica, software informático o cualquier otro método conocido, o todavía por desarrollar, sin permiso por escrito del editor. Algunas ilustraciones han sido reproducidas con permiso de los titulares del copyright mencionados en la página 197.

Índice PARTE I

PRÁCTICAS GRÁFICAS

1 Excelencia Gráfica 13 2 Integridad Gráfica 53 3 Fuentes de Integridad y Sofisticación Gráficas 79 PARTE II

TEORÍA DE LOS GRÁFICOS DE DATOS

4 Tinta Informativa y Rediseño de Gráficos 91 5 Chatarra Gráfica: Vibraciones, Cuadrículas y Patos 107 6 Maximización de la Tinta Informativa y Diseño Gráfico 123 7 Elementos Gráficos Multifuncionales 139 8 Alta Resolución en Gráficos de Datos 160 9 Estética y Técnica en el Diseño de Gráficos de Datos 177 Epílogo: Diseños para la Presentación de la Información 191

For Zabdiel Ramos Banda

A mis padres Edward E. Tufte y Virginia James Tufte En memoria de John W. Tukey (1915-2000)

Introducción a la Segunda Edición Esta nueva edición provee las muchas gráficas de William Playfair a color y en alta resolución, hemos añadido color a otras imágenes donde es apropiado, e incluye todos los cambios y correcciones acumulados durante las 17 impresiones de la primera edición. La idea de este libro se inicia en 1975, cuando Dean Donald Stokes de Princeton Woodrow Wilson School, me pidió que diera la clase de estadística a una docena de periodistas que estaban de visita ese año para aprender algo de economía. La literatura con la que contaban era poca, frecuentemente sombría y dedicada a explicar “las gráficas estándar” y el uso del tiralíneas, indiferente a la naturaleza de la evidencia visual y al razonamiento cuantitativo. Anoté una lista de lecturas, con largas secciones de gráficas estadísticas y pronto escribí algunas ideas. Después John Tukey, el fenomenal estadista de Princeton, sugirió que impartiéramos una serie de seminarios. Desde mediados de 1960, Tukey abrió el campo con sus brillantes contribuciones técnicas, dejando claro que el estudio de gráficas estadísticas era respetable y no solo acerca de gráficas de pastel y tiralíneas. Terminé el manuscrito en 1982, después de mudarme a la Universidad de Yale. Un editor estaba interesado en publicarlo, pero planeaba solamente imprimir 2000 copias y cobrar un precio muy alto, lo cual era lo contrario a mi anhelo de tener un amplio numero de lectores. También era mi interés diseñar el libro para hacerlo auto ejemplificador, es decir que el objeto físico por si mismo pueda reflejar los principios intelectuales presentados en el libro. Los publicistas se horrorizaban frente a la idea del autor diseñando el libro. Constantemente estuve buscando la posibilidad de publicarlo yo mismo; pero esto requería una cuota inicial para un diseñador de libros, mucho dinero (al menos para un joven profesor), y una cochera grande. Me encontré a Howard Gralla quien había diseñado varios catálogos para museos elaborados cuidadosamente. Él estaba dispuesto a trabajar con

For Zabdiel Ramos Banda

este complicado autor, lleno de opiniones acerca del diseño y de la tipografía. Pasamos todo el verano en su estudio trazando el libro página por página. Logramos integrar gráficas en el texto y algunas veces hasta en medio de un enunciado, eliminando la común separación de imágenes con texto, una de las ideas que “La representación Visual” defiende. Para financiar el libro saqué otra hipoteca sobre mi casa. La funcionaria del banco me dijo que este préstamo era el segundo mas inusual que había hecho. El primero había sido a un circo para la compra de un elefante. Mi perspectiva de publicarlo yo mismo era ir por todo, era hacer el mejor, el mas elegante y maravilloso libro que fuera posible sin comprometerme con nadie. De lo contrario, ¿Para que hacerlo? Por encima de todo, este libro me abrió los ojos a una perspectiva nueva y fresca para el gozo de la estética en la evidencia, el razonamiento y el entendimiento visual. Enero 2001 Cheshire, Connecticut

Introducción Los gráficos de datos representan cantidades visualmente mediante el uso de puntos, líneas, un sistema de coordenadas, números, símbolos, palabras, sombreado y color. El uso de imágenes abstractas para mostrar datos numéricos es una invención sorprendentemente reciente, tal vez porque requiere la utilización de capacidades diversas: la artística-visual, la empíricaestadística y la matemática. Los gráficos estadísticos (el uso de la longitud y el área para representar la cantidad, las series temporales, los diagramas de dispersión y los multivariantes) no se inventaron hasta 1750–1800, mucho después que logros matemáticos como los logaritmos, las coordenadas cartesianas, el cálculo y la teoría básica de las probabilidades. El extraordinario William Playfair (1759–1823) desarrolló o mejoró la mayoría de los diseños gráficos, con la intención de sustituir las tablas numéricas convencionales por las representaciones visuales sistemáticas de su “aritmética lineal”. Los gráficos de datos modernos pueden hacer mucho mas que solo sustituir por pequeñas gráficas estadísticas. En su mejor uso los gráficos de datos son instrumentos para razonar sobre la información cuantitativa. El método idóneo para describir, explorar y resumir conjuntos numéricos grandes o pequeños es estudiar las imágenes de esos números. El estudio de los datos nos permitirá analizar y comunicar información estadística con la mayor eficacia y sencillez.

La primera parte de este libro examina las prácticas gráficas desde tiempos de Playfair, hace dos siglos. Mi anhelo es que el lector pueda disfrutar de las maravillas gráficas del Capítulo 1 y condenar después los tropiezos y las oportunidades exhibidas del Capítulo 2. El Capítulo 3, sobre la integridad y sofisticación gráficas, se propone explicar las diferencias en la calidad del diseño gráfico.

For Zabdiel Ramos Banda

En la segunda parte, además de proporcionar una terminología, se establece una teoría práctica de los gráficos de datos aplicable a casi todas las formas de representación de información cuantitativa. Aplicada a la mayoría de formas de representación de información cuantitativa , la teoría nos lleva a cambios y mejoras en el diseño, sugiriendo porque algunos gráficos deben ser mejores que otros y generando nuevos tipos de gráficos. Para ello, nos basaremos en principios de maximización, en formas empíricas de medir su eficacia visual y métodos para mejorarlos mediante revisiones y correcciones. Y veremos cómo las teorías del arte, la arquitectura y la prosa aportan herramientas valiosas para evaluar la calidad del diseño gráfico.

Este libro trata del diseño de gráficos estadísticos y, por tanto, abarca los campos del diseño y la estadística. Además, explora cómo comunicar información mediante palabras, números e imágenes simultáneamente. El diseño de los gráficos estadísticos es un tema universal y, como las matemáticas, no está sujeto a las características propias de cada lengua. Tanto los conceptos descriptivos (un vocabulario para gráficos) como los principios avanzados pueden aplicarse a la mayoría de los diseños. En ocasiones demuestro el alcance de estas ideas sobre un corpus de gráficos científicos y periodísticos seleccionados al azar. Los principios de este libro atañen a la mayoría de los gráficos estadísticos publicados en el mundo, entre 900.000 millones (9 ⳯ 10¹¹) y 2 billones (2 ⳯ 10¹²). Aunque algunos cambios sugeridos son pequeños, otros son fundamentales y afectan a billones de páginas impresas. Confío en que el libro también afecte a los creadores y a los receptores de esas imágenes y cambie para siempre su forma de crear o analizar gráficos estadísticos. Con esta intención he reunido aquí numerosos ejemplos excepcionales desde las obras de Playfair, Minard y Marey hasta gráficos actuales realizados con ordenador. Por encima de todo, este libro es una celebración de los gráficos de datos.

PRIMERA PARTE

Prácticas Gráficas

For Zabdiel Ramos Banda

1

Excelencia Gráfica

L a excelencia en los gráficos estadísticos consiste en comunicar ideas complejas con claridad, precisión y eficacia. Las representaciones gráficas deben • mostrar los datos; • hacer pensar al lector sobre la información, y no sobre la metodología, el diseño gráfico, la tecnología de la producción gráfica o cualquier otra cosa; • evitar distorsionar el objetivo de la información; • presentar muchos números en poco espacio; • exponer con coherencia conjuntos de datos extensos; • inducir a la comparación entre distintas partes de los datos; • revelar la información con distintos niveles de detalle, desde la panorámica a los pormenores estructurales; • servir un propósito claro: descripción, exploración, tabulación, o decoración; • integrarse con las descripciones estadísticas y verbales de los datos. Los gráficos revelan datos, incluso con mayor precisión y claridad que los cálculos estadísticos convencionales. Observe el cuarteto de Anscombe: usa el mismo modelo lineal para describir los cuatro grupos de datos (al menos hasta examinar los residuales). ii

i x 10.0 8.0 13.0 9.0 11.0 14.0 6.0 4.0 12.0 7.0 5.0

y 8.04 6.95 7.58 8.81 8.33 9.96 7.24 4.26 10.84 4.82 5.68

iii

x

y

x

10.0 8.0 13.0 9.0 11.0 14.0 6.0 4.0 12.0 7.0 5.0

9.14 8.14 8.74 8.77 9.26 8.10 6.13 3.10 9.13 7.26 4.74

10.0 8.0 13.0 9.0 11.0 14.0 6.0 4.0 12.0 7.0 5.0

iv y

7.46 6.77 12.74 7.11 7.81 8.84 6.08 5.39 8.15 6.42 5.73

x 8.0 8.0 8.0 8.0 8.0 8.0 8.0 19.0 8.0 8.0 8.0

y 6.58 5.76 7.71 8.84 8.47 7.04 5.25 12.50 5.56 7.91 6.89

n = 11 media de X = 9.0 media de Y= 7.5 ecuación de la recta de regresión: Y = 3 + 0.5X error estándar de la pendiente estimada = 0.118 t = 4.24 suma de los cuadrados X – X = 110.0 suma regresiva de los cuadrados = 27.50 suma residual de los cuadrados de Y = 13.75 coeficiente de correlación = 0.82 r² = 0.67

14 prácticas gráficas

Pero al representar los datos de forma gráfica se aprecian sus enormes diferencias:

F. J. Anscombe, “Graphs in Statistical Analysis”, American Statistician, 27 (febrero de 1973), 17–21.

Así mismo, el gráfico revela con facilidad el punto A, una observación errática que dominará los cálculos estadísticos habituales. Aunque el punto A pasa desapercibido en la distribución marginal, en el diagrama de dispersión bivariante se percibe como claramente excepcional.

Stephen S. Brier y Stephen E. Fienberg, “Recent Econometric Modelling of Crime and Punishment: Support for the Deterrence Hypothesis?” en Stephen E. Fienberg y Albert J. Reiss, Jr., eds., Indicators of Crime and Criminal Justice: Quantitative Studies (Washington, D.C., 1980), 89.

For Zabdiel Ramos Banda

excelencia gráfica 15

Nueva York

Calorías por cm2 por min.

La eficacia de los gráficos, como la de los cálculos estadísticos, depende del contenido. Por ingenioso o llamativo que sea, un gráfico no puede salvar unos datos pobres ni un modelo absurdo o mal definido. Una teoría tonta produce gráficos tontos:

Precios Bolsa Nueva York

Precios Bolsa Londres

Londres

Radiación Solar

Normal

Ene. Feb. Mar. Abr. Mayo Jun.

Jul. Agos. Sept. Oct. Nov. Dic.

RADIACIÓN SOLAR Y PRECIOS BOLSA A. Precios Bolsa de Nueva York (promedio de Barron), B. Radiación Solar, invertida, y C. Precios Bolsa de Londres, todos por meses, en 1929 (según Garcia-Mata y Shaffner).

Vayamos a la práctica de la excelencia gráfica, que definimos como la comunicación eficaz de ideas cuantitativas complejas. A continuación mostraremos distintos ejemplos de excelencia, casi siempre de naturaleza multivariante, como mapas de datos, series temporales, diseños espaciotemporales y gráficos relacionales. Estos ejemplos cumplen varios propósitos: proporcionar un corpus de gráficos de alta calidad que pueden estudiarse (e incluso rehacerse) para elaborar una teoría de los gráficos de datos; ayudar a demostrar la terminología descriptiva; e ilustrar una breve historia de los avances gráficos. Pero sobre todo tendremos la oportunidad de observar la calidad que pueden alcanzar los gráficos estadísticos.

Edward R. Dewey y Edwin F. Dakin, Cycles: The Science of Prediction (Nueva York, 1947), 144.

16 prácticas gráficas

Mapas de Datos Estos seis mapas describen los índices de mortalidad de varios tipos de cáncer ajustados por la edad en los 3056 condados de Estados Unidos. Cada uno representa unas 21,000 cifras¹ mediante una única imagen, lo cual facilita el análisis de los datos de muchas formas y a distintos niveles, desde el estudio de patrones generales a la identificación de detalles específicos de cada condado. A modo de ejemplo, observe lo siguiente:

¹ El índice de cada condado se localiza en dos dimensiones y para reconstruir el tamaño y la forma de cada condado harían falta, al menos, cuatro cifras. Esto supone una matriz de datos de 7 ⳯ 3056 entradas para reproducir un solo mapa.

• los altos índices de mortalidad por cáncer en la región nordeste del país y alrededor de los Grandes Lagos; • los bajos índices de mortalidad en la franja este-oeste, en la zona centro del país; • los índices más altos para hombres que para mujeres en el sur, particularmente en Luisiana (cáncer causado probablemente por exposición laboral, por el trabajo con asbetos en los astilleros); • las áreas de concentración inusual, como el norte de Minnesota y algunos condados de Iowa y Nebraska a lo largo del río Missouri; • las diferencias regionales entre los tipos de cáncer (por ejemplo, los altos índices de cáncer de estómago en la zona centro-norte del país, probablemente debido al consumo de pescado ahumado por la población de origen escandinavo);

En el decil más alto, estadísticamente significativo Significativamente alto, pero no en el decil más alto En el decil más alto, pero sin significación estadística Sin diferencias significativas con el resto de EE.UU. Significativamente menor que el resto de EE.UU.

• los índices en las zonas donde usted ha residido.

Los mapas proporcionan pistas sobre las causas del cáncer, y sobre su prevención. Por ejemplo, los autores informan que: En ciertas situaciones […] las observaciones inusitadas en un condado requieren investigación adicional. Por ejemplo, el condado de Salem, en Nueva Jersey, presenta el índice de mortalidad más alto de la nación por cáncer de vejiga entre la población de hombres blancos. Atribuimos este exceso a riegos laborales, ya que el 25 por ciento de los empleados trabaja en la industria química, concretamente en la fabricación de productos químicos orgánicos, que pueden causar tumores en la vejiga. Tras comunicarse el descubrimiento a los responsables del área estatal de salud, una compañía de la zona informó de que al menos 330 trabajadores de la misma fábrica habían desarrollado cáncer de vejiga en los últimos 50 años. Es urgente iniciar una evaluación de los riesgos y programas de control entre los trabajadores en activo y los jubilados².

² Robert Hoover, Thomas J. Mason, Frank W. McKay y Joseph F. Fraumeni, Jr., “Cancer by County: New Resource for Etiologic Clues”, Science, 189 (19 de septiembre de 1975), 1006. Mapas del Atlas of Cancer Mortality for U.S. Counties: 1950–1969, de Thomas J. Mason, Frank W. McKay, Robert Hoover, William J. Blot y Joseph F. Fraumeni, Jr. (Washington, D.C.: Public Health Service, National Institutes of Health, 1975). Estos seis mapas han sido rediseñados y redibujados por Lawrence Fahey y Edward Tufte.

For Zabdiel Ramos Banda

Todos los tipos de cáncer, mujeres blancas; índice ajustado por la edad para cada condado, 1950–1969

Todos los tipos de cáncer, hombres blancos; índice ajustado por la edad para cada condado, 1950–1969

Cáncer de tráquea, bronquios y pulmón; mujeres blancas; índice ajustado por la edad para cada condado, 1950–1969

Cáncer de tráquea, bronquios y pulmón; hombres blancos; índice ajustado por la edad para cada condado, 1950–1969

For Zabdiel Ramos Banda

Cáncer de estómago, mujeres blancas; índice ajustado por la edad para cada condado, 1950–1969

Cáncer de estómago, hombres blancos; índice ajustado por la edad para cada condado, 1950–1969

20 prácticas gráficas

Los mapas merecen ser estudiados con atención. Inmediatamente nos concentramos en la exploración del contenido intrínseco de los datos, dejando a un lado cuestiones metodológicas o técnicas. Los mapas no son perfectos, pues caen en el error de igualar la importancia visual de cada condado con su área geográfica, en vez de con el número de habitantes (o de víctimas del cáncer). De este modo, transmiten la impresión visual de que los datos dependen de las fronteras y zonas geográficas. Éste el problema crónico que sufren los “mapas de puntos” o “mapas de polígonos”. La composición gráfica no es el único problema. Los mapas están basados en datos obtenidos de fuentes dudosas: los informes forenses que certifican la causa del fallecimiento reflejan los distintos métodos de diagnóstico predominantes entre médicos y forenses en distintas épocas y lugares. De esta forma, las pruebas para establecer dónde apareció el primer tumor en un paciente, cosa siempre difícil, quedan adulteradas por los procedimientos. Por este motivo, algunos lugares geográficos con mayor densidad de víctimas podrían reflejar, además de los índices reales de la enfermedad, las distintas prácticas de diagnosis médica. Los mapas de datos tienen una historia curiosa. Las técnicas cartográficas y estadísticas necesarias para elaborarlos no se dieron conjuntamente hasta el siglo XVII, 5000 años después de que se trazaran los primeros mapas geográficos sobre tablas de arcilla. Cuando apareció el primer mapa con material estadístico, hacía siglos que existían sofisticados mapas geográficos³. Por ejemplo, en la China del siglo XI se creó un detallado mapa cuadriculado, el Yü Chi Thu (Mapa de las huellas de Yü el Grande), que Joseph Needham describe como […] la obra cartográfica más sobresaliente de la época en cualquier cultura, esculpido en piedra alrededor de 1137 d.C., pero probablemente original de 1100 d.C. La escala de la cuadrícula es de 100 li por división. La línea costera es relativamente firme y la precisión del sistema fluvial es extraordinaria. El original, que se encuentra en el museo Pei Lin en Sian, mide casi un metro cuadrado. Se desconoce el nombre del geógrafo.[…] Al comparar este mapa con sus contemporáneos europeos, de cosmografía religiosa, no podemos dejar de sorprendernos ante lo avanzado de la geografía china frente a la Occidental.[…] En Europa no hubo nada parecido hasta el mapa del manuscrito del Escorial, fechado alrededor de 1550⁴.[…]

³ En cartografía, los mapas de datos suelen describirse como “mapas temáticos”. Para una explicación detallada, véase Arthur H. Robinson, Early Thematic Mapping in the History of Cartography (Chicago, 1982). Sobre la historia de los gráficos estadísticos, véase H. Gray Funkhouser, “Historical Development of the Graphical Representation of Statistical Data”, Osiris, 3 (noviembre de 1937), –; y James R. Beniger y Dorothy L. Robyn, “Quantitative Graphics in Statistics: A Brief History”, American Statistician,  (febrero de ), –. ⁴ Joseph Needham, Science and Civilisation in China (Cambridge, ), vol. , –.

For Zabdiel Ramos Banda

excelencia gráfica 21

E. Chavannes, “Les Deux Plus Anciens Spécimens de la Cartographie Chinoise”, Bulletin de l’École Française de l’Extrême Orient, 3 (1903), 1–35, Carte B.

 prácticas gráficas

La edición de 1546 de la Cosmographia de Petrus Apianus contenía ejemplos de mapas que muestran que la cartografía europea de la época se hallaba muy cerca de la estadística gráfica, incluso del diagrama de dispersión bivariante. Pero, según los documentos históricos, nadie había hecho la abstracción cuantitativa necesaria para sustituir los nombres de las ciudades en las intersecciones de los dos ejes sobre el mapa por una cantidad medida. Y mucho menos las abstracciones más complejas de reemplazar la latitud y la longitud por otras dimensiones, como el tiempo y el dinero. De hecho, hasta 1786 no se trazaría la primera serie temporal económica.

For Zabdiel Ramos Banda

excelencia gráfica 23

En 1686 Edmond Halley elaboró uno de los primeros mapas de datos, donde mostraba sobre un mapamundi los vientos alisios y los monzones⁵. Abajo, el detalle de una sección muestra la simbolización cartográfica y, como escribió Halley, “[…] el extremo agudo de cada trazo señala la parte del horizonte de donde procede el viento; en áreas monzónicas las hileras de trazos van alternativamente hacia adelante y hacia atrás, por eso son más densas que en las otras zonas”.

⁵ Norman J. W. Thrower, “Edmond Halley as a Thematic Geo-Cartographer”, Annals of the Association of American Geographers, 59 (diciembre de 1969), 652–676.

Edmond Halley, “An Historical Account of the Trade Winds, and Monsoons, Observable in the Seas Between and Near the Tropicks; With an Attempt to Assign the Phisical Cause of Said Winds”, Philosophical Transactions, 183 (1686), 153–168.

24 prácticas gráficas

Uno de los primero ejemplos del uso de mapas para representar el patrón de propagación de enfermedades es el famoso mapa de puntos del Dr. John Snow, que ubicaba los fallecimienos por cólera en el centro de Londres durante el mes de septiembre de 1854. Snow marcó las muertes con puntos y las once fuentes de la zona con cruces. Al examinar la distribución de los casos sobre el mapa observó que el cólera predominaba entre los que vivían cerca de la fuente de Broad Street y bebían de ella. Snow mandó cambiar la manija de la fuente contaminada y así terminó con la epidemia, que se había cobrado más de 500 vidas⁶. La fuente está situada en el centro del mapa, justo a la derecha de la letra d de broad street. Por supuesto que la conexión entre la fuente y la epidemia podría haberse deducido sin ayuda del gráfico, mediante cálculos y análisis, con suerte y mucho esfuerzo. Pero, al menos en esta ocasión, el análisis gráfico muestra los datos con mucha más eficacia que los cálculos.

Charles Joseph Minard indicaba la cantidad, además de la dirección, en su mapa del mundo con las exportaciónes de vino francés en 1864:

⁶ E. W. Gilbert, “Pioneer Maps of Health and Disease in England”, Geographical Journal, 124 (1958), 172–183.

For Zabdiel Ramos Banda

Charles Joseph Minard, Tableaux graphiques et cartes figuratives de M. Minard, 1845–1869, carpeta con su obra de la Bibliothèque de l’École Nationale des Ponts et Chaussées, París.

26 prácticas gráficas

La cartografía informatizada y las técnicas modernas de fotografía han multiplicado por 5000 la densidad de información de los mapas de datos actuales, comparados con los esfuerzos pioneros de Halley. Este mapa muestra la distribución de 1.3 millones de galaxias (incluyendo algunas superposiciones) en el hemisferio galáctico norte. El mapa divide el cielo en 1024 x 2222 rectángulos. El número de galaxias observadas en cada uno de los 2,275,328 rectángulos se indica con tonos grises; cuanto más oscuro, mayor número de galaxias. El polo norte galáctico se encuentra en el centro. Como la tierra bloquea la visión desde el observatorio, la esquina de la izquierda no registra ninguna medición. En la zona próxima al perímetro del mapa, las observaciones se ven entorpecidas por el polvo interestelar de la galaxia en que vivimos (la Vía Láctea) cuando la línea de visión atraviesa el disco aplanado de la misma. Los científicos habían examinado microscópicamente millones de fotografías de galaxias antes de contar con esta perspectiva macroscópica y quedaron sorprendidos por la curiosa textura de las agrupaciones de galaxias de esta nueva imagen del universo. Aunque las agrupaciones son evidentes (y se ajustan a una teoría del origen de las galaxias), los filamentos, aparentemente aleatorios, podrían ser pura casualidad. Los creadores del mapa señalan la “fuerte tentación de concluir que las galaxias se organizan en un patrón filamentoso, en escalas aproximadas de 5° a 15°, pero hay que advertir que esta impresión visual puede ser engañosa, pues el ojo tiende a percibir patrones lineales incluso en imágenes de ruido aleatorio. De hecho, se han observado patrones similares en mapas elaborados a partir de datos simulados, en los que no se había establecido ninguna estructura lineal .[…]”⁷ Los mapas de datos más extensivos, como el atlas del cáncer y el de las galaxias, sitúan millones de bits de información frente a nuestros ojos en una sola página. No hay ningún otro método para representar información estadística tan poderoso cómo éste.

⁷ Michael Seldner, B. H. Siebers, Edward J. Groth y P. James E. Peebles, “New Reduction of the Lick Catalog of Galaxies”, Astronomical Journal, 82 (abril de 1977), 249–314. Ver Gillian R. Knapp, “Mining the Heavens: The Sloan Digital Sky Survey,” Sky & Telescope (Agosto 1997), 40-48; Margaret J. Geller y John P. Hucha, “Mapping the Universe,” Sky & Telescope (Agosto 1991), 134-139.

For Zabdiel Ramos Banda

excelencia gráfica 27

28 prácticas gráficas

Series Temporales Las series temporales son el tipo de gráfico más frecuente⁸. Una de sus dimensiones avanza al ritmo regular de los segundos, minutos, horas, días, semanas, meses, años, siglos o milenios. Al seguir el orden natural de la escala temporal, la interpretación del diseño adquiere fuerza y eficacia excepcionales. Esta famosa ilustración del siglo X (quizás del XI) de las inclinaciones de las órbitas planetarias en función del tiempo es el intento más antiguo de mostrar gráficamente valores variables. Al parecer, formaba parte de un texto para las escuelas monásticas y surge como una maravilla aislada y misteriosa en la historia de los gráficos de datos. La siguiente serie temporal no aparecería hasta 800 años más tarde. Según Funkhouser, el contenido astronómico es confuso y hay problemas para reconciliar el gráfico y su correspondiente texto con el movimiento real de los planetas. El ondeado camino del sol es particularmente desconcertante y cerca del centro se percibe un borrón y la corrección de una curva⁹.

⁸ Al analizar una muestra aleatoria de 4000 gráficos publicados en 15 periódicos y revistas del mundo entre 1974 y 1980 se descubrió que más del 75% eran series temporales. Más información al respecto en el Capítulo 3.

⁹ H. Gray Funkhouser, “A Note on a Tenth Century Graph”, Osiris, 1 (enero de 1936), 260–262.

For Zabdiel Ramos Banda

excelencia gráfica 29

Las series temporales no aparecieron en estudios científicos hasta finales del siglo XVIII. Este gráfico de Johann Heinrich Lambert muestra la variación periódica de la temperatura del suelo en función de la profundidad. A mayor profundidad, mayor es el tiempo de reacción térmica. Aunque hoy en día se cuenta con bases de datos mucho mayores, las series temporales modernas difieren poco de las de Lambert.

J. H. Lambert, Pyrometrie (Berlín, 1779).

Este gráfico de las emisiones de radio de Júpiter se basa en datos recopilados por el Voyager 2 en julio de 1979. La intensidad aumenta y disminuye en un ciclo de diez horas correspondiente a la rotación de Júpiter. La máxima intensidad se observa cuando el polo norte magnético está inclinado hacia la sonda, lo que indica una fuente de radiaciones en el hemisferio norte. El 7 de julio, cuando la sonda se aproximaba al plano ecuatorial, se detectó otra fuente en el hemisferio sur. El eje horizontal muestra la distancia entre el planeta y la nave, medida en radios de Júpiter (R). Note que el eje horizontal indica a la vez la fecha y la distancia de Júpiter. El panel inferior gradúa el eje horizontal, describiendo la orientación de la nave respecto a Júpiter durante la aproximación. Las series temporales múltiples favorecen el estudio de las variaciones ocurridas dentro de cada serie en el tiempo (como en toda serie temporal), y además fomentan las comparaciones entre las tres bandas. Esta rica representación multivariante está basada en 453,600 mediciones instrumentales de ocho bits cada una. Los 3.6 millones de bits resultantes se redujeron procesando la media y las máximas hasta llegar a los 18,900 puntos representados en el gráfico.

D. A. Gurnett, W. S. Kurth y F. L. Scarf, “Plasma Wave Observations Near Jupiter: Initial Results from Voyager 2”, Science 206 (23 de noviembre de 1979), 987–991; y carta personal de Donald A. Gurnett a Edward R. Tufte, 27 de junio de 1980.

30 prácticas gráficas

Las series temporales son la mejor opción a la hora de representar grandes conjuntos de datos de gran variabilidad. ¿Para qué malgastar el poder de los gráficos con cambios puramente lineales,

que casi siempre pueden resumirse con una o dos cifras? Los gráficos deben reservarse para materiales estadísticos más ricos y complejos. El resumen del clima en Nueva York durante 1980 despliega 2220 cifras. Se ofrecen las temperaturas máximas y mínimas diarias en relación a la media. Además, la evolución de las temperaturas normales proporciona una previsión de las oscilaciones a lo largo del año; a mediados de febrero, los neoyorquinos pueden esperar subidas de 1.5 grados semanales hasta el mes de julio, cuando se da la máxima anual. Este distinguido gráfico consigue organizar con claridad una gran colección de datos, establecer comparaciones entre las distintas secciones y contar una historia.

New York Times, 4 de enero de 2004, a15.

For Zabdiel Ramos Banda

excelencia gráfica 31

E. J. Marey, La méthode graphique (París, 1885), p. 20. El método se atribuye al ingeniero francés Ibry.

El gráfico de Marey con los horarios de trenes de París a Lyon en la década de 1880 posee cualidades similares. Las llegadas y las salidas de cada estación están ubicadas en el eje horizontal y la duración de las paradas se corresponde con la longitud de la línea horizontal. Las estaciones, situadas en el eje vertical, están separadas en proporción a la distancia existente entre ellas. La pendiente de la línea refleja la velocidad del tren: a mayor inclinación, mayor rapidez. La intersección de dos líneas sitúa la hora y el lugar en que se cruzan los trenes que marchan en sentido contrario.

En 1981 un tren expreso de París a Lyon redujo la duración del trayecto a menos de tres horas, respecto a las casi nueve que se tardaba cuando Marey publicó su gráfico. El recorrido del moderno tgv (train à grande vitesse) se muestra superpuesto al horario de hace cien años:

32 prácticas gráficas

Los dos grandes inventores del diseño gráfico moderno son J. H. Lambert (1728‒1777), científico y matemático suizo-alemán, y el escocés William Playfair (1759‒1823), experto en economía política¹⁰. La primera serie temporal conocida con datos económicos fue publicada en el excelente libro de Playfair The Commercial and Political Atlas (Londres, 1786). Hay que resaltar su aritmética gráfica, que muestra las oscilaciones del equilibrio comercial mediante la diferencia entre las series temporales de importaciones y exportaciones. Playfair comparó su nuevo método gráfico con la exposición tabular de datos: La información que se adquiere de forma imperfecta se retiene de forma imperfecta; quien estudia una tabla con atención, se encuentra al final con una idea vaga y fragmentaria de lo que ha leído, como una figura trazada en la arena que en seguida queda borrada y desfigurada. La cantidad de transacciones mercantiles en efectivo (en ganancias y pérdidas), puede representarse fácilmente mediante un dibujo, como el espacio o el contorno de un país, aunque hasta ahora no se ha intentado. Estos diagramas se elaboraron de acuerdo a ese principio y además de ofrecer una idea simple y clara, su precisión es casi absoluta como en cualquier forma útil. Al examinar cualquiera de estas tablas se obtendrá una impresión suficientemente específica que se recordará intacta durante un tiempo considerable. El concepto transmitido es simple y completo, incluyendo al mismo tiempo la duración y la cantidad. [pp. 3–4] Para Playfair, los gráficos eran preferibles a las tablas porque favorecen la comparación de los datos, como en el caso de las series temporales. De

¹⁰ Laura Tilling, “Early Experimental Graphs”, British Journal for the History of Science, 8 (1975), 193–213.

For Zabdiel Ramos Banda

excelencia gráfica 33

los cuarenta y cuatro gráficos de la primera edición de The Commercial and Political Atlas, todos menos uno son series temporales. La única excepción es el primer gráfico de barras conocido, que Playfair inventó porque faltaban datos de algunos años y necesitaba representar los datos anuales disponibles. No obstante, contemplaba su innovación con escepticismo: Este gráfico se basa en principios distintos a los de los demás, pues al no incluir ningún lapso de tiempo su utilidad es mucho menor. Aunque ilustra los diferentes sectores comerciales, no ofrece su evolución a lo largo del tiempo; tampoco posee la característica principal de los gráficos, esto es, transmitir un concepto claro, ya que al faltarle la dimensión cronológica las cantidades no tienen forma alguna. [p. 101] Tenía razón: los conjuntos de datos pequeños, no comparativos y muy definidos suelen expresarse mediante tablas.

El gráfico muestra las importaciones (barras sombreadas) y las exportaciones (barras sólidas) entre Escocia y 17 países en el año 1781, ordenadas por su volumen comercial. La escala horizontal está en la parte superior, posiblemente para verla con más comodidad al trazar los puntos a mano. El valor cero se indica por la ausencia de la barra y por un “0”. La escala horizontal repite erróneamente el valor “200”. En casi todos sus gráficos Playfair coloca los valores del eje vertical a la derecha de la página (lo cual sugiere que trazó los puntos con la mano izquierda).

34 prácticas gráficas

El último libro de Playfair abordaba la cuestión de la posible subida del precio del trigo en relación a los salarios. En su A Letter on Our Agricultural Distresses (Carta sobre nuestros problemas agrícolas, sus causas y remedios; acompañada de tablas y gráficos grabados en cobre que muestran y comparan los precios del trigo, el pan y el trabajo, desde 1565 a 1821), Playfair escribió: Excelentísimos señores, tienen ante ustedes un gráfico con los precios del trigo durante 250 años, elaborado a partir de documentos oficiales. En el mismo grabado he trazado una línea que representa, en la medida de los posible, los salarios de los artesanos, tales como herreros, albañiles y carpinteros, para compararlos con el precio del trigo en cada período.[…] el hecho que merece mayor consideración es que el trigo nunca ha sido tan barato como ahora, en proporción al trabajo manual.[…] [pp. 29–31] Aquí Playfair dibujó tres series temporales paralelas: precios, salarios y reinados de los monarcas británicos.

La historia y genealogía de la realeza era uno de los temas favoritos de la época. Esta magnífica estructura de E. J. Marey despliega datos de distinta naturaleza sobre los monarcas ingleses en una serie temporal que transmite el paso de la historia. Marey (1830–1904) también fue un pionero en la aplicación de métodos gráficos en el campo de la fisiología humana y animal, incluyendo un estudio sobre los pasos del caballo,

For Zabdiel Ramos Banda

excelencia gráfica 35

E. J. Marey, La méthode graphique (París, 1885), 6.

E. J. Marey, Le mouvement (London, 1895). Las series temporales, comenzando por los pasos del caballo, están en las páginas 191, 224, 222, 265, 60 y 61.

36 prácticas gráficas

el movimiento de una estrella de mar dándose la vuelta (la secuencia de las imágenes se lee de abajo a arriba),

las ondulaciones de la aleta dorsal de un caballito de mar al descender,

y el avance de la gecko.

El hombre vestido de terciopelo negro de Marey, fotografiado al bajar una escalera, se convirtió en el precursor del cuadro de Marcel Duchamp Desnudo descendiendo una escalera.

For Zabdiel Ramos Banda

excelencia gráfica 37

El problema de las series temporales es que el simple paso del tiempo no es una variable explicativa adecuada: la cronología descriptiva no basta para explicar las causas. Hay algunas excepciones, especialmente cuando existe un motivo concreto que condiciona la variable Y. Esta serie temporal ilustra la causa: el correo enviado desde el Congreso de EE.UU. alcanza el máximo cada dos años, justo antes de las elecciones: Correo enviado al mes, en millones de unidades Octubre 1970

Octubre 1972

Octubre 1968

El gráfico vale al menos 700 palabras, las que contiene esta noticia periodística sobre el uso de los privilegios de correo gratuito por parte de los congresistas en activo para favorecer su propia campaña de reelección:

38 prácticas gráficas

Las series temporales pueden abordar la explicación causal introduciendo variables adicionales en el diseño del gráfico. Por ejemplo, la siguiente descomposición de datos económicos, con 1296 cifras, divide la serie superior en fluctuaciones estacionales y diarias (que dominan los cambios a corto plazo) para revelar la tendencia a largo plazo ajustada a la inflación. (Nótese un defecto significativo en el diseño: el eje vertical oculta la altura de la máxima de diciembre.) El siguiente paso sería introducir variables adicionales para explicar la serie inferior, transformada y mejorada¹¹.

¹¹ Véase William S. Cleveland e Irma J. Terpenning, “Graphical Methods for Seasonal Adjustment”, Journal of the American Statistical Association 77 (marzo de 1982), 52–62.

Julius Shiskin, “Measuring Current Economic Fluctuations”, Statistical Reporter (julio de 1973), 3.

For Zabdiel Ramos Banda

excelencia gráfica 39

Y por último un diseño elocuente (con datos apropiados), las series temporales de antes y después de un acontecimiento:

M. Mitchell Waldrop, “In Search of the Magnetic Monopole”, Science (4 de junio de 1982), p. 1087.

Antes y después del derrumbamiento de un puente en el Ródano en 1840:

Charles Joseph Minard, “De la chute des ponts dans les grandes crues”, (24 de octubre de 1856), Figura 3, en Minard, Collection de ses brochures (París, 1821–1869), en la Bibliothèque de l’École Nationale des Ponts et Chaussées, París.

40 prácticas gráficas

Gráficos Narrativos Espacio-Temporales Un mecanismo efectivo para aumentar la fuerza explicativa de las series temporales consiste en añadir dimensiones espaciales, de forma que los datos evolucionen en el espacio (en dos o tres dimensiones) además de en el tiempo. Estos tres excelentes gráficos espacio-temporales ilustran cómo la complejidad de las variables múltiples puede integrarse con tal delicadeza en la estructura gráfica que los lectores apenas notan que están contemplando un mundo de cuatro o cinco dimensiones. En ocasiones, los gráficos despliegan sus variantes con gran agresividad, promocionando la técnica en lugar de los datos. Pero en el caso de estos tres no es así. El primero es el diagrama clásico del ingeniero francés Charles Joseph Minard (1781–1870), que ilustra el terrible destino del ejército de Napoleón en Rusia. E. J. Marey lo describió diciendo que parecía desafiar la pluma del historiador por su brutal elocuencia¹². Esta combinación de mapa de datos y serie temporal elaborada en 1861 reproduce las devastadoras pérdidas sufridas por Napoleón en la campaña rusa de 1812. La banda comienza a la izquierda, en la frontera ruso-polaca cerca del río Niemen, y muestra el tamaño del ejército (422,000 hombres) en el inicio de la ofensiva en el mes de junio de 1812. El ancho de la banda indica las dimensiones de las tropas en cada lugar del mapa. En septiembre, el ejército entró con 100,000 hombres en Moscú, para entonces saqueada y desierta. La retirada de Napoleón desde Moscú está representada por una banda inferior más oscura, vinculada a la escala de las temperaturas y fechas en el eje inferior del gráfico. Fue un invierno gélido y muchos murieron congelados en el camino de regreso. Como muestra el diagrama, el cruce del río Berezina fue un desastre y sólo 10,000 hombres consiguieron llegar a Polonia. También se muestran los movimientos de las tropas auxiliares, que intentaban proteger la retaguardia y los flancos del ejército en movimiento. Aportando gran cantidad y variedad de datos, el gráfico de Minard cuenta una historia rica, coherente y mucho más ilustrativa que la evolución de una sola cifra a lo largo del tiempo. Se reflejan seis variables: el tamaño del ejército, su posición sobre una superficie bidimensional, la dirección la marcha y la temperatura en distintos momentos de la retirada desde Moscú. La gráfica superior muestra la original de Minard en Frances, la cual fue impresa en litografía a dos tintas como un pequeño póster. La gráfica inferior es nuestra traducción en ingles. Podría ser el mejor gráfico estadístico de la historia.

¹² E. J. Marey, La méthode graphique (París, 1885), p. 73. Para más información sobre Minard, véase Arthur H. Robinson, “The Thematic Maps of Charles Joseph Minard”, Imago Mundi, 21 (1967), 95–108.

Imagen superior de Charles Joseph Minard, Tableaux Graphiques et Cartes Figuratives de M. Minard, 1845-1869, Bibliothèque de l’École Nationale des Ponts et Chaussées, Paris, articulo 28 (62 por 25 cm, o 25 por 10 pulgadas). Traducción al ingles por Dawn Finley y redibujado por Elaine Morse, completado en Agosto del 2002.

For Zabdiel Ramos Banda

42 prácticas gráficas

El siguiente gráfico espacio-temporal, hecho por ordenador, muestra los niveles de tres agentes contaminantes del aire sobre una superficie bidimensional (seis condados en el sur de California) a cuatro horas distintas del día. Los óxidos de nitrógeno (la hilera superior) son emitidos por centrales eléctricas, refinerías y vehículos. Las refinerías a lo largo de la costa y la fábrica de Kaiser Steel en la ciudad de Fontana son responsables de las máximas después de media noche reflejadas en el primer panel. El monóxido de carbono (la segunda hilera) está bajo a media noche, excepto cerca de la fábrica de acero; más tarde, el tráfico matutino comienza a generar una oleada de monóxido de carbono con las concentraciones más altas en el cruce de cinco autopistas en el centro de Los Angeles. Los hidrocarburos reactivos (tercera hilera), al igual que los óxidos de nitrógeno, provienen de las emisiones de las refinerías a media noche y aumentan con el tráfico a lo largo del día. Cada uno de los 12 cuadros espacio-temporales resume los agentes contaminantes de 2400 lugares (2400 cuadrados de cinco km. de lado). Se ofrecen 28,800 mediciones de contaminantes, excepto aquellas ocultas por las máximas. Esta representación de la contaminación atmosférica es un ejemplo de minidiagramas múltiples. En cada uno de los cuadros, o múltiple, se repite la misma estructura gráfica, lo cual resulta muy económico: basta con comprender el diseño de un solo cuadro para tener acceso inmediato a los datos de todos los demás. Así, cuando la vista se desplaza de un cuadro al siguiente, la uniformidad de la estructura permite al lector centrarse en los cambios de la información en vez de en la variedad del diseño.

Los Angeles Times, 22 de julio de 1979; basado en la obra de Gregory J. McRae, California Institute of Technology.

For Zabdiel Ramos Banda

excelencia gráfica 43

Nuestro tercer ejemplo de gráfico espacio-temporal combina ingeniosamente el espacio y el tiempo en el eje horizontal. Este diseño llega mucho más lejos que las series espacio-temporales convencionales debido a su inteligente presentación, que localiza la superficie del terreno en el eje vertical y el tiempo y el espacio en el horizontal para mostrar el ciclo vital del escarabajo japonés.

January

February

March

April

May

June

July

August

Diseños Más Abstractos: Gráficos Relacionales La invención de los gráficos de datos requería la sustitución de las coordenadas latitud-longitud por medidas más abstractas sin analogía geográfica. El paso de los mapas a los gráficos estadísticos era un paso considerable y tuvieron que transcurrir miles de años para que Lambert, Playfair y otros dieran ese salto en el siglo XVIII. De todas formas, las analogías con el mundo físico sirvieron como base conceptual para las primeras series espacio-temporales. Playfair comparó sus gráficos con los mapas en varias ocasiones y, en el prefacio a su primera edición de The Commercial and Political Atlas, afirmaba que sus gráficos se correspondían con la manifestación física de los datos: Supongamos que el dinero que pagamos en un año por los gastos de la Marina fuera en guineas y que colocásemos esas guineas en línea recta sobre una mesa, pegadas unas a otras, y que las pagadas al año siguiente fueran ordenadas en otra línea recta,y se hiciera lo

L. Hugh Newman, Man and Insects (Londres, 1965), 104–105.

September

October

November

December

44 prácticas gráficas

mismo durante varios años: la longitud de las líneas variaría según el número de guineas; y su forma coincidiría exactamente con el total de las sumas; y el valor de una guinea sería representado por el espacio que ocupa. Los gráficos son exactamente lo mismo, pero a menor escala, y una división representa el valor de diez mil o cien mil guineas, según se indique, con la misma exactitud que una pulgada cuadrada en un mapa geográfico representa una milla cuadrada de tierra. Por tanto, las líneas representan el dinero real, tal como se pagó en su día. [pp. iii–iv] En su libro más teórico sobre gráficos escrito quince años más tarde, The Statistical Breviary (El breviario estadístico), Playfair se desprendió de las analogías del mundo físico y elaboró diagramas autónomos. Este gráfico, uno de los cuatro grabados de The Statistical Breviary, se distingue por sus datos multivariantes, el uso del área para representar la cantidad y el diagrama de sectores. Según parece, era la primera vez que se utilizaban. El círculo representa el área de cada país; la línea de la izquierda, la población en millones leída en el eje vertical; la línea de la derecha, los ingresos (impuestos) recaudados en millones de libras esterlinas, también leídos en el eje vertical; y “las líneas punteadas que unen la población y los ingresos tienen como

For Zabdiel Ramos Banda

excelencia gráfica 45

única función conectar entre sí las líneas de cada país. El sentido de la pendiente, de derecha a izquierda o de izquierda a derecha, muestra si la población de un país está sometida a impuestos elevados o al contrario” (pp. 13–14). El grado de la pendiente no aporta ninguna información, pues está en función del diámetro del círculo y de la altura de las dos verticales. Sin embargo, el sentido de la pendiente es un dato significativo, pues da la razón a Playfair en sus frecuentes quejas sobre los excesivos impuestos en Gran Bretaña (el cuarto círculo desde la derecha, con la pendiente en sentido contrario a la mayoría de los países). Playfair estaba entusiasmado con este diseño porque favorecía las comparaciones: El autor aplicó los diagramas a asuntos comerciales y financieros hace unos quince años, con gran éxito. Su método recibió la aprobación general, no sólo por facilitar la tarea, sino por aportar claridad a estos estudios y facilitar su memorización. Estos gráficos pretenden hacer lo mismo en el campo de la estadística, mostrando visualmente los tamaños de distintos países representados por formas similares, pues el ojo humano es incapaz de comparar formas diferentes con facilidad y precisión. Por este motivo tenemos una idea más precisa del tamaño de los planetas, todos esféricos, que de las naciones de Europa que vemos en los mapas, con sus formas irregulares y variadas. El tamaño, la población y los ingresos son los tres temas principales de los estudios estadísticos en general, ya sea por curiosidad o por interés específico; así pues, los he reunido a los tres en un solo cuadro.[…] [p. 15] Pero en este campo Playfair, que no tenía conocimientos matemáticos, tuvo un predecesor con mayor capacidad para resolver los problemas abstractos del diseño gráfico. En 1765, treinta y cinco años antes de The Statistical Breviary, la siguiente exposición teórica de J. H. Lambert sería la precursora de los gráficos relacionales generales (no analógicos): En general tenemos dos cantidades variables, X e Y, que se relacionarán una con otra por medio de la observación, a fin de poder determinar para cada valor de X, que llamaremos abscisa, la correspondiente ordenada Y. Si los experimentos u observaciones fueran absolutamente precisos, las ordenadas darían un número de puntos que podrían unirse formando una línea recta o curva. De no ser así, la línea se desviará en mayor o menor medida de los puntos observados, por lo que debe trazarse con la mayor precisión posible siguiendo la posición correcta y atravesando, por así decir, el centro de cada uno de los puntos dados¹³.

¹³ Johann Heinrich Lambert, Beyträge zum Gebrauche der Mathematik und deren Anwendung (Berlín, 1765), citado en Laura Tilling, “Early Experimental Graphs”, British Journal for the History of Science, 8 (1975), 204–205

46 prácticas gráficas

Según Tilling, Lambert representó un análisis gráfico del índice de evaporación del agua en función de la temperatura. En primer lugar presenta dos series temporales: def, que muestra el descenso del nivel del agua en un tubo capilar en función del tiempo, y abc, la temperatura. La pendiente de la curva def se mide en varios lugares (véase la tangente deg), mostrando el índice de evaporación:

Para completar el cálculo gráfico, traza el índice medido junto a la temperatura correspondiente en este gráfico relacional:

Gracias al trabajo de Lambert y Playfair, a principios de la década de 1880 el diseño gráfico dejó de depender de la analogía directa con el mundo físico. La consecuencia, obvia pero de gran transcendencia, es que cualquier cantidad variable podía presentarse en relación con cualquier otra cantidad variable, siempre que fueran medidas en la misma unidad. Los gráficos de datos, al ser relacionales y no estar sujetos a coordenadas espaciales o temporales, se volvieron esenciales para las investigaciones

J. H. Lambert, “Essai d’hygrométrie ou sur la mesure de l’humidité”, Mémoires de l’Académie Royale des Sciences et BellesLettres…  (Berlín, 1771), grabado 1, opuesto a p. 126; del artículo de Tilling.

For Zabdiel Ramos Banda

excelencia gráfica 47

cuantitativas. De hecho, en las publicaciones científicas modernas el 40% de los gráficos son relacionales, con dos o más variables (distintas a la latitud, la longitud o el tiempo). No es casualidad, ya que el gráfico relacional — en su forma más sencilla, el diagrama de dispersión y sus variantes — es el mejor de todos los diseños gráficos. Éste relaciona al menos dos variables y de esta forma anima, e incluso empuja al lector a considerar la posible relación causal entre las variables representadas. También aporta pruebas empíricas sobre la verdadera relación entre X e Y, (contradiciendo la teoría de que X siempre causa Y), como en el caso de la relación entre el cáncer de pulmón y el tabaco:

ÍNDICE DE MUERTES DE VARONES POR CÁNCER DE PULMÓN EN 1950 Y CONSUMO PER CAPITA

MUERTES POR MILLÓN

DE CIGARRILLOS EN 1930 EN VARIOS PAÍSES.

CONSUMO CIGARRILLOS

Informe del Advisory Committee to the Surgeon General, Smoking and Health (Washington, D.C., ), p. ; basado en R. Doll, “Etiology of Lung Cancer”, Advances in Cancer Research,  (), –.

 prácticas gráficas

Estos minidiagramas múltiples relacionales representan el desempleo y la inflación en nueve países durante un período de tiempo determinado. Estas “curvas de Phillips” demuestran que no existe una relación inversa entre las dos variables como se creía en el pasado.

Paul McCracken, et al., Towards Full Employment and Price Stability (París, 1977), p. 106.

For Zabdiel Ramos Banda

excelencia gráfica 49

La teoría y las medidas observables también divergen en las ciencias físicas. En el gráfico siguiente, se estudia la relación entre la temperatura y la conductividad térmica del cobre por medio de una serie de mediciones realizadas en distintos laboratorios. Los puntos conectados corresponden a una sola publicación, citada por un número identificativo. La diversidad de los resultados se debe a las impurezas de las muestras de cobre. Nótese con qué eficacia organiza el gráfico una gran cantidad de datos, registrando los hallazgos de cientos de estudios en una sola página y favoreciendo al mismo tiempo la comparación entre los distintos resultados.

C. Y. Ho, R. W. Powell y P. E. Liley, Thermal Conductivity of the Elements: A Comprehensive Review, suplemento no. 1, Journal of Physical and Chemical Reference Data, 3 (1974), 1–244.

  

Por último, dos diseños relacionales de distinto tipo, donde los puntos utilizados para representar los datos son datos en sí mismos. El efecto de la interacción de dos variables se representa mediante los rostros sobre el diagrama:

E. C. Zeeman, “Catastrophe Theory”, Scientific American,  (abril de ), ; basado en Konrad Z. Lorenz, King Solomon’s Ring (Nueva York, ).

MIEDO

A G R E S I V I DA D

Y, de modo similar, los distintos tamaños de los brotes de pino tras crecer durante una estación en arena nutritiva con distintas cantidades de calcio (en partes por millón):

H. L. Mitchell, The Growth and Nutrition of White Pine Seedlings in Cultures with Varying Nitrogen, Phosphorus, Potassium and Calcium, The Black Rock Forest Bulletin No.  (Cornwall-on-the-Hudson, Nueva York, ), .

For Zabdiel Ramos Banda

excelencia gráfica 51

Principios de Excelencia Gráfica La excelencia gráfica consiste en la exposición bien diseñada de datos interesantes. Es una cuestión de sustancia, estadística y diseño. La excelencia gráfica consiste en comunicar ideas complejas con claridad, precisión y eficacia. La excelencia gráfica proporciona al lector el máximo número de ideas en el menor tiempo posible, usando el mínimo espacio y la menor cantidad de tinta. tinta

ideas

tiempo

La excelencia gráfica presenta casi siempre muchas variables. Y la excelencia gráfica requiere de la veracidad de los datos.

espacio

En cuanto a la idoneidad y la exactitud de representar cantidades de dinero y tiempo mediante fracciones de espacio, aunque muchos parecen aceptarlo de grado, pocos entienden que es posible engañar con este procedimiento, y no se percatan de ello.[…] William Playfair, The Commercial and Political Atlas (Londres, 1786)

La gente dijo: “Con el gráfico en la pared y los números en la mano, vamos a emularlos e incrementar nuestro entusiasmo en la producción”. Oficina Estatal de Estadística de la República Popular China Statistical Work in the New China (Pekín, )

Get it right or let it alone. The conclusion you jump to may be your own. James Thurber, Further Fables for Our Time (Nueva York, )

For Zabdiel Ramos Banda

2

Integridad Gráfica

Al hablar de gráficos estadísticos, muchas veces la primera palabra que se nos viene a la mente es “mentira”. Es cierto que algunos diagramas distorsionan los datos, dejándole al lector la difícil tarea de descubrir la verdad. Pero en ese sentido los gráficos son iguales a las palabras, ya que cualquier medio de comunicación puede usarse para engañar. No hay razón para creer que los gráficos son herramientas especialmente útiles para los mentirosos; todo lo contrario, la mayoría tenemos un sexto sentido para detectar los fraudes gráficos. Durante la mayor parte del siglo XX, los teóricos se concentraron en discutir cómo incluso los gráficos más rudimentarios podían engañar a los lectores ingenuos y sin embargo ignoraron temas tan importantes como el uso de gráficos para el análisis exhaustivo de los datos. Esta preocupación por las posibilidades fraudulentas del medio se basaba en la creencia de que los gráficos de datos servían principalmente para mostrar obviedades a lectores ignorantes. Es difícil imaginar una teoría más dañina para el progreso intelectual de cualquier especialidad. A partir de ahí surgieron dos principios infructuosos, responsables de la sequía gráfica de los años 1930–1970: en primer lugar, los gráficos tenían que estar “vivos”, “comunicar con dinamismo” y ser decorados y exagerados (si no, los lectores se quedarían dormidos nada más verlos); en segundo lugar, la tarea primordial del análisis gráfico era detectar y denunciar las supercherías (pues los lectores eran unos zopencos y no sabían defenderse solos). A finales de la década de los 60, John Tukey otorgó dignidad a los gráficos estadísticos al desechar el concepto de que su única función era decorar unos cuantos números. Este analista de categoría internacional creó media docena de diseños innovadores y, más importante aún, los usó para explorar datos complejos¹. Se acabaron las discusiones sobre los gráficos engañosos y las fútiles “normas gráficas” para erradicar la distorsión. Los gráficos pasaron a utilizarse como herramientas para razonar sobre la información cuantitativa y, siguiendo este modelo, la especialidad ha alcanzado una época de prosperidad. Por supuesto, no nos hemos librado todavía de los gráficos engañosos. Y aunque la detección de mentiras ha pasado a un segundo plano, sigue siendo importante poner al descubierto la falsedad. El requisito imprescindible para lograr la excelencia gráfica es decir la verdad sobre los datos.

¹ John W. Tukey y Martin B. Wilk, “Data Analysis and Statistics: Techniques and Approaches”, en Edward R. Tufte, ed., The Quantitative Analysis of Social Problems (Reading, Mass., 1970), 370–390; y John W. Tukey, “Some Graphic and Semigraphic Displays”, en T. A. Bancroft, ed., Statistical Papers in Honor of George W. Snedecor (Ames, Iowa, 1972), 293–316.

54  

A continuación tenemos varios gráficos que no dicen la verdad. En primer lugar, el caso de la desaparición de la línea de base en el informe anual de una compañía que prefirió olvidarse de los resultados de 1970. Al examinar con atención la sección central, descubrimos ingresos negativos en 1970, que quedan disimulados al situar la base del diagrama en los –$ 4,200,000 dólares:

Day Mines, Inc., 19 Annual Report, 1.

El falso descenso del siguiente gráfico se creó comparando los pagos de seis meses en 1978 con los de todo un año en 1976 y 1977. La mentira se reproduce en cuatro ocasiones.

New York Times, 8 de agosto de 1978, d-1.

For Zabdiel Ramos Banda

  

A veces simplemente se olvida que los números, además de seguir un orden, representan una cantidad numérica concreta:

Pittsburgh Civic Commission, Report on Expenditures of the Department of Charities (Pittsburgh, 1911), 7.

¿En qué Consiste la Distorsión en los Gráficos Estadísticos? Un gráfico no distorsiona si la representación visual de la información es consistente con la numérica. Según esto, ¿en qué consiste la representación visual de los datos? ¿Es lo que aparece sobre el papel? ¿O el efecto visual percibido? ¿Cómo sabemos que la imagen reproduce los números con fidelidad? Una manera de comprobarlo es realizar experimentos sobre la percepción visual de los gráficos: tras observar líneas de distinta longitud y círculos de diferentes áreas, los participantes deben estimar su valor numérico.

Creo que el área B es 3.14 veces más grande que el área A. ¿Es correcto?

Por medio de estos experimentos se han descubierto leyes muy aproximadas para calcular el valor numérico de medidas percibidas. Por ejemplo, el área percibida de un círculo crece con mayor lentitud que el área real (física y medida sobre el papel). El área percibida = (área real)x, donde x = 0.8Ⳳ0.3, un resultado desalentador. Cada persona percibe cada área de forma un poco diferente; las percepciones varían según la

 prácticas gráficas

experiencia y dependen del contexto². Algo tan claro y sencillo como la percepción de la longitud de una línea está en función del contexto y de lo que otras personas hayan dicho sobre ella³. Los errores de percepción y comunicación no son patrimonio exclusivo de los gráficos estadísticos,

² La extensa bibliografía aparece resumida en Michael Macdonald-Ross, “How Numbers Are Shown: A Review of Research on the Presentation of Quantitative Data in Texts”, Audio-Visual Communication Review,  (1977), 359-409. En particular, H. J. Meihoefer encuentra grandes variaciones entre los participantes del estudio; véase “The Utility of the Circle as an Effective Carto-graphic Symbol”, Canadian Cartographer, 6 (1969), 105-117; y “The Visual Perception of the Circle in The-matic Maps: Experi-mental Results”, ibíd., 10 (1973), 63-84. ³ S. E. Asch, “Studies of Independence and Submission to Group Pressure. A Minority of One Against a Unanimous Majority”, Psychological Monographs (1956), 70. Ilustración de CEM; copyright 1961, The New Yorker.

pero, ¿qué alternativa le queda el pobre diseñador? ¿Un gráfico distinto para cada lector en cada contexto? ¿Gráficos que corrijan las transformaciones visuales del participante típico en un experimento psicológico típico? Una solución satisfactoria consiste en mostrar los datos por medio de una tabla. Cuando se trabaja con conjuntos pequeños, de veinte números como máximo, las tablas superan a los gráficos, cuyo potencial se desarrolla mejor con grupos de grandes dimensiones. Ante semejantes dificultades de percepción, debemos conformarnos con lograr cierta uniformidad en los gráficos y cierta seguridad de que los lectores tengan la oportunidad de comprender los números. Para alcanzar estos objetivos disponemos de dos principios que mejoran la integridad gráfica: La representación visual de números, tal y como aparecen en la superficie del gráfico, debe ser directamente proporcional a las cantidades numéricas representadas. La notaciones deben ser claras, detalladas y exhaustivas para evitar la distorsión gráfica y la ambigüedad. Escriba las explicaciones de los datos en el gráfico mismo y consigne los hechos relevantes.

For Zabdiel Ramos Banda

integridad gráfica 57

La vulneración del primer principio constituye una forma de representación errónea, medida por el Factor de mentira =

tamaño del elemento en el gráfico tamaño del elemento en los datos

Si el factor de mentira es igual a uno, el gráfico estará representando los datos de forma adecuada, pero si es mayor que 1.05 o menor que 0.95 indica una distorsión sustancial, no un simple error de trazado. Se puede usar el logaritmo del factor de mentira para diferenciar errores por exageración (log FM > 0) o por reducción (log FM < 0). En la práctica, casi todas las distorsiones lo son por exageración y no es infrecuente hallar factores de mentira de entre dos y cinco. Aquí tenemos un caso extremo: un periódico informó que el Congreso norteamericano y el Departamento de Transporte habían establecido nuevas normas sobre el ahorro de combustible para los fabricantes de automóviles, que comenzaban con 18 millas por galón en 1978 y aumentaban progresivamente hasta llegar a 27.5 en 1985, un incremento del 53 por ciento: 27.5 – 18.0 ⳯ 100 = 53% 18.0 Se mostraban las normas y las fechas de entrada en vigor de la siguiente manera: Esta línea representa 18 millas por galón en 1978 y mide 0.6 pulgadas de largo.

Esta línea representa 27.5 millas por galón en 1985 y mide 5.3 pulgadas de largo. New York Times, 9 de agosto de 1978, d-2.

58 prácticas gráficas

La magnitud del cambio desde 1978 hasta 1985 se muestra por la longitud relativa de las dos líneas: 5.3 – 0.6 0.6



100 = 783%

El cambio numérico del 53% queda representado por líneas que cambiaron en un 783%, lo que genera un Factor de mentira =

783 = 14.8 53

claramente excesivo. El gráfico también presenta varias peculiaridades de perspectiva: • En la mayoría de las carreteras el futuro está delante de nosotros, hacia el horizonte, y el presente a nuestros pies. Aquí se invierte la convención para exagerar la severidad de las nuevas normas. • Las fechas de la derecha mantienen un tamaño constante en la página, incluso las que están más cerca del horizonte. • Los números de la derecha, al igual que el ancho de la carretera, van disminuyendo debido a dos efectos simultáneos: el cambio en los valores reflejados y el cambio de perspectiva. Los lectores no tienen forma de distinguir entre ellos. Decorar estos datos sin mentir resulta fácil:

normas de consumo de combustible: automóviles nuevos fabricados entre 1978 y 1985

19,1 mpg, media prevista para todos los coches en circulación, 1985 13,7 mpg, media prevista para todos los coches en circulación, 1978

For Zabdiel Ramos Banda

integridad gráfica 59

La versión sincera, además, sitúa los datos en su contexto al comparar las nuevas normas automovilísticas con el consumo de combustible de los vehículos en circulación. También revela otro aspecto que en el original quedaba disimulado y tergiversado: las normas de ahorro de combustible requieren una mejora gradual al principio, seguida por una doble subida de 1980 a 1983, pero después de eso se mantienen estables. Se puede transmitir una opinión sobre el contendido del gráfico mediante la decoración, pero no es aceptable distorsionar las unidades de medida de los datos — los elementos que ubican los valores de los números — con fines ideológicos o puramente ornamentales. Cuando esto ocurre, sin duda se trata de la obra de una manipulación gráfica. A continuación vemos mucha decoración sin mentiras:

sandard di consumo obbligatori per autovetture nuove fabbricate dal 1978 al 1985

19,1 miglia al gallone, media prevista di tutte le auto in circolazione nel 1985 13,7 miglia al gallone, media di tutte le auto in circolazione nel 1978

60 prácticas gráficas

Variación de Datos y de Diseño Cada parte del gráfico genera expectativas visuales sobre las demás partes y, según las reglas de la percepción gráfica, estas expectativas determinan a menudo lo que el ojo ve. La extrapolación errónea de expectativas visuales generadas en una sección del gráfico lleva al engaño. Si una escala avanza a intervalos regulares, por ejemplo, se espera que continúe con coherencia hasta el final, sin los trucos y la confusión de una variación no uniforme. En el siguiente caso, se usa una escala irregular para simular un descenso. Los primeros siete intervalos de la escala horizontal son de diez años, enmascarando la lectura del último, de tan solo cuatro años. Como resultado, el hecho más sobresaliente del gráfico es la aparente caída de las curvas a la derecha, particularmente el descenso en el número de premios concedidos a los norteamericanos (la línea gruesa y oscura) en el último período. Se trata un efecto debido exclusivamente a la variación del diseño. Es una mentira descomunal, ya que en realidad (incluso en extrapolación, si se aumentara cada punto 2.5 veces para poder comparar el intervalo de cuatro años con las décadas anteriores), la curva de EE.UU. asciende abruptamente en el intervalo posterior a 1970. A la derecha, véase el gráfico corregido con los auténticos datos para 1971–80:

Premios Nobel de Ciencia, por países, 1901–1974 (Número de premios)

National Science Foundation, Science Indicators, 19 (Washington, D.C., 1976), 15.

Premios Nobel de Ciencia, por países, 1901–1980 (Número de premios)

Estados Unidos

Estados Unidos

Reino Unido

Reino Unido Alemania

Alemania

U.R.S.S. Francia

U.R.S.S. Francia

For Zabdiel Ramos Banda

integridad gráfica 61

Confundir la variación del diseño con la variación de los datos sobre la superficie de un gráfico lleva a la ambigüedad y el engaño porque la vista puede confundir los cambios en el diseño con los cambios en el contenido. Una imagen consistente ofrecería una idea más clara. De ahí el siguiente principio: Muestre la variación de los datos, no la del diseño. La variación del diseño corrompe el diagrama, como ocurre a continuación:

New York Times, 19 de diciembre de 1978, d-7.

Cinco escalas verticales diferentes muestran el precio: Durante este período 1973–1978 enero–marzo 1979 abril–junio 1979 julio–septiembre 1979 octubre–diciembre 1979

una pulgada vertical equivale a $8.00 $4.73 $4.37 $4.16 $3.92

Y dos escalas horizontales diferentes muestran el paso del tiempo: Durante este período 1973–1978 1979

una pulgada horizontal equivale a 3.8 años 0.57 años

Como las dos escalas varían simultáneamente, la distorsión se multiplica. A la izquierda del gráfico, un precio de $10 dólares se representa por 0.31 pulgadas cuadradas y a la derecha por 4.69 pulgadas cuadradas: la misma cantidad aparece 4.69/0.31 = 15.1 veces más grande dependiendo de su situación en la superficie del gráfico. A esto se le llama variación de diseño.

62 prácticas gráficas

Esta variación afecta a gráficos similares en otras publicaciones. A continuación, un aumento real del 454 por ciento se representa por un aumento del 4280 por ciento, con un factor de mentira de 9.4:

Time, 9 de abril de 1979, 57.

Y un aumento del 708 por ciento se muestra como un 6700 por ciento, con un factor de mentira de 9.5:

Washington Post, 28 de marzo de 1979, a-18.

Todos estos diagramas de los precios del petróleo cometen un segundo error: usan los tipos de cambio del dólar actual. El dólar de 1972 valía mucho más que el de 1979. De esta forma, al avanzar de izquierda a

For Zabdiel Ramos Banda

integridad gráfica 63

derecha por la superficie del gráfico, el diseño de la escala vertical sufre alteraciones porque el valor del dinero cambia en el transcurso del período en cuestión. La única manera de reflejar con fidelidad el capital a lo largo del tiempo es usando unidades monetarias ajustadas según la inflación. Varios diseñadores gráficos famosos expresaron los precios en dólares reales, además de evitar otras causas de variación gráfica. Los más destacados fueron los de Business Week, el Sunday Times (Londres) y The Economist.

The Economist, 29 de diciembre de 1979, 41. Sunday Times (Londres), 16 de diciembre de 1979, 54. Business Week, 9 de abril de 1979, 99.

En el primer gráfico que estudiamos, la variación gráfica ocultaba un aspecto curioso e imprevisto de los datos: en los cuatro años anteriores a las subidas de 1979–1980, el precio del crudo había disminuido. Ocupado con la decoración, al gráfico se le escapó la noticia.

For Zabdiel Ramos Banda

integridad gráfica 65

El Caso de la Vertiginosa Escalada del Gasto Público Probablemente el gráfico que se publica con más frecuencia, además de los mapas del tiempo y las oscilaciones de la Bolsa, es el perfil de la deuda y el gasto público a lo largo de los años. Estos diseños casi siempre dan la impresión de que el gasto y la deuda están aumentando de forma desorbitada. Playfair, como es habitual, también fue el pionero de este campo con la publicación de este excelente gráfico en 1786. Se trata del primer gráfico sobre el gasto público, que Playfair acompañó con su polémica declaración contra la “locura ruinosa” de la política británica al financiar sus guerras coloniales mediante deuda pública. Este diseño inauguraba doscientos años de historia de este tipo de diagramas. Es uno de los pocos ejemplares de Playfair que es más alto que largo; menos de una décima parte de sus gráficos lo son (de un total de 90, elaborados a lo largo de 35 años). En este caso, la altura refuerza la imagen del crecimiento rápido. Las cantidades monetarias no están ajustadas por la inflación. Pero Playfair tuvo la honestidad de mostrar una versión alternativa unas páginas mas adelante en el The Commercial and Political Atlas. Trazó el interés de la deuda nacional sobre una escala horizontal más larga, amortiguando así el efecto del crecimiento vertiginoso, y aclaró, “Está en millones reales, no nominales” (p. 129):

66 prácticas gráficas

Aunque en su obra de 1786 Playfair corrigió las unidades monetarias según la inflación, la cuestión plantea muchas dificultades incluso para los investigadores modernos. El siguiente gráfico refuerza su tesis política al no tener en cuenta la inflación y el crecimiento de la población, y usar una forma alta y delgada (el área cubierta por los datos es 2.7 veces más alta que ancha):

Morris Fiorina, Congress: Keystone of the Washington Establishment (New Haven, 1977), 92.

Crecimiento del Gobierno: gasto público en áreas determinadas

Estudiemos con detenimiento otro gráfico sobre el gasto público:

New York Times, 1 de febrero de 1976, iv-6.

For Zabdiel Ramos Banda

integridad gráfica 67

Pese a la impresión creada por este diseño hiperactivo, el presupuesto del estado de Nueva York no aumentó durante los últimos nueve años representados en él. Para generar la falsa impresión de un incremento sustancial y constante en el gasto, el gráfico emplea varios trucos estadísticos y visuales, todo ello con el fin de exagerar el aumento presupuestario. Estas son las artimañas gráficas:

Estos tres paralelepípedos han sido ubicados en un plano óptico anterior respecto a los otros ocho, para dar la impresión de que los últimos presupuestos superan a los antiguos.

La acumulación del texto resalta y alarga el valor mínimo para 1966–1967, reforzando la impresión de que los últimos años han subido a partir de una base pequeña y estable. Las flechas horizontales surten un efecto similar.

Este bloque compacto de texto contribuye a crear la imagen de un presupuesto compacto y pequeño en el pasado.

Si eliminamos la distorsión producida por el montón de chatarra gráfica tendremos una imagen más sosegada a la izquierda:

Las flechas apuntando hacia arriba subrayan el crecimiento reciente. Compare con las flechas horizontales de la izquierda.

68 prácticas gráficas

El gráfico también se halla condicionado por dos deslices estadísticos. En primer lugar, durante esos años la población aumentó en 1.7 millones de personas, es decir, un 10 por ciento. Parte de la subida presupuestaria se limitaba a reflejar dicho crecimiento. En segundo lugar, la inflación se mantuvo alta durante ese período y los productos que le costaban al Estado $1.00 dólar en 1967, subieron a $2.03 dólares en 1977. Al no corregir el efecto de la inflación, el gráfico mezcla la variación del valor del dinero con la variación del presupuesto. Pero la aritmética nos permite tener en cuenta los efectos de la población y la inflación y así, al calcular los gastos en dólares constantes (reales) per cápita, se nos revela una imagen muy distinta y mucho más fiel a la realidad: Gastos presupuestarios per cápita, en dólares constantes

Por lo tanto, en términos de gasto real per cápita, el presupuesto estatal aumentó en torno al 20 por ciento desde 1967 a 1970, y permaneció relativamente constante desde 1970 hasta 1976, mientras que el presupuesto de 1977 supuso un descenso sustancial en los gastos. Ésta es la auténtica información, que pasaba desapercibida en el “Gráfico de los paralelepídos mágicos”. Es evidente que no hay manera de reproducir las complejidades de un presupuesto mediante un pequeño conjunto de cifras, pero, en cualquier caso, ¿por qué recurrir a la mentira? Principio: En series temporales económicas, las unidades monetarias estandarizadas y ajustadas según la inflación son casi siempre preferibles a las unidades nominales.

For Zabdiel Ramos Banda

integridad gráfica 69

Área Visual y Medidas Numéricas Otra fuente de confusión entre la variación de los datos y la variación del diseño es el uso del área para representar datos unidimensionales:

R. Satet, Les graphiques (París, 1932), 12.

Les presentamos al increíble doctor menguante, con un factor de mentira del 2.8, sin contar la exageración adicional provocada por la perspectiva y el espaciado incorrecto de los datos:

Los Angeles Times, 5 de agosto de 1979, 3.

70 prácticas gráficas

Muchos gráficos que utilizan el área para representar magnitudes cometen el error elemental de variar ambas dimensiones simultáneamente para reflejar los cambios de datos unidimensionales. Un ejemplo típico es la falacia del dólar menguante. Para mostrar el índice de inflación, los gráficos muestran los billetes decreciendo en dos dimensiones, aunque el valor del dinero es unidimensional. A continuación vemos uno entre cientos de gráficos similares:

Washington Post, 25 de octubre de 78, 1.

Si el área del dólar reflejase con exactitud su poder adquisitivo, la imagen del dólar de 78 debería ser el doble de grande.

For Zabdiel Ramos Banda

integridad gráfica 71

La conversión de una superficie bidimensional en un número unidimensional es un proceso lleno de ambigüedades. Los cambios en las áreas representadas sobre la superficie de un gráfico no implican necesariamente cambios en la percepción correspondiente de dichas áreas. La cosa empeora aún más cuando las áreas se presentan en tres dimensiones: Según la superficie de las áreas, el factor de mentira de este gráfico es de 9.4. Pero si uno toma al pie de la letra la imagen del barril y asume que el precio está representado por el volumen, resulta que el volumen aumenta en un 27,000 por ciento de 1973 a 1979, mientras que los datos correspondientes sólo se incrementan en un 454 por ciento. El factor de mentira resultante es de 59.4 por ciento. Todo un récord. Del mismo modo, la siguiente representación tridimensional infla los datos unidimensionales:

New York Times, 27 de enero de 1981, d-1.

Conclusión: El uso de dos o tres dimensiones variables para mostrar datos unidimensionales es una técnica débil e ineficaz, capaz de manejar sólo conjuntos pequeños de datos, a menudo con errores de diseño y ambigüedad perceptiva. Estos diseños causan tantos problemas que es mejor evitarlos: El número de dimensiones variables en el gráfico no debe exceder el número de dimensiones de los datos.

Este diagrama histórico del servicio de correos italiano respeta este principio con coherencia prácticamente absoluta: el número de libretas de ahorros expedidas y la cantidad media de los depósitos dan como resultado el producto total de los depósitos al final de cada mes, desde 1876 hasta 1881.

Antonio Gabaglio, Teoria Generale della Statistica (Milán, segunda edición, 1888).

For Zabdiel Ramos Banda

integridad gráfica 73

Los círculos de Playfair constituyen uno de los primeros usos del área para mostrar la magnitud. Pero no se ajustan a este principio, pues representan los datos unidimensionales (la población urbana) con una unidad de área:

Tal vez sería mejor hacer una excepción con los gráficos que se asemejan a ilustraciones. ¿Cómo resistirse a este pollo de casi dos toneladas?

Scientific American Reference Book (Nueva York, 1909), 280.

74 prácticas gráficas

El Contexo es Esencial para la Integridad Gráfica Los gráficos estadísticos honestos y reveladores deben responder al interrogante esencial del pensamiento cuantitativo: “¿Comparado con qué?”. Los diseños pobres y ligeros de datos deben despertar nuestra sospecha porque los gráficos suelen mentir por omisión, ofreciendo datos insuficientes para establecer comparaciones. El principio: Los gráficos no deben ofrecer datos fuera de contexto. En la siguiente imagen, casi todas las cuestiones importantes se dejan sin contestar: Antes de reforzar la vigilancia

Fallecidos en accidente de tráfico en Connecticut antes (1955) y después (1956) de reforzar la vigilancia policial sobre el exceso de velocidad

Después de reforzar la vigilancia

El valor informativo aumenta enormemente con unos pocos datos: Fallecidos en accidente de tráfico en Connecticut, 1951–1959

For Zabdiel Ramos Banda

integridad gráfica 75

Imaginemos otras interpretaciones posibles del cambio ocurido entre 1955–1956:

La comparación con estados limítrofes ofrece un contexto todavía mejor, al mostrar que el descenso en los fallecidos en accidente de tráfico no ocurrió solamente en Connecticut durante el año en que la policía persiguió con dureza el exceso de velocidad: Fallecidos en accidentes de tráfico por 100,000 habitantes en Connecticut, Massachusetts, Rhode Island y Nueva York, 1951‒1959

Nueva York

Massachusetts Connecticut Rhode Island

Donald T. Campbell y H. Laurence Ross, “The Connecticut Crackdown on Speeding: Time Series Data in QuasiExperimental Analysis”, en Edward R. Tufte, ed., The Quantitative Analysis of Social Problems (Reading, Mass., 1970), 110-125.

76 prácticas gráficas

Conclusión Los diagramas mentirosos perjudican a todo el mundo gráfico. Como los embustes suelen aparecer en los medios informativos, la falsedad se multiplica: cuando un gráfico miente en televisión, miente diez millones de veces; cuando lo hace en el New York Times miente 900,000 veces a muchos lectores importantes e influyentes. Se trata de falsedades sobre política estatal, como el presupuesto, la sanidad, los precios y las normas de ahorro de combustible. Las mentiras son sistemáticas y muy predecibles, pues casi siempre exageran el ritmo de los cambios recientes. Los autores se defienden alegando que “Al menos era más o menos correcto, nuestra intención era indicar la tendencia general del cambio”. Pero muchas de las imágenes engañosas que hemos visto en este capítulo eran auténticas mentiras, demasiado sustanciales para ser consideradas como aproximadamente correctas; en algunos gráficos ni siquiera valdría la definición más laxa del término “correcto”, pues falsificaron la auténtica noticia contenida en los datos. Una característica esencial de los números es que además de tener un orden, tienen una magnitud. Los números miden la cantidad. Los gráficos pueden representar la cantidad de los cambios, además de su sentido. La filosofía de reflejar correctamente sólo la dirección y no la magnitud es un característica de la Escuela Pravda de Gráficos Ordinales. Cada uno de sus gráficos muestra un clarísimo sentido de la dirección, junto a magnitudes descabelladas.

Pravda, 24 de mayo de 1982, 2.

For Zabdiel Ramos Banda

integridad gráfica 77

La segunda línea de defensa de los gráficos falsos es que, aunque el diseño mienta, el gráfico ofrece además los valores numéricos para aquellos puntillosos que quieran conocer con exactitud las cantidades representadas. Como si decir la verdad en un apartado justificara las mentiras multiplicadas por quince en el otro. Pocos periodistas podrían trabajar con unas normas de veracidad tan pobres y los diseñadores gráficos deberían guiarse por el mismo patrón. La integridad gráfica tiene más posibilidades existir si se siguen estos seis principios: La representación visual de números, tal y como aparecen en la superficie del gráfico, debe ser directamente proporcional a las cantidades numéricas representadas. Las notaciones deben ser claras, detalladas y exhaustivas para evitar la distorsión gráfica y la ambigüedad. Escriba las explicaciones de los datos en el propio gráfico. Consigne los hechos relevantes. Muestre la variación de los datos, no la del diseño. En las series temporales económicas, las unidades monetarias estandarizadas y ajustadas según la inflación son casi siempre preferibles a las unidades nominales. El número de dimensiones variables usadas en el gráfico no debe exceder el número de dimensiones de los datos. Los gráficos no deben ofrecer datos fuera de contexto.

3

Fuentes de Integridad y Sofisticación Gráficas

¿Por qué se diseñan gráficos que mienten? ¿Por qué se publican en los principales periódicos y revistas de todo el mundo¹? Las distorsiones gráficas a veces provienen de los prejuicios y los estereotipos de sus autores, pero la causa principal de la ineptitud gráfica se encuentra en las técnicas, las actitudes y la estructura organizativa predominante en el sector del diseño de gráficos estadísticos. Falta de Aptitudes Matemáticas de los Artistas Gráficos Detrás de la incompetencia a menudo se encuentra una falta de conocimientos sobre el contenido de los datos. Casi todos los creadores de gráficos para publicaciones de gran tirada poseen una formación exclusivamente artística y han tenido poca experiencia en el análisis de datos, fundamental para alcanzar la precisión y elegancia necesarias en las presentaciones estadísticas. Pero incluso los manuales de diseño gráfico ignoran cómo analizar los números. A menudo, los ilustradores conciben su trabajo como una tarea exclusivamente artística y utilizan sin cesar los términos “creativo”, “concepto” y “estilo”, como una jerga para los iniciados en la modesta tarea de construir una serie temporal con unos cuantos puntos. Salen triunfadores aquellos que embellecen los datos, sin importarles la integridad estadística.

¹ “Es difícil saber por qué se repiten estos mismos errores. En la obra original de Playfair no ocurría; es más, se hallan mucho más extendidos ahora que en los años 30. Quizás la razón sea un supuesto aumento en la demanda de gráficos […] sin un incremento parejo en la formación de sus creadores. Según las pruebas reunidas por la American Statistical Association (Asociación Norteamericana de Estadística), los estudios de estadística gráfica han sufrido un descenso en todos los niveles durante las últimas décadas”. Howard Wainer, “Making Newspaper Graphs Fit to Print”, en Paul A. Kolers, et al., eds. Processing of Visible Language 2 (Nueva York, 1980), 139.

La Teoría de que los Datos Estadísticos son Aburridos Los gráficos inadecuados han proliferado debido también a que muchos artistas gráficos consideran la estadística aburrida y tediosa. Por lo tanto, los gráficos decorados deben reavivar, animar y muy a menudo exagerar el contenido de los datos. Por ejemplo: • El primer especialista gráfico de la revista Time, graduado en Bellas Artes, dice de su trabajo: “El desafío consiste en presentar las estadísticas como una idea visual, y no como un tedioso desfile de números”². • La primera frase del capítulo sobre gráficos estadísticos de Jan White, Graphic Idea Notebook, dice: “¿Por qué son tan aburridas las

² Time, 11 de febrero de 1980, 3.

For Zabdiel Ramos Banda

80 prácticas gráficas

estadísticas?”. Los ejemplos revelan, se supone “Estadísticas insulsas convertidas en gráficos simbólicos” y “estadísticas simples embellecidas o humanizadas con imágenes”³. • El excelente libro de Herdeg Graphis/Diagrams, es descrito por su editor como “Un compendio internacional que demuestra convincentemente que los gráficos estadísticos y los diagramas no tienen por qué ser sosos”⁴.

³ Jan V. White, Graphic Idea Notebook (Nueva York, 1980), 148, 165.

⁴ Walter Herdeg, ed., Graphis/Diagrams (Zurich, 1976).

La teoría de los datos aburridos obedece a fines políticos, pues favorece ciertos intereses sobre otros en las luchas burocráticas por controlar los recursos de una publicación determinada. Si los números son aburridísimos, entonces hace falta un artista, o varios, o incluso todo un departamento de arte con director incluido, para que la audiencia no se duerma. Esta doctrina prefiere otorgar el control de los gráficos a los diseñadores, en vez de a los redactores que dominan la materia. Al dar preminencia al arte, el estilo sustituye al contenido. Y los redactores, tras perder su posición frente los decoradores de datos, se consuelan pensando que las estadísticas son una pesadez de todas formas. Si sus estadísticas son aburridas, es que se ha equivocado de números. Encontrar los adecuados requiere tanto trabajo y conocimientos especializados, conocimientos estadísticos, como crear un diseño hermoso o cubrir una complicada noticia de actualidad.

La Teoría de que los Gráficos son sólo para Lectores Mediocres Muchos creen que los gráficos deben divertir y entretener al público que encuentra el texto demasiado difícil. Por ejemplo: • La publicación Consumer Reports describe el diseño de su nueva revista infantil: “En el primer número, los especialistas de CU produjeron un artículo sobre el azúcar que tenía más gráficos que información. Temíamos que los niños se vieran abrumados por el exceso de datos”⁵.

⁵ Consumer Reports, 45 (julio de 1980), 408.

• Un director artístico que supervisaba el diseño de unos 3000 gráficos anuales (unos 2.5 billones de imágenes impresas) dijo que los gráficos están concebidos para atraer a los lectores concentrados en la publicidad y no para explicar las noticias con detalle. “A diferencia de los anuncios”, dijo, “al menos no incluimos mujeres desnudas en nuestros gráficos”⁶.

⁶ Louis Silverstein, “Graphics at the New York Times”, presentado en la First General Conference on Social Graphics, Leesburg, Virginia, 23 de octubre de 1978.

fuentes de integridad y sofisticación gráficas 81

• El director de informativos de una cadena de televisión nacional dijo que los gráficos deben entenderse instantáneamente: “Si hace falta explicarlos, no los use”⁷.

⁷ Entrevista con el autor, julio de 1980.

Este tipo de teoría conduce a casos como éste: La cafetería de la empresa fue utilizada por 9 de cada 10 empleados durante el año fiscal 1949

Mary Eleanor Spear, Charting Statistics (Nueva York, 1952), 5, quien lo describe con justicia como “gráfico innecesario”.

Consecuencias Las palabras de E. B. White sobre la escritura pueden aplicarse también a los gráficos estadísticos: “Es imposible escribir decentemente si el escritor desconfía de la inteligencia del lector o muestra una actitud condescendiente”⁸. El desprecio por los gráficos y sus lectores, junto a la falta de conocimientos cuantitativos, tiene consecuencias catastróficas para la obra gráfica: exceso de decoración y diseños simplistas, escasez de datos y abundancia de mentiras. Como la censura, estas restricciones sobre el diseño gráfico conducen a una comunicación elíptica y excéntrica. En su afán por evitar las sutilezas del diagrama de dispersión, los artistas dibujaron estos intrincados especímenes, forzando los datos de dos variables en un diseño de una sola:

⁸ En William Strunk, Jr. y E. B. White, The Elements of Style (Nueva York, 1959), 70.

New York Times, 16 de junio de 1980, a-18. Allen D. Manvel, “Taxation and Economic Growth”, Taxation with Representation Newsletter, 9 (junio de 1980), 3.

For Zabdiel Ramos Banda

82 prácticas gráficas

Aparte de estudiar varios ejemplos, analicemos de forma sistemática el nivel de organización gráfica predominante en distintas publicaciones. Para poder comparar mayor variedad de periódicos, revistas, publicaciones científicas y libros, he recogido una muestra de su sofisticación gráfica: la porción de gráficos relacionales de cada publicación, es decir, los diagramas que relacionan dos o más variables, exceptuando las series temporales y los mapas. Los gráficos relacionales son una parte esencial del análisis estadístico competente, ya que cuestionan las afirmaciones sobre causa y efecto con datos empíricos que muestran cómo una variable afecta a la otra. El diseño es simple, aunque no tanto como el gráfico de barras, las series temporales o el mapa de datos. Los gráficos relacionales se usan desde 1765 y cada año aparecen de millones de formas distintas. Se ha demostrado que los niños de 12 años son capaces de entender su estructura.⁹ Todos estos gráficos se consideran sofisticados, según nuestra poca exigente definición:¹⁰

⁹ Clara Francis Bamberger, “Interpretation of Graphs at the Elementary School Level”, Catholic University of America Educational Research Monographs, 13 (mayo de 1942). A continuación presentamos información adicional sobre libros de texto y exámenes oficiales.

De cada una de las 15 publicaciones, seleccionamos al azar varios números publicados entre 1974 y 1980. Examinamos un total de 4000 gráficos aproximadamente. La muestra representa un conjunto de 250 a 300 billones de gráficos, ajustando los datos según la frecuencia y la circulación de la publicación.

New York Times, 29 de febrero de 1976, 46.

¹⁰ Existen distintas definiciones de inteligencia y complejidad gráficas. Otro factor, la densidad de los datos, se discutirá en el Capítulo 8.

Isao Sato y Miyohei Shinohara, New Politics and Economics (Tokio, 1974), 113; un libro de texto japonés.

fuentes de integridad y sofisticación gráficas 83

La Tabla 1 muestra los resultados y clasifica los 15 periódicos y revistas por orden de sofisticación gráfica. Siete de ellos, desde Pravda al Wall Street Journal, no publicaron ningún gráfico relacional en los números estudiados y en su mayoría se limitaron a las series temporales. Otros publicaron gráficos más avanzados: los japoneses Asahi (diario de gran circulación), Akahata (“Bandera roja”, periódico del Partido Comunista que parece haber contratado a un artista gráfico sofisticado y capaz en 1979) y Nihon Keizai (un diario financiero), además de Der Spiegel y The Economist. Aunque ninguno de ellos llegaba a los niveles de sofisticación encontrados en las publicaciones científicas (una muestra aleatoria de 220 gráficos aparecidos en Science entre 1978‒1980 incluía un 42 por ciento de gráficos relacionales), es evidente que los diarios y revistas de información general pueden ofrecer cierto grado de inteligencia gráfica, al menos en Japón y en algunos semanarios europeos. Tabla 1 Sofisticación gráfica en la prensa internacional, 1978–1980 Porcentaje de gráficos estadísticos basados en más de una variable, excepto series temporales o mapas de datos

Número de gráficos en la muestra

Akahata (“Bandera roja”) (Japón, diario, circulación 30,000)

9.3%

202

Asahi Shimbun (Japón, diario, 8,000,000)

7.6%

119

Der Spiegel (Alemania, semanal, 1,000,000)

5.7%

454

The Economist (Gran Bretaña, semanal, 170,000)

2.0%

342

Nihon Keizai Shimbun (Japón, diario financiero, 1,700,000)

1.7%

297

Le Monde (Francia, diario, 440,000)

0.7%

144

Business Week (EE.UU., semanal, 800,000)

0.6%

726

New York Times (EE.UU., diario, 900,000; domingos, 1,500,000)

0.5%

422

Pravda (URSS, diario, 10,500,000)

0.0%

54

Frankfurter Allgemeine (Alemania, diario, 300,000)

0.0%

93

The Times (Gran Bretaña, diario, 400,000)

0.0%

107

Washington Post (EE.UU., diario, 600,000; domingos, 800,000)

0.0%

121

Time (EE.UU., semanal, 4,300,000)

0.0%

147

Die Zeit (Alemania, semanal, 300,000)

0.0%

213

Wall Street Journal (EE.UU., diario, 2,000,000)

0.0%

449

For Zabdiel Ramos Banda

84 prácticas gráficas

La cultura gráfica de los japoneses se debe a la presencia constante de la estadística en el lugar de trabajo y a su amplia formación matemática, incluso en los primeros años escolares:

¹¹ Andrew H. Malcolm, “Data-Loving Japanese Rejoice on Statistics Day”, New York Times, 28 de octubre de 1977, a-1.

[…] ninguna otra nación demuestra una pasión tan intensa por la estadística. En Japón hay una fiesta dedicada a la estadística, convenciones locales y nacionales, premios y concursos nacionales de recogida de datos estadísticos y elaboración de gráficos. “Este año”, dijo Yoshiharu Takahashi, un estadístico del Estado, “hemos tenido casi 30,000 participantes. Más exactamente, 29,836”. Las obras presentadas al concurso [para niños] pasaron tres rondas de jueces, que este año concedieron el primer premio a cinco niños de siete años. Su creación, titulada “Mamá, juega más tiempo con nosotros” fue el resultado de una encuesta entre 32 compañeros de clase sobre la frecuencia con que sus madres jugaban con ellos y las razones que les daban para no hacerlo.[…] Otros trabajos examinaban la frecuencia del uso del teléfono en su familia y relacionaban la temperatura con el canto de las cigarras¹¹. Nótese que el último gráfico mencionado es un diagrama relacional. Las cinco publicaciones norteamericanas de la muestra quedan al final de la lista mundial, junto al Pravda y algunos periódicos europeos. Observe, en la Tabla 1, la absoluta preponderancia de los diseños no relacionales en los periódicos y revistas clasificados al final. Es un hecho desafortunado porque el gráfico relacional, al contrario que los diseños más simples, es un gráfico explicativo y, por tanto, perfecto para las noticias y el análisis. Los gráficos estadísticos de los libros de texto escolares y universitarios son más sofisticados que los publicados en la prensa. De hecho, los niños de primaria pueden tener más experiencia con gráficos relacionales que un adulto que se limita al Business Week, New York Times, Time, Wall Street Journal y Washington Post. Las Tablas 2 y 3 recogen la sofisticación gráfica de los libros de texto y de algunos exámenes oficiales. Al comparar estos datos con los de la Tabla 1, se deduce que la mayoría de la prensa, excepto la japonesa, opera en un nivel de inteligencia y diseño gráfico de pre-adulto¹².

¹² Los lectores de prensa, especialmente de publicaciones de calidad, poseen una considerable altura cultural y profesional, con los consiguientes conocimientos gráficos. Alrededor de un 80 por ciento del millón y medio de lectores del New York Times dominical asistieron a la universidad, según una encuesta de mercado de 1980 realizada por el periódico. El público es más inteligente de lo que piensan algunos ilustradores.

fuentes de integridad y sofisticación gráficas 85

Tabla 2 Sofisticación Gráfica en Libros de Texto Escolares y Universitarios Porcentaje de gráficos estadísticos basados en más de una variable, exceptuando series temporales y mapas

Número de gráficos

Medicina y salud pública: 11 artículos en Judith Tanur, et al., Statistics: A Guide to the Unknown

82%

17

Introduction to Psychology, de Ernest Hilgard, et al.

68%

82

General Chemistry, de Linus Pauling

66%

53

Life on Earth, de Edward Wilson et al.

47%

59

Meteorología, astronomía, ingeniería: 7 artículos en Tanur, Statistics: A Guide to the Unknown

44%

9

Comunicaciones, trabajo, educación, economía: 20 artículos en Tanur, Statistics: A Guide to the Unknown

43%

35

Political Behavior of the American Electorate, de William H. Flanigan y Nancy H. Zingale

42%

43

Economics, de Paul Samuelson

16%

57

Democracy in America, de Robert A. Dahl

8%

25

American Government, de James Q. Wilson

0%

39

Chemical Principles, de William Masterton y Emil Slowinski

77%

27

The Project Physics Course, de Harvard Project Physics

48%

33

New Politics and Economics, de Isao Sato y Miyohei Shinohara (japonés)

27%

22

Biological Science: An Ecological Approach, Biological Sciences Curriculum Study

18%

28

The American Economy, de Roy J. Sampson, et al.

5%

132

Sociology: The Study of Human Relationships, de LaVerne Thomas y Robert Anderson

0%

3

New Ethics and Social Science, de Yokichi Yajima, et al. (japonés)

0%

5

Rise of the American Nation, de Lewis Paul Todd y Merle Curti

0%

39

Magruder’s American Government, revisado por William McClenaghan

0%

70

textos universitarios:

textos escolares de secundaria:

For Zabdiel Ramos Banda

86 prácticas gráficas

Tabla 3 Sofisticación Gráfica en Exámenes Escolares Porcentaje de gráficos estadísticos basados en más de una variable, exceptuando series temporales y mapas

Número de gráficos

Examen nacional de admisión a la universidad, Japón, 1979 y 1980

100%

16

Materiales de repaso, Examen de admisión a la facultad de derecho, Estados Unidos, 1975

48%

29

Ciencias, 14 exámenes

67%

64

Aritmética, matemáticas, álgebra, y geometría analítica; 21 exámenes

41%

37

Ciencias sociales, historia y gobierno; 14 exámenes

24%

49

Conocimientos generales, 5 exámenes

21%

47

Exámenes oficiales para la escuela primaria, secundaria y la universidad; EE.UU., década de los 70:*

*Gráficos reunidos por James R. Beniger, compilador, en Selected Standardized Test Items that Measure Ability with Graphics (Washington, D.C.: Bureau of Social Science Research, 1975).

En muchos medios de comunicación la integridad se mide con distinto rasero según se trate de palabras o de gráficos, y lo mismo ocurre con la sofisticación. Los gráficos estadísticos son estúpidos; la prosa es a menudo seria y a veces requiere cierta especialización, como puede verse en estos párrafos sacados de un solo número del New York Times: El reciclaje de los petrodólares puede posponer el momento de hacer las cuentas, pero sus efectos serían intolerables sin una depreciación constante de su poder adquisitivo. La fluctuación de los tipos de interés no puede restaurar ni siquiera la apariencia de equilibrio. Varias facetas de la interpretación parecen decididamente anticuadas, si no absolutamente excéntricas: el rígido fraseo instrumental y el ritmo fatigoso de las arias, el tratamiento romantizado de los coros, la demora excesiva en las cadencias y las improvisaciones, a menudo entrometidas, del bajo continuo y una expresión incoherente, que va desde el énfasis mahleriano hasta la literalidad musical. El Tribunal no ha dado muestras de retractarse de su opinión según la cual el gobierno estatal está protegido por la inmunidad soberana contra las órdenes judiciales de resarcimiento por daños por infracciones pasadas. Y el Dr. Garth Graham, director médico de Smithkline Corp., fabricante de Thorazine, observó que los neurolépticos no producen euforia y por eso no es probable que los pacientes con antecedentes de alcoholismo y drogodependencia abusen de ellos. “Si acaso, es un fármaco disforogénico”, dijo el Dr. Graham.

fuentes de integridad y sofisticación gráficas 87

Conclusión Muchos gráficos estadísticos se elaboran en condiciones que garantizan la mediocridad gráfica: falta de conocimientos tanto matemáticos como de las materias específicas por parte de los ilustradores, antipatía hacia los datos numéricos y desprecio a la inteligencia de los lectores. Los gráficos resultantes (1) mienten, (2) emplean sólo diseños simplistas, a menudo series temporales con datos escasos y (3) omiten la auténtica información de los datos. El tremendo poder comunicativo de los gráficos se desperdicia para decorar unos cuantos números. Es más, buena parte del mundo está sometida a constante observación y evaluación cuantitativas, y los gráficos bien diseñados son mucho más efectivos que las palabras para mostrar dichas observaciones. ¿Cómo puede remediarse la mediocridad gráfica? Podemos empezar rechazando de una vez por todas las teorías que proclaman que los gráficos de datos son para los torpes y que las estadísticas son aburridas. Estas doctrinas culpan a las víctimas (los lectores y los datos) en lugar de responsabilizar a los perpetradores del delito gráfico. La competencia gráfica exige tres aptitudes distintas: la estadística, la artística y el dominio de la materia específica. Sin embargo, la mayoría de los gráficos estadísticos, particularmente en la prensa, se halla bajo la dirección de un solo departamento: el artístico. Permitir que los artistas-ilustradores controlen el diseño y el contenido de los gráficos estadísticos es comparable a dejar en manos de los tipógrafos el contenido, estilo y corrección de la prosa. Los expertos en el cálculo y en el contenido del gráfico en cuestión también deben participar en el diseño si se pretende conseguir la integridad estadística y la sofisticación gráfica.

For Zabdiel Ramos Banda

SEGUNDA PARTE

Teoría de los Gráficos de Datos

Todos hablaban de un exceso de información, pero en realidad era un exceso de no información. Richard Saul Wurman, What-If, Could-Be (Filadelfia, 1976)

For Zabdiel Ramos Banda

4

Tinta Informativa y Rediseño de Gráficos

L os gráficos estadísticos deben dirigir la atención del lector exclusivamente hacia el sentido y la esencia de los datos. El formato elegido debe limitarse a presentar los contenidos cuantitativos. Aunque en ocasiones la calidad artística del diseño lo convierte en una obra de arte digna del Museo de Arte Moderno de Nueva York, los gráficos son esencialmente instrumentos que ayudan a reflexionar sobre información cuantitativa. Los primeros diagramas de Playfair dedicaban demasiada tinta (es decir, elementos gráficos) al aparato gráfico, con cuadrículas y leyendas elaboradas. Esta serie temporal, grabada en agosto de 1785, aparecía en las páginas iniciales de The Commercial and Political Atlas:

92 teoría de los gráficos

Tan sólo un año después, Playfair había eliminado gran parte de los detalles ornamentales en favor de un diseño más pulcro que centraba la atención en la propia serie temporal. En aquella época comenzó a trabajar con un nuevo grabador y juntos produjeron diseños nítidos y elegantes:

Esta mejora en el diseño ilustra el principio fundamental de un buen gráfico estadístico: Lo principal es mostrar los datos. Este principio constituye la base para la teoría de los gráficos estadísticos.

For Zabdiel Ramos Banda

tinta informativa 93

Tinta Informativa La mayor parte de la tinta utilizada en los gráficos debe mostrar la información, y sus variaciones deben coincidir con la variación de los datos. La tinta informativa es el núcleo del gráfico del que no se puede prescindir y sus elementos están organizados conforme a la variación de los números representados. Así pues, proporción de tinta informativa =

tinta informativa tinta total del gráfico

= proporción de la tinta de un gráfico que muestra información cuantitativa = 1.0 – proporción de un gráfico que puede borrarse sin que se pierda información alguna. Pocos gráficos usan todos sus elementos para representar cantidades. En las ocho bandas de este encefalograma no se puede borrar nada sin perder información. Los datos evolucionan y a partir de la actividad de fondo dan lugar a una serie de picos. Fíjese en la escala en la parte inferior derecha del último bloque:

Kenneth A. Kooi, Fundamentals of Electroencephalography (Nueva York, 1971), 110.

94 teoría de los gráficos

En este gráfico predomina tinta informativa (los puntos y las leyendas sobre la diagonal) respecto al 10 ‒ 20 por ciento de tinta sin información (los ejes y las líneas que marcan los intervalos):

John Tyler Bonner, Size and Cycle: An Essay on the Structure of Biology (Princeton, 1965), 17.

En cambio, el siguiente diagrama utiliza casi toda la tinta de forma superflua y los números se pierden en el mar de la cuadrícula (los débiles puntos diseminados cerca de la diagonal):

For Zabdiel Ramos Banda

tinta informativa 95

Otra versión de los mismos datos aumentó la proporción de tinta informativa en 0.7, mejorando el resultado:

Pero una tercera edición de la misma figura olvidó trazar los puntos y se limitó a copiar la cuadrícula del original, incluyendo una hilera adicional innecesaria en los márgenes superior y derecho. La figura resultante consigue una absoluta nulidad gráfica, una proporción de tinta informativa igual a cero:

Los tres gráficos fueron publicados, repectivamente, en Stanley Kelley, Jr., Richard E. Ayres y William G. Bowen, “Registration and Voting: Putting First Things First”, American Political Science Review, 61 (1967), 371; y reproducidos en Edward R. Tufte, ed., The Quantitative Analysis of Social Problems (Reading, Mass., 1970), p. 267; y de nuevo en William J. Crotty, ed., Public Opinion and Politics: A Reader (Nueva York, 1970), 364.

96 teoría de los gráficos

Maximizar la Proporción de Tinta Informativa Cuanto mayor sea la proporción de tinta informativa, siendo iguales los demás aspectos relevantes, mejor será el gráfico: Maximice la proporción de tinta informativa, dentro de lo razonable. Cada gota de tinta debe tener su razón de ser, que casi siempre será presentar información nueva. El principio tiene muchas consecuencias fundamentales para la edición y el diseño gráficos. De hecho, alrededor de dos tercios de los gráficos estadísticos podrían beneficiarse de su aplicación sensata. Para el tercio restante, la proporción no está bien definida o no resulta apropiada. Pero lo más importante es que partiendo de la idea de maximizar la proporción de tinta informativa surgen otros principios del diseño gráfico.

Dos principios de eliminación Una estrategia complementaria para aumentar la proporción de tinta informativa es aplicar el principio de eliminación: Elimine la tinta no informativa, dentro de lo razonable. Si la tinta no representa información estadística, tiene escaso interés para el lector y supone un obstáculo para la comprensión de los datos, como en el caso de cuadrículas muy densas. Aunque en ocasiones esta tinta aburrida sirve de escenario para desarrollar la acción de los datos, resulta sorprendente la frecuencia con que los mismos datos son capaces de establecer su propio escenario, como veremos en el Capítulo 7. La tinta informativa redundante representa el mismo número una y otra vez. Esta barra sombreada, con la cifra escrita encima, ofrece la altitud sin ambigüedad de seis formas distintas: 35.9

Si eliminamos cinco de ellas, la restante seguiría indicando la altura: (1) la altura de la línea izquierda de la barra, (2) la altura del sombreado, (3) la altura de la línea derecha del sombreado, (4) la posición de la línea horizontal superior de la barra, (5) la posición, no el contenido, del número sobre la barra y (6) el propio número. Son muchas más de las

For Zabdiel Ramos Banda

tinta informativa 97

necesarias. La decoración gratuita y el refuerzo de las unidades de datos generan mucha tinta informativa redundante:

La simetría bilateral de las unidades de datos también resulta redundante, como en los diagramas de cajas, las barras huecas y las caras de Chernoff:

Las medias caras ofrecen la misma información que las completas y pueden ser más fáciles de clasificar (agrupando la mitad derecha de una cara sin clasificar con una mitad izquierda clasificada). Además, se puede usar una cara completa asimétrica para representar variables adicionales¹. La simetría bilateral ocupa el doble de espacio sin añadir información. Los pocos estudios realizados sobre la percepción de diseños simétricos indican que, “al mirar un jarrón, por ejemplo, el sujeto examina una de sus mitades simétricas, echa una rápido vistazo a la otra mitad y, al comprobar su simetría, deja de explorar.[…] El gozo de la simetría […] no reside en las propiedades físicas de la figura. Al menos los movimientos del ojo sugieren cualquier cosa menos simetría, equilibrio o reposo”².

¹ Bernhard Flury y Hans Riedwyl, “Graphical Representation of Multivariate Data by Means of Asymmetrical Faces”, Journal of the American Statistical Association, 76 (diciembre de 1981), 757-765. ² Leonard Zusne, Visual Perception of Form (Nueva York, 1970), 256-257.

98 teoría de los gráficos

En ocasiones la redundancia tiene su utilidad: proporcionar orden y contexto a los datos complejos, facilitar las comparaciones entre varias partes de los datos y tal vez crear cierto equilibrio estético. En las series temporales cíclicas, por ejemplo, deben repetirse partes del ciclo para que la vista pueda seguir cualquier parte del mismo sin tener que regresar al principio. Este tipo de redundancia posiblemente mejoraría el horario de trenes de 1880 elaborado por Marey. Los viajeros que salen de París o Lyon a última hora de la tarde ven que sus trenes desaparecen por el margen derecho del gráfico y aparecen otra vez en el izquierdo:

Añadiendo medio ciclo más, todos los trenes de las primeras 24 horas dispondrán de una línea continua en el horario (como ocurriría si se montara el gráfico original sobre una superficie cilíndrica):

For Zabdiel Ramos Banda

tinta informativa 99

Del mismo modo, las corrientes oceánicas superficiales del siguiente gráfico se perciben mejor si se contemplan en una vuelta y dos tercios alrededor del globo, en lugar de una sola:

Kirk Bryan y Michael D. Cox, “The Circulation of the World Ocean: A Numerical Study. Part 1, A Homogeneous Model”, Journal of Physical Oceanography, 2 (1972), 330.

100 teoría de los gráficos

Pero casi siempre los datos representados consisten en un único número y no hace falta recurrir a la repetición gráfica. A menos que la redundancia obedezca a un propósito claro, debe aplicarse el segundo principio de eliminación: Elimine la tinta informativa redundante, dentro de lo razonable.

Aplicación de los Principios Durante la Fase de Corrección Al igual que un buen editor de prosa elimina sin piedad las palabras innecesarias, el diseñador de gráficos estadísticos debe podar los elementos gráficos que no presentan información nueva. Aunque no hay nada mejor que la aplicación de una buena idea a un conjunto numérico interesante, revisar y corregir son tan esenciales en el campo del diseño gráfico como en el de la escritura. T. S. Eliot subrayó la “importancia capital de la crítica en la obra de creación. Es probable, incluso, que la mayor parte del trabajo de un autor sea su labor crítica; la labor de mover, combinar, construir, expurgar, corregir, comprobar: esta temible tarea tiene tanto de crítica como de creación”³. Veamos el siguiente ejemplo, que compara cada barra larga con la corta adyacente para mostrar al lector que, bajo distintas condiciones experimentales, la barra larga es más larga:

³ T. S. Eliot, “The Function of Criticism”, en Selected Essays – (Nueva York, 1932), 18.

James T. Kuznicki y N. Bruce McCutcheon, “Cross-Enhancement of the Sour Taste on Single Human Taste Papillae”, Journal of Experimental Psychology: General, 108 (1979), 76.

For Zabdiel Ramos Banda

tinta informativa 101

Una poda exhaustiva mejora mucho el diagrama, sin perder ni un solo dato del original. Es extraordinario cómo la simple eliminación es capaz de producir semejante transformación:

Las líneas horizontales indican las comparaciones pareadas y cambiarían si cambiase el diseño del experimento; por lo tanto se consideran tinta informativa. Se han eliminado todos los asteriscos, ya que todas las parejas son significativas desde el punto de vista estadístico. Esto puede explicarse en una nota. Aquí puede verse la mezcla de tinta no informativa y tinta informativa redundante que ha sido eliminada, alrededor del 65 por ciento del original:

102 teoría de los gráficos

La aritmética gráfica de los datos está representada de la siguiente manera (el diseño original es igual a la parte eliminada más la parte buena):

+

=

Volumen atómico

El gráfico siguiente, elaborado por el distinguido ilustrador científico Roger Hayward, muestra la periodicidad de ciertas propiedades de los elementos químicos, ejemplificadas por el volumen atómico como función del número atómico. La proporción de tinta informativa es menor que 0.6, debido a que los 76 puntos de la información y las curvas de referencia se ven obstaculizados por las 63 crucetas de la cuadrícula que desfilan por el plano como un ejército de mosquitos:

Numero atómico

Linus Pauling, General Chemistry (San Francisco, 1947), 64.

For Zabdiel Ramos Banda

tinta informativa 103

Las crucetas compiten con la información esencial del gráfico, es decir, las curvas que marcan los períodos y las observaciones empíricas. Las crucetas y parte del marco pueden borrarse sin problemas y así quedarían eliminadas en la ecuación de la proporción de tinta informativa:

Volumen atómico

La representación más limpia muestra otro aspecto de los datos: varios elementos no encajan bien en el trazado de las suaves curvas teóricas. La proporción de la tinta informativa se ha incrementado alrededor de un 0.9 y la única tinta no informativa son los dos ejes de coordenadas:

Numero atómico

104 teoría de los gráficos

Volumen atómico

Las curvas de referencia resultan esenciales para organizar los datos y mostrar su periodicidad, pues crean una estructura que confiere orden y jerarquía al conjunto de la información:

Numero atómico

Volumen atómico

Si recuperamos las crucetas de la cuadrícula, los datos siguen desorganizados, pues son demasiado llamativas y generan una desconcertante interferencia visual. Con estas crucetas, las curvas de referencia son más necesarias, ya que la vista necesita algún tipo de guía en este laberinto de puntos y cruces:

Numero atómico

For Zabdiel Ramos Banda

tinta informativa 105

El espacio liberado por esta limpieza puede utilizarse eficazmente: al añadir una notación para el elemento que inicia cada período, un alcalino, se muestra el principio de cada ciclo en la tabla periódica de los elementos, y en el gráfico. Se destacan las “tierras raras” y además la leyenda y los números del eje vertical se leen de izquierda a derecha en lugar de abajo a arriba, lo cual hace el gráfico un poco más accesible y amistoso:

Volumen atómico

tierras raras

Numero atómico

Conclusión Estos cinco principios de la teoría de gráficos estadísticos producen cambios sustanciales en el diseño gráfico. Los principios se aplican a muchos gráficos y ofrecen una serie de opciones en los diversos ciclos de revisión y corrección. Lo principal es mostrar los datos. Maximice la proporción de tinta informativa. Elimine la tinta no informativa. Elimine la tinta informativa redundante. Revise y corrija.

Rellenan los huecos con pinturas absurdas y en las llanuras inhabitables a falta de ciudades colocan elefantes. Crítica de Jonathan Swift a los cartógrafos del siglo XVII

For Zabdiel Ramos Banda

5

Chatarra Gráfica: Vibraciónes, Cuadrículas y Patos

La decoración interna de los gráficos genera gran cantidad de tinta que no aporta nada nuevo al lector. El propósito de la decoración varía: darle al gráfico un aspecto más científico y preciso, animar la imagen o proporcionar al diseñador la oportunidad de exhibir sus habilidades artísticas. Sea como fuere, se trata de elementos no informativos o redundantes, y a menudo de mera chatarra gráfica. La decoración gráfica, tan abundante en las publicaciones técnicas como en las comerciales y periodísticas, requiere menos esfuerzo que producir números interesantes y evidencia sólida. A veces se considera que la decoración refleja la contribución fundamental del artista al diseño, capturando la esencia de los datos y cosas por el estilo. Por este motivo se invoca a la integridad artística y la creatividad para defender, incluso promocionar, la causa de la chatarra gráfica. Hay mejores formas de retratar el espíritu y la esencia de los datos que enmarañarlos con gráficos estadísticos. Afortunadamente, las consideraciones artísticas no tienen nada que ver con la mayoría de estos adornos, pura parafernalia gráfica que se añade de forma rutinaria a todos los gráficos: exceso de cuadrículas y crucetas, representación redundante de datos simples, errores en el trazo del ordenador y muchas otras. Las distintas variedades de chatarra gráfica florecen como la mala hierba. A continuación examinaremos tres variedades muy extendidas, que abundan en los trabajos de investigación científicos y técnicos: los efectos ópticos involuntarios, la temida cuadrícula y el pato gráfico promocional. Hemos analizado cientos de ejemplos procedentes del ámbito comercial y periodístico para demostrar la importancia de la crítica en la producción científica profesional de gráficos estadísticos.

Efectos Ópticos Involuntarios El Op-Art contemporáneo se basa en el efecto moiré, donde el diseño interactúa con el temblor fisiológico del ojo para producir la sensación

108 teoría de los gráficos

El efecto se extiende a toda la página, más allá de los confines del gráfico. En manos expertas, como las de Bridget Riley y Victor Vasarely, los efectos ópticos son muy llamativos. Pero a veces se diseñan gráficos estadísticos expresamente para hacerlos vibrar. Esta vibración moiré, probablemente la forma más común de embrollo gráfico, genera inevitablemente arte y diseño gráfico de mala calidad. La decoración obstruye el flujo de información, como ilustran estos ejemplos tomados de publicaciones científicas y técnicas:

Instituto de Expansão Commercial, Brasil: Graphicos Economicos–Estatisticas (Río de Janeiro, 1929), 15.

For Zabdiel Ramos Banda

chatarra 109

En esta página, lo que debería haber sido tablas simples se convierten en malos gráficos publicados en las principales revistas científicas. En la parte superior un pato con efecto muaré con una ilusión Necker no intencional, como los dos planos negros donde ópticamente parecen estar volteados hacia adelante. Algunas pirámides ocultan otros, y una variable (conjunto de pirámides con profundidad sin sentido) no tiene ninguna etiqueta o escala. En la parte inferior, nos dice muy poco acerca de los datos, pero si descubrimos que el efecto muaré puede estar al máximo en barras equidistantes:

Nicholas T. Kouchoukos, et al., “Replacement of the Aortic Root with a Pulmonary Autograft in Children and Young Adults with Aortic-Valve Disease,” The New England Journey of Medicine, 330 (Enero 6, 1994), 4.

James T. Kuznicki y N. Bruce McCutcheon, “Cross-Enhancement of the Sour Taste on Single Human Taste Papillae”, Journal of Experimental Psychology: General, 108 (1979), 76. Eain M. Cornford y Marie E. Huot, “Glucose Transfer from Male to Female Schistosomes”, Science, 213 (11 de septiembre de 1981), 1270.

110 teoría de los gráficos

Y, para terminar, un gráfico de la guía de estilo del Journal of the American Statistical Association (Asociación Norteamericana de Estadística), descrito como “un ejemplo de figura elaborada apropiadamente”:

“JASA Style Sheet”, Journal of the American Statistical Association, 71 (marzo de 1976), 260–261.

La imagen requirió 131 líneas y 15 dígitos para comunicar un contenido simple. El trazado de las líneas vibrantes es irregular, con espacios desiguales, y no está alineado con el eje vertical. La chatarra vibrante aparece incluso en los gráficos de revistas científicas importantes: Las diez revistas científicas más citadas (en nota): muestras aleatorias de números publicados entre 1980–1982

Porcentaje de gráficos con vibración moiré

Número de gráficos en la muestra

Biochemistry

2%

568

Journal of Biological Chemistry

2%

565

Journal of the American Chemical Society

3%

317

Journal of Chemical Physics

6%

327

Biochimica et Biophysica Acta

8%

432

Nature

11%

225

Proceedings of the National Academy of Sciences, U.S.A.

12%

438

Lancet

15%

364

Science

17%

311

New England Journal of Medicine

21%

338

For Zabdiel Ramos Banda

chatarra 111

Estos efectos moiré han proliferado en los gráficos por ordenador y con el uso extendido de plantillas para calcar. Las láminas están llenas de chatarra gráfica lista para usar. Aquí se muestran algunas de las posibilidades de un catálogo. Los rayados deberían sustituirse por distintas densidades o tonalidades de gris. Las áreas específicas del gráfico deberían explicarse con notaciones en lugar de codificarse con distintos tipos de rayados.

Esta forma de chatarra gráfica es una innovación del siglo XX y los gráficos por ordenador la están multiplicando como nunca. Los manuales y libros de texto sobre gráficos estadísticos, además de los manuales de usuario para los programas de diseño gráfico, están plagados de gráficos vibrantes presentados como modelos ejemplares de diseño. Observe la

112 teoría de los gráficos

proporción de gráficos de este tipo en las publicaciones más recientes. Los gráficos generados por ordenador son los más abundantes: Libros de texto y manuales de gráficos estadísticos y manuales de programas para gráficos informáticos (ordenados por fecha de publicación)

Porcentaje de gráficos con vibración moiré

Número total de gráficos

Willard C. Brinton, Graphic Methods for Presenting Facts (Nueva York, 1914)

12%

255

R. Satet, Les graphiques (París, 1932)

29%

28

Herbert Arkin y Raymond R. Colton, Graphs: How to Make and Use Them (Nueva York, 1936)

17%

95

Mary Eleanor Spear, Charting Statistics (Nueva York, 1952)

46%

134

Anna C. Rogers, Graphic Charts Handbook (Washington, D.C., 1961)

32%

201

F. J. Monkhouse y H. R. Wilkinson, Maps and Diagrams (Londres, tercera edición, 1971)

14%

322

Calvin F. Schmid y Stanton E. Schmid, Handbook of Graphic Presentation (Nueva York, segunda edición, 1979)

22%

399

A. J. MacGregor, Graphics Simplified (Toronto, 1979)

34%

65

Manual de usuario de un paquete de gráficos por ordenador muy conocido: SAS/GRAPH User’s Guide (Cary, Carolina del Norte, 1980)

68%

28

Manual de un programa de gráficos por ordenador muy completo: Tell-A-Graf User’s Manual (San Diego, 1981)

53%

459

¿Pueden los efectos ópticos mejorar un gráfico? Bertin exhorta: “El deber del diseñador es aprovechar al máximo esta variación; obtener la resonancia [de la vibración moiré] sin provocar una sensación incómoda: coquetear con la ambigüedad sin sucumbir a ella”¹. ¿Podrán los gráficos estadísticos “coquetear con la ambigüedad”? Es una idea inteligente, pero no existen buenos ejemplos prácticos. La dificultad fundamental sigue siendo la misma: la vibración moiré es una ambigüedad indisciplinada, con una cualidad ilusoria y estresante para la vista que contamina todo el gráfico y por tanto no tiene cabida en el diseño de gráficos estadísticos.

La Cuadrícula Uno de los elementos gráficos más sobrios es la cuadrícula, que debería reducirse o suprimirse por completo de forma que su presencia quede implícita y no compita con los datos. Las cuadrículas son útiles para el trazado inicial de los datos en casa o en la oficina, pero no para su

¹ Jacques Bertin, Sémiologie graphique (París, segunda edición, 1973), 80.

For Zabdiel Ramos Banda

chatarra 113

publicación. Las cuadrículas oscuras son chatarra gráfica, pues no aportan información, emborronan el gráfico y generan actividad gráfica sin relación con la información de los datos. Esta cuadrícula esconde el perfil de los datos de la pirámide de la población francesa, por edades, en 1967: Población de Francia por edad y sexo: 1 de enero de 1967 FECHA DE NACIMIENTO

ETÀ

HOMBRES

FECHA DE NACIMIENTO MUJERES

(a) pérdidas militares en la I Guerra Mundial (b) déficit de nacimientos durante la I Guerra Mundial (c) pérdidas militares en la II Guerra Mundial (d) déficit de nacimientos durante la II Guerra Mundial (e) aumento de nacimientos tras el regreso de las tropas al terminar la II Guerra Mundial

POBLACIÓN EN MILLARES

En la revisión se amortigua la cuadrícula, resaltando los datos:

Basado en datos del Institut National de la Statistique et des Études Économiques, Annuaire statistique de la France,  (París, 1968), pp. 32–33; reeditado en Henry S. Shryock y Jacob S. Siegel, The Methods and Materials of Demography (Washington, D.C., 1973), vol. 1, 242.

114 teoría de los gráficos

El espacio ocupado por las líneas dobles de la cuadrícula consume el 18 por ciento del área de este ingenioso diseño, un “diagrama de ventanas”. En las intersecciones de las líneas de la cuadrícula aparecen puntos blancos como efecto óptico. (El diagrama muestra lo siguiente: el cuadrado grande contiene los diagramas de dispersión X ₄, X₇. para los niveles indicados de X₁ y X₃. Los puntos del margen derecho están condicionadas por X₃ y las del superior por X₁. La esquina superior derecha muestra la distribución incondicional de X ₄, X₇.) Modificando el diagrama se elimina la distorsión:

Paul A. Tukey y John W. Tukey, “DataDriven View Selection; Agglomeration and Sharpening”, en Vic Barnett, ed., Interpreting Multivariate Data, (Chichester, Inglaterra, 1981), 231–232.

For Zabdiel Ramos Banda

chatarra 115

La cuadrícula en el clásico horario de trenes de Marey es muy activa:

Pero al afinarla se observa una pequeña mejora:

116 teoría de los gráficos

Sin embargo, es más eficaz emplear una cuadrícula gris:

Cuando un gráfico sirve como tabla de consulta, la cuadrícula puede ayudar a leerla y realizar interpolaciones. Pero incluso en este caso la cuadrícula debe pasar a un segundo plano con respecto a los datos. La cuadrícula gris funciona bien y con una línea más delicada los datos pueden reconstruirse mejor que con una oscura. La mayoría del papel para gráficos viene con una cuadrícula oscura. En ese caso, debe usarse el reverso (en blanco) ya que las líneas se transparentan ligeramente y no se confunden con los datos. Si el papel tiene cuadrículas oscuras por ambas caras, tírelo a la papelera.

Gráficos Promocionales: El Pato Cuando un gráfico está dominado por las formas decorativas o borrones de tinta, cuando las unidades de datos y las estructuras se convierten en “elementos de diseño” en lugar de información cuantitativa, podemos denominarlo pato en honor a la tienda en forma de pato, “El gran Pato”. En este edificio toda la estructura tiene función decorativa, igual que en los gráficos “pato”. En su libro Learning from Las Vegas (Aprender de Las Vegas), Robert Venturi, Denise Scott Brown y Steven Izenour escriben

For Zabdiel Ramos Banda

chatarra 117

sobre los patos de la arquitectura moderna y sus reflexiones pueden aplicarse al diseño de gráficos estadísticos: Cuando los arquitectos modernos abandonaron virtuosamente la ornamentación en sus edificios, pasaron inconscientemente a diseñar edificios que eran ornamentos en sí mismos. Al promocionar el espacio y la articulación sobre el simbolismo y el ornamento, distorsionaron todo el edificio y lo convirtieron en un pato. Sustituyeron la práctica barata e inocente de aplicar decoración a una construcción convencional, por la cínica y cara distorsión programática y estructural para promocionar un pato.[…] Ya es hora de reevaluar la espantosa declaración de John Ruskin de que la arquitectura es la decoración de la construcción, pero debemos añadir la advertencia de Pugin: Es aceptable decorar la construcción, pero nunca construir decoración².

² Robert Venturi, Denise Scott Brown y Steven Izenour, Learning from Las Vegas (Cambridge, edición revisada, 1977), 163. La definición inicial del concepto de pato se encuentra en las paginas 87-. El Gran Pato, Flanders, New York; fotografía por Edward Tufte, Julio del 2000.

118 teoría de los gráficos

Muchos gráficos enturbian los datos añadiendo una falsa perspectiva a la estructura. Esta variedad de chatarra gráfica, muy de moda últimamente en el mundo de los “Gráficos estadísticos de alta costura”, es muy frecuente en los informes empresariales anuales, los estudios estadísticos falsos ofrecidos en la publicidad, los medios de comunicación y las investigaciones menos creíbles de las ciencias sociales. Los expertos en ridiculeces gráficas pudieron deleitarse con una serie de extrañas imágenes tridimensionales publicadas en la revista American Education en los años 70’s. En este ejemplar se usan cinco colores para representar, casi por casualidad, sólo cinco datos (ya que la división en cada año suma el 100 por ciento). Muy probablemente se trata del peor gráfico jamás publicado:

For Zabdiel Ramos Banda

chatarra 119

Hay algunos patos elaborados a la perfección:

William L. Kahrl et al., The California Water Atlas (Sacramento, 1978, 1979), 55.

120 teoría de los gráficos

En ocasiones los diseñadores parecen buscar reconocimiento por el mero hecho de poseer una nueva tecnología, en lugar de usarla para producir mejores diseños. Los ordenadores y sus programas pueden causar gran impacto gráfico, en parte porque son capaces de trazar los cientos de puntos necesarios para un buen análisis de datos. Pero algunos gráficos hechos con ordenador sólo consiguen provocar admiración por su maestría técnica, en lugar de despertar el interés mediante el contenido de los datos.

Este diagrama de una publicación profesional presenta todos los síntomas del “síndrome del pato informatizado”: pobreza del contenido; letras mayúsculas de baja definición; rayados sin orden ni concierto; leyendas escritas con abreviaturas informáticas; la vibración óptica. En resumen, padece todas las secuelas de la fabricación gráfica. La apretada escala vertical muestra más valores de los necesarios, cuando bastaría con escribir los valores de los porcentajes concretos observados. Como la información consiste en pocos números y muchas palabras, en esta ocasión sería preferible olvidarse de los gráficos por ordenador y contar la historia mediante una tabla:

Arthur H. Miller, Edie N. Goldenberg y Lutz Erbring, “Type-Set Politics: Impact of Newspapers on Public Confidence”, American Political Science Review, 73 (1979), 67–84.

For Zabdiel Ramos Banda

chatarra 121

Contenido y tono de artículos de primera página en 94 diarios de EE.UU., octubre y noviembre de 1974

Número de artículos

Porcentaje de artículos con críticas negativas sobre una persona o política específicas

Watergate: acusados y acusación, perdón de Ford a Nixon

537

49%

Inflación, alto coste de la vida

415

28%

Competencia gubernamental: coste, calidad y salarios de empleados públicos

322

30%

Confianza en el gobierno: el poder de los intereses especiales, confianza en líderes políticos, deshonestidad en la política

266

52%

Poder del gobierno: regulación empresarial, secretos, control de la CIA y el FBI

154

42%

Delincuencia

123

30%

Raza

103

25%

Desempleo

100

13%

Escasez de energía y empleo

68

16%

Conclusión La chatarra gráfica nunca cumple el objetivo de sus creadores. Los gráficos estadísticos siguen una ley inquebrantable: triunfan o fracasan por su contenido representado con elegancia. Los diagramas no ganan atractivo e interés añadiendo sombreados ornamentales o falsa perspectiva a unas cuantas barras. La chatarra gráfica puede convertir el aburrimiento en desastre, pero nunca conseguirá resucitar unos datos insustanciales. Los mejores diseños (por ejemplo, el de Minard sobre Napoleón en Rusia, el horario gráfico de trenes de Marey, los mapas del cáncer, la historia del clima en Nueva York publicada en el New York Times, la crónica de las aventuras anuales del escarabajo japonés, la nueva concepción de las galaxias) despiertan intriga y curiosidad, atrayendo al lector hacia la maravilla de los datos, bien por el poder de su narrativa, bien por el lujo de detalles o bien por la presentación elegante de datos simples pero interesantes. Sin embargo, la chatarra gráfica es incapaz de generar información, revelación, maravilla o sustancia. Adiós a la chatarra, efectos moiré, cuadrículas y patos.

La pintura es especial, única, una cuestión de meditación y contemplación, para mí no es una actividad física o un deporte social. Con tanta conciencia como sea posible. Claridad, plenitud, quintaesencia, paz. Sin ruido, sin mugre, sin dolor, sin quimeras. Perfección, pasividad, consonancia, consumación. Sin palpitaciones, sin gesticulación, sin elementos grotescos. Espiritualidad, serenidad, absoluto, coherencia. Sin automatismos, sin accidentes, sin ansiedad, sin catarsis, sin suerte. Aislamiento, desinterés, reflexión, trascendencia. Sin alboroto, sin dilación, sin explotación, sin mezclar las cosas. Ad Reinhard, presentación del catálogo de la exhibición, “The New Decade: 35 American Painters and Sculptors”, Whitney Museum of American Art, Nueva York, 1955.

For Zabdiel Ramos Banda

6

Maximización de la Tinta Informativa y Diseño Gráfico

Hasta el momento, los principios para maximizar la tinta informativa y eliminar elementos superfluos han contribuido a generar una serie de opciones en el proceso de revisión de los gráficos. Esta aportación es fundamental, pero habrá que ver si las ideas pueden ir más allá de los detalles y las particularidades de la corrección. ¿Es factible llevar a la práctica la teoría de los gráficos estadísticos, es decir, obtener nuevas formas gráficas a partir de ella? En este capítulo aplicamos los principios establecidos a muchos diseños gráficos, tanto básicos como avanzados, incluyendo diagramas de cajas, gráficos de barras y diagramas de dispersión. Y de ahí surgirán nuevos diseños.

Reelaboración del Diagrama de Cajas La “barra de extensión” de Mary Eleanor Spear

Extensión de la cantidad mínima a la máxima Mediana

Rango intercuartil máxima

y el “diagrama de cajas” de John Tukey

cuartil

mediana cuartil

mínima

Mary Eleanor Spear, Charting Statistics (Nueva York, 1952), p. 166; y John W. Tukey, Exploratory Data Analysis (Reading, Massachusetts, 1977).

124 teoría de los gráficos

puede borrarse sin perder información:

El diseño revisado, el diagrama de cuartil, muestra los mismos cinco números. Es fácil de dibujar a mano o por ordenador y, aún más importante, puede sustituir a la estructura habitual del diagrama de dispersión. Sólo hace falta colocar la regla una vez sobre el papel, comparado con las seis necesarias para el diagrama de cajas. Una alternativa sería

pero este diseño no resulta eficaz para enmarcar un diagrama de dispersión. Y tampoco es muy atractivo. Tal vez debería subrayarse la porción central de la distribución, como ocurre en el diagrama de cajas, modificando el grosor de las líneas

o, mejor aún, descentrando la sección media:

Este último diseño es la forma preferida del gráfico de cuartiles. Usa la tinta con eficacia y es atractivo a la vista.

En estas revisiones del diagrama de cajas, el principio de maximización de la tinta informativa sugiere varios diseños, pero la elección de la mejor alternativa también depende de criterios estadísticos y estéticos: es decir, el procedimiento debe ser razonable.

For Zabdiel Ramos Banda

maximización de la tinta informativa 125

La misma lógica se aplica a muchos diseños similares, como este “diagrama esquemático paralelo”. El trazado del original requirió colocar la regla en 80 posiciones distintas, 50 horizontales y 30 verticales:

La versión simplificada requiere solamente 10 verticales para mostrar la misma información:

La considerable reducción del dibujo es relevante para el uso de este tipo de diseños en análisis informales o exploratorios, donde el investigador no debería perder el tiempo trazando líneas.

126 teoría de los gráficos

Reelaboración del Gráfico de Barras (Histograma) A continuación abordaremos el diagrama de barras clásico, avalado por la práctica y los libros de estilo de muchas publicaciones científicas y estadísticas:

Su arquitectura difiere poco del diseño original de Playfair:

For Zabdiel Ramos Banda

maximización de la tinta informativa 127

Puede borrarse la caja:

Y el eje vertical, excepto las marcas:

-

Incluso pueden borrarse las unidades de datos, creando una cuadrícula blanca que muestra las líneas de las coordenadas con más precisión que las marcas por sí solas:

15% 10% 5% -

128 teoría de los gráficos

La cuadrícula blanca elimina las marcas, ya que los números en la vertical están directamente asociados con las líneas blancas:

15%

10%

5%

Aunque la intersección de las barras más gruesas con la línea de base crea un efecto visual atractivo (también la ilusión óptica de puntos grises en las intersecciones), la línea puede borrarse pues la base de las barras define el fondo del gráfico:

De todas formas, una línea de base delgada siempre queda bien:

For Zabdiel Ramos Banda

maximización de la tinta informativa 129

La eliminación de elementos innecesarios y la maximización de la tinta han introducido cambios en el gráfico de barras tradicional. Estas técnicas — ausencia de marco, eje vertical y marcas, y el empleo de la cuadrícula blanca — pueden aplicarse a otros diseños: Robert McGill, John W. Tukey y Wayne A. Larsen, “Variations of Box Plots”, American Statistician, 32 (1978), 12–16.

80

40

20

10

5

130 teoría de los gráficos

Reelaboración del Diagrama de Dispersión Tomemos el diagrama de dispersión bivariante:

De acuerdo con los principios de maximización y eliminación, el sistema de coordenadas de un gráfico puede convertirse en un elemento informativo simplemente borrando parte de él. Los ejes deben extenderse solamente hasta los límites de los datos medidos, en vez de hasta cualquier punto arbitrario, generalmente el siguiente número redondo de la escala. Se elimina la parte del marco formado por los ejes que excede los límites de las cantidades observadas:

El resultado es un marco por extensión que muestra explícitamente el máximo y el mínimo de ambas variables (además de la extensión). En el diseño convencional, por el contrario, esta información sólo podía obtenerse mediante la extrapolación y la apreciación visual. La proporción de tinta informativa ha aumentado: además de eliminar tinta no informativa, el resto de los ejes se ha convertido en informativo.

For Zabdiel Ramos Banda

maximización de la tinta informativa 131

máx. Yi

mín. Yi mín. Xi

máx. Xi

Sólo hace falta cambiar los extremos del marco:

diagrama de dispersión convencional

marco por extensión El marco por extensión no requiere instrucciones especiales; no es un rompecabezas gráfico y la mayoría de los lectores puede interpretarlo fácilmente. El marco por extensión debería sustituir a los ejes convencionales no informativos de muchas aplicaciones gráficas, puesto que informa sobre los datos de forma más clara y precisa.

132 teoría de los gráficos

Con una pequeña alteración adicional, convertimos cada eje en un gráfico de cuartiles:

Mediante estos cambios hemos conseguido representar diez números más (el máximo, el mínimo, dos cuartiles, y la mediana de ambas variables). Este diseño es muy útil para el análisis analítico y exploratorio de datos, así como para los gráficos publicados donde interesa resumir las distribuciones marginales. Y casi siempre supera a los diagramas de dispersión convencionales.

Los marcos por extensión también pueden presentar escalas a lo largo de una sola dimensión. Los máximos y mínimos históricos quedan plasmados en los ejes verticales del siguiente gráfico:

For Zabdiel Ramos Banda

maximización de la tinta informativa 133

Por último, todo el marco puede convertirse en información al enmarcar el diagrama de dispersión bivariante con la distribución marginal de cada variable, dando lugar al diagrama de puntos y líneas¹.

¹ La terminología sigue la tradición, porque los diagramas de dispersión se llamaban al principio “diagramas de puntos” — por ejemplo, en Statistical Methods for Research Workers, de R. A. Fisher (Edimburgo, 1925).

Este diagrama de puntos y líneas combina los dos diseños gráficos fundamentales para el análisis estadístico: la distribución de la frecuencia marginal y la distribución bivariante. Con este formato se facilita el trazado simultáneo de las distribuciones marginal y compartida, tarea que los buenos analistas de datos realizan habitualmente. La distribución acumulativa empírica de los residuos sobre una cuadrícula normal muestra los 16 términos exteriores, más el 30º término, con los 60 puntos trazados en la distribución marginal:

Cuthbert Daniel, Applications of Statistics to Industrial Experimentation (Nueva York, 1976), 155.

134 teoría de los gráficos

Del mismo modo, este gráfico de señales procedentes de pulsares muestra ambas distribuciones marginales:

TIEMPO (Mseg)

CÉLULA DE RESOLUCIÓN

FRECUENCIA

Se muestra el espectro de banda estrecha de cada subpulsación. Cada punto de intensidad I q (t), trazado a la derecha es la suma de la distribución de intensidades frente al ancho de banda del receptor, en el centro. En la parte superior aparece la media del espectro registrado durante el pulso. En el límite de miles de pulsos, esto mostraría la forma de la banda del receptor”.

Timothy H. Hankins y Barney J. Rickett, “Pulsar Signal Processing”, en Berni Alder, et al., eds., Methods in Computational Physics, Volume : Radio Astronomy (Nueva York, 1975), 108.

For Zabdiel Ramos Banda

maximización de la tinta informativa 135

El reborde de guiones en el diagrama de puntos y líneas puede conectar varios diagramas de dispersión bivariantes en un diagrama de tapete (por su semejanza a tapetes con flecos que cubren el terreno estadístico):

Los guiones, al reflejar las proyecciones unidimiensionales de cada diagrama, facilitan la percepción de cómo cada uno de ellos filtra y traduce los datos a través de la dispersión de un segmento adyacente a otro. A veces es útil pensar que cada diagrama bivariante es la representación empírica imperfecta de una curva implícita que transforma una variable en otra. En el diagrama de tapete, la secuencia de las variables puede variar según corresponda. La historia cuantitativa de una sola observación puede rastrearse mediante una serie de contextos de una o dos dimensiones.

136 teoría de los gráficos

Conclusión Hemos establecido la primera parte de una teoría de gráficos estadísticos. La idea fundamental, expuesta en los tres capítulos anteriores, es que la mayoría de los elementos gráficos deben variar de acuerdo con la variación de los datos. La teoría es aplicable a muchos tipos de gráficos: gráficos científicos, los singulares diseños de Roger Hayward, los manuales de diseño gráfico, los gráficos periodísticos, los de ordenador y las recientes invenciones de Chernoff y Tukey. Hemos observado que en ocasiones el aumento de la eficacia, medido por la proporción de tinta informativa, es bastante considerable. En varios casos se trata de un 0.1 ó 0.2 y puede alcanzar casi un 1.0. Los diseños modificados resultan más nítidos y pueden reducirse de tamaño con más facilidad que los originales. Pero, ¿son mejores los modelos resultantes? (1) Según los principios de la teoría, son necesariamente mejores, pues representan más información por unidad de elemento gráfico y por unidad espacial. Y esto es importante; de hecho, la historia de los mecanismos utilizados para comunicar información se centra en cómo han mejorado la eficacia comunicativa y productiva. (2) Los gráficos casi siempre mejoran en el proceso de revisión y reelaboración. Los principios de maximización y eliminación generan alternativas gráficas y sirven de orientación a la hora de corregir. (3) También hay que considerar al público: ¿se sentirán confundidos los lectores de estos nuevos diseños? Algunos de ellos se explican por sí solos, como el marco por extensión. El diagrama de puntos y líneas es más difícil, aunque sigue mostrando toda la información que normalmente ofrece el diagrama de dispersión. Aquellos que se sientan confundidos por el marco de guiones no van a perder información, pero quienes lo entiendan habrán ganado algo. Subestimar a los lectores es un error que se comete con frecuencia en este campo. ¿No será mejor asumir que si uno mismo lo entiende, la mayoría de los lectores también lo entenderá? Los gráficos deberían ser tan inteligentes y sofisticados como el texto que los acompaña. (4) Algunos nuevos diseños pueden parecer extraños, pero probablemente se deba a que no los hemos visto antes. Casi todos los lectores de este libro habrán visto miles de veces los distintos tipos de gráficos convencionales; por otro lado, tal vez sólo se hayan topado unas pocas veces con el marco por extensión, el diagrama de puntos y líneas, la cuadrícula blanca, el diagrama de cuartiles, el diagrama de tapete y el de medias caras. Con el uso, los nuevos diseños terminarán pareciéndonos tan razonables como los antiguos.

For Zabdiel Ramos Banda

maximización de la tinta informativa 137

La maximización de la tinta informativa, dentro de lo razonable, es solamente una parte de una tarea compleja. El principio ayuda a realizar experimentos en diseño gráfico, algunos con éxito. No obstante, en el diseño de gráficos estadísticos hay otras muchas consideraciones, no sólo relativas a la eficacia, sino también a la complejidad, estructura, densidad e incluso a la belleza.

7

Elementos Gráficos Multifuncionales

Con frecuencia, la misma tinta debe servir para varios propósitos. Un único elemento gráfico puede transmitir datos y al mismo tiempo desempeñar tareas de diseño, o bien mostrar distintos tipos de información. Estos elementos gráficos multifuncionales, diseñados con esmero y sutileza, son capaces de presentar con eficacia datos complejos de múltiples variables¹. Las manchas del mapa de puntos, por ejemplo, localizan e identifican la forma de la unidad geográfica y, simultáneamente, indican el nivel de la variable en cuestión mediante el color o la intensidad del sombreado. Es una cantidad de información considerable para una pequeña porción de tinta, que además consigue evitar la confusión entre las distintas partes de la información. Los ejes de los gráficos convencionales, en cambio, cumplen una modesta función de diseño: separar la cuadrícula y las unidades de datos de los rótulos. Y ayudar en la tabulación. Tanta tinta, tan poco utilizada, constituye un candidato perfecto para ser movilizado como elemento gráfico de doble función. De ahí han surgido el marco por extensión, los rangos intercuartiles o los diagramas de puntos y líneas. Todos obedecen al siguiente principio: Movilice cada elemento gráfico, incluso varias veces, para mostrar los datos. Los elementos multifuncionales tienen cierto peligro, pues suelen crear rompecabezas gráficos que sólo su inventor es capaz de resolver. Así pues, habrá que desarrollar técnicas para favorecer la claridad gráfica frente a la complejidad propia de los elementos polivalentes.

Unidades de Datos Informativas El elemento gráfico que ubica o sitúa los datos es la unidad de datos. Las barras de los gráficos de barras, las manchas de los diagrama de dispersión, los puntos y guiones de los diagramas de puntos y líneas, y los puntos de los mapas de puntos son unidades utilizadas para representar los datos en el gráfico. Y pueden servir, a su vez, como vehículo de información de una tercera variable, por ejemplo, mediante distintos sombreados.

¹ El concepto de elementos multifuncionales aparece en crítica arquitectónica; véase Robert Venturi, Complexity and Contradiction in Architecture (Nueva York, segunda edición, 1977), cap. 5. Venturi a su vez cita a Wylie Sypher, Four Stages of Renaissance Style (Garden City, Nueva York, 1955).

For Zabdiel Ramos Banda

140 teoría de los gráficos

Al construir las unidades con los propios datos aumenta el detalle cuantitativo y se añade dimensión al gráfico. El diagrama de “hoja y tallo” construye la distribución de la variable con los propios números: 0 | 9 = 900 pies

diagramas de “hoja y tallo”: alturas de 218 volcanes; unidad, 100 pies

19 | 3 = 19,300 pies

El diagrama de “hoja y tallo” surgió a partir de la idea de que todos y cada uno de los elementos gráficos fueran eficaces. Al presentar su invención, John Tukey escribió: “Si vamos a usar un signo, más vale que sea un signo con significado. Y el signo significativo más sencillo y más útil es el dígito”². En el siguiente caso los datos también constituyen las unidades de datos. Nótese la distribución bimodal en el histograma de los estudiantes universitarios ordenados por su altura.

² “Some Graphic and Semigraphic Displays”, en T. A. Bancroft, ed., Statistical Papers in Honor of George W. Snedecor (Ames, Iowa, 1972), 296.

Brian L. Joiner, “Living Histograms”, International Statistical Review, 43 (1975), 339–340. Pero, para seguir avanzando, ver Mark F. Schelling, Ann E. Watkins y William Watkins, “Is Human Height Bimodal?” The American Statistician, 56 (Agosto dek 2002), 223-229.

elementos gráficos multifuncionales 141

Este excelente gráfico construye unidades de datos con los propios datos. Fue elaborado por el coronel Leonard P. Ayres para su historia estadística de la Primera Guerra Mundial, un libro con varios gráficos notables realizados con máquina de escribir y regla. Al construir la unidad de datos con el nombre de cada división norteamericana (una designación numérica), lo que podía haber sido una serie temporal cualquiera se transforma en un diagrama elegante. (Nótese que este diseño acumulativo depende del hecho de que ninguna de las divisiones regresó antes del mes de octubre de 1918.) Esta unidad de datos de triple función: (1) el número de divisiones en Francia en cada mes, desde junio de 1917 hasta octubre de 1918; (2) qué divisiones en concreto se encontraban en Francia en cada mes; y (3) la duración de la estancia de cada división en Francia.

Leonard P. Ayres, The War with Germany (Washington, D.C., 1919), 102.

For Zabdiel Ramos Banda

142 teoría de los gráficos

Pero las unidades de datos pueden ser mucho más elaboradas. En este caso, los puntos son caras de Chernoff, que se reducen con facilidad y son legibles incluso con áreas de 0.05 pulgadas cuadradas, como en el gráfico inferior³. El analista observaría en primer lugar la distribución de los puntos X-Y y seguidamente el detalle de cada uno, buscando agrupaciones con características similares en el plano X-Y. Las observaciones erráticas y las que difieren de las de su entorno, llamadas extraños, deberían identificarse indicando el número de observación o el nombre.

³ Herman Chernoff, “The Use of Faces to Represent Points in k-Dimensional Space Graphically”, Journal of the American Statistical Association 68 (junio de 1973), 361–368. Para la aplicación de caras sobre una superficie bidimensional, véase Howard Wainer y David Thissen, “Graphical Data Analysis”, Annual Review of Psychology, 32 (1981), 191–241.

un extraño

Con los números y los rostros convertidos en unidades de datos, parecería que hemos alcanzado el colmo de la economía, la imaginación y, todo sea dicho, de la excentricidad.

elementos gráficos multifuncionales 143

Consideremos este poema visual, “Easter Wings” (Alas de Pascua), de George Herbert (1593–1633), que usa el espacio y la longitud de cada línea para representar la cantidad, todo ello 150 años antes de Playfair. Las líneas tienen doble función: las más largas describen la riqueza, la plenitud, la generosidad y la elevación en el aire; las más cortas hablan de pobreza y de “menguar”; y las líneas de longitud intermedia indican transición y cambios (declive, elevación, combinación, devenir):

⁴ Para un remarcable recorrido “a hombros de gigantes” de las muchas formas variantes tipográficas de “Eastern Wings” en su publicación, consulte el ensayo “fiat ƒlux,” de “Random Cloud” en Randall McLeod, de., Crisis in Editing: Texts of the English Renaissance (Nueva York, 1994), 61-172.

Y esta delicia tipográfica del estadístico W. J. Youden: LA LEY NORMAL DEL ERROR SOBRESALE EN LA EXPERIENCIA DE LA HUMANIDAD COMO UNA DE LAS MÁS AMPLIAS GENERALIZACIONES DE LA FILOSOFÍA NATURAL ⽧ SIRVE COMO INSTRUMENTO GUÍA PARA LA INVESTIGACIÓN EN LAS CIENCIAS FÍSICAS Y SOCIALES Y EN LA MEDICINA AGRICULTURA E INGENIERÍA ⽧ ES UN ARMA INDISPENSABLE PARA EL ANÁLISIS Y LA INTERPRETACIÓN DE LOS DATOS BÁSICOS OBTENIDOS MEDIANTE LA OBSERVACIÓN Y LA EXPERIMENTACIÓN

For Zabdiel Ramos Banda

144 teoría de los gráficos

Por último, esta broma gráfica donde los datos se convierten en la unidad de datos, al igual que en el histograma viviente. El siguiente diagrama muestra cómo los distintos estados norteamericanos usaban patrones diferentes para pintar las líneas de la calzada. Algunos separaban los carriles con líneas cortas y largos espacios; otros usaban sólo líneas continuas. En el gráfico se observan los patrones reales usados en los 48 estados norteamericanos, ordenados según la longitud de las líneas:

pies

Reelaborado a partir de A. R. Lauer, “Psychological Factors in Effective Traffic Control Devices”, Traffic Quarterly, 5 (enero de 1951), 94.

elementos gráficos multifuncionales 145

Cuadrícula Informativa Muy de vez en cuando la cuadrícula puede transmitir información directamente. En este caso está formada por la situación de los instrumentos de medición; los puntos normales registran una lectura de cero, en contraste con el fondo blanco donde no se hicieron mediciones. Si se borrase la cuadrícula se eliminarían datos, aunque no fueran muy significativos. Esto no suele pasar al eliminar la mayoría de las cuadrículas, tabulaciones y líneas. K. V. Roberts y D. E. Potter, “Magnetohydrodynamic Calculations”, en Berni Alder, et al., eds., Methods in Computational Physics: Volume , Plasma Physics (Nueva York, 1970), 402.

La disposición de los datos en esta tabla produce una cuadrícula interna, un raro ejemplo donde la cuadrícula está constituida por los propios datos:

Karl Pearson, The Life, Letters and Labours of Francis Galton (Cambridge, 1930), vol. iii-a, 14.

For Zabdiel Ramos Banda

146 teoría de los gráficos

En este caso la cuadrícula es el elemento más interesante, relegando el mapa a un segundo plano.

Lester J. Cappon, Barbara Bartz Petchenik y John Hamilton Long, Atlas of Early American History (Princeton, 1976), 58.

elementos gráficos multifuncionales 147

La cuadrícula siguiente presenta los datos en la superficie de la roca; a los lados, la cuadrícula es convencional. Los dos diagramas comparan el efecto de la religión, teniendo en cuenta la afiliación a los partidos políticos, en las elecciones presidenciales de 1956 y 1960 (cuando un candidato católico se presentó a la presidencia). Nótese que en 1956 no se puede asociar cierta pendiente con la religión dentro de cada partido; en 1960, sin embargo, se observa un efecto sistemático. Si se leen las pendientes en la dirección opuesta, se observa el efecto persistente del partido en las dos elecciones:

Philip E. Converse, “Religion and Politics: The 1960 Election”, en Angus Campbell, Philip E. Converse, Warren E. Miller y Donald E. Stokes, Elections and the Political Order (Nueva York, 1966), 102–103.

For Zabdiel Ramos Banda

148 teoría de los gráficos

Playfair ligó los datos a la cuadrícula en su gráfico sobre el vertiginoso aumento de la deuda pública. Aunque las coordenadas están basadas en intervalos regulares, las líneas verticales de la versión publicada están espaciadas irregularmente, de acuerdo con acontecimientos significativos. La cuadrícula informativa es un elemento muy hábil, que está al servicio de los datos en vez de luchar contra ellos. Es una técnica que debería usarse con más frecuencia en la obra gráfica contemporánea.

elementos gráficos multifuncionales 149

Rótulos Multifuncionales Las líneas de los ejes de coordenadas pueden convertirse en rótulos informativos, como ocurre en el diagrama de Playfair sobre la deuda pública. La cuestión es la misma de siempre: ¿por qué no utilizar estos elementos gráficos para mostrar los datos? Podemos comenzar por los ejes convencionales

y convertirlos en un marco por extensión borrando los extremos

los números y los tabuladores de los extremos quedan aislados, ayudando al lector a percibir dónde termina el marco por extensión. Pero el efecto se puede mejorar con la misma cantidad de tinta: en lugar de mostrar los número redondos mínimos y máximos en los extremos del eje, utilizaremos el mínimo y el máximo reales sacados de los datos:

Con mayor precisión y dos marcas menos, el marco por extensión rotulado supera al de los números redondos y ambos son preferibles a los ejes pasivos tradicionales.

Los números también tienen doble función cuando se usan para nombrar cosas (como por ejemplo un número de identificación) y para reflejar un orden. En el siguiente gráfico (en el que los números rodeados por círculos no tienen doble función), cada cifra identifica un estudio particular de la conductividad térmica del tungsteno, ordenado alfabéticamente por el apellido del primer autor. Si la lista estuviera ordenada por la fecha de publicación, el código serviría también para ilustrar el orden temporal en

For Zabdiel Ramos Banda

150 teoría de los gráficos

que se realizaron las distintas mediciones de la conductividad. El número “1” indicaría el estudio más antiguo, y así sucesivamente o, alternativamente, “61c” sería el tercer estudio publicado en 1961. Esta información es interesante, ya que podemos ver qué estudios entre los primeros fueron acertados. Además, podría seguirse la evolución hacia los valores recomendados como “correctos”. Esta información adicional no requiere ni una gota más de tinta.

En la mayoría de los gráficos, los rótulos distan mucho de ser unidades de datos. En consecuencia, el ojo del espectador debe moverse constantemente entre la trayectoria formada por los datos y las posiciones de las coordenadas en los márgenes del gráfico. A veces, es posible eliminar por completo este movimiento convirtiendo los rótulos en unidades de datos, otra maniobra destinada a promover la doble función. Como ejemplo, veamos el manual de estilo del Journal of the American Statistical Association:

C. Y. Ho, R. W. Powell y P. E. Liley, Thermal Conductivity of the Elements: A Comprehensive Review, suplemento nº. 1, Journal of Physical and Chemical Reference Data, 3 (1974), i–692.

elementos gráficos multifuncionales 151

Los valores numéricos del eje X se curvan hacia arriba para marcar la trayectoria de los datos:

Como el tema de este diagrama es la probabilidad de cada valor entero, los valores del eje Y son sustituidos por los valores exactos:

La escala de Y se parece ahora a los guiones del diagrama de puntos y líneas, donde la columna vertical de datos actúa como los guiones que indican la distribución marginal.

For Zabdiel Ramos Banda

152 teoría de los gráficos

El uso de rótulos basados en los datos en las distribuciones marginales sugiere una mejora adicional del diagrama de puntos y líneas:

Ahora los números en el margen eliminan los ejes tradicionales (incluso el marco por extensión) sustituyen los tabuladores de las coordenadas, muestran la distribución marginal de ambas variables y registran los valores exactos de las dos medidas de cada unidad de observación. Este arreglo gráfico funciona mejor para conjuntos de datos pequeños (unas 30 observaciones o menos) o que requieren un alto grado de detalle. Por último, un diseño sorprendente con rótulos basados en los datos:

Diseño de Carol Moore, Corporate Annual Reports, Inc., en Walter Herdeg, Graphis/Diagrams (Zúrich, 1976), 23.

elementos gráficos multifuncionales 153

Rompecabezas y Jerarquía La complejidad de los elementos multifuncionales puede convertir los gráficos de datos en rompecabezas visuales, enigmas cripto-gráficos que el lector debe desentrañar. Cuando el gráfico debe interpretarse mediante un proceso verbal en vez de visual, nos encontramos ante un claro indicio de este problema. Por ejemplo, a pesar de sus unidades informativas inteligentes y multifuncionales formadas por la combinación de dos cuadrículas de cuatro colores cada una, esto es un puzzle gráfico. Esta hazaña de virtuosa tecnología despliega 16 tonalidades de color sobre 3056 condados: todo un monumento al sistema de gráficos de computadora sofisticados.⁵. Pero es un gráfico que se vive verbalmente, no visualmente. Los lectores deben pronunciar frases cortas, intentando mantener el orden de palabras adecuado para comprender este montaje visual: “A ver, el morado representa los países donde se dan niveles altos de enfermedades cardiovasculares en la población masculina y además donde del 11.6 al 56.0 por ciento de las viviendas tienen más de 1.01 personas por habitación. ¿Y eso qué quiere decir? ¿Y esos condados amarillo verdosos?” En cambio, en los gráficos explícitos la traducción de lo visual a lo verbal se aprende con facilidad, es automática e implícita, de forma que la imagen visual fluye directamente a través del decodificador verbal necesario para entender el gráfico. Como escribió Paul Valéry, “Ver es olvidar el nombre de la cosa que uno ve”.

⁵ La técnica se describe en Vincent P. Barabba y Alva L. Finkner, “The Utilization of Primary Printing Colors in Displaying More than One Variable”, en Bureau of the Census, Technical Paper No. 43, Graphical Presentation of Statistical Information (Washington, D.C., 1978), 14–21. Los mapas son evaluados en Howard Wainer y C. M. Francolini, “An Empirical Inquiry Concerning Human Understanding of Two-Variable Color Maps”, American Statistician, 34 (1980), 81–93.

For Zabdiel Ramos Banda

154 teoría de los gráficos

El color suele generar rompecabezas gráficos. Pese a haber aprendido el espectro en los libros de ciencias y en el arcoiris, la mente no ordena los colores visualmente, con la posible excepción del rojo para reflejar niveles más altos que los demás colores, como en los puntos candentes del mapa del cáncer. Los intentos de ordenar el arcoiris resultan en muletillas verbales y frasecitas mentales, a veces incluso dan lugar a frases mnemotécnicas sobre las propias frases requeridas para la decodificación gráfica: L. L. Vauthier usó un método para colorear que en teoría resultaba ingenioso, pero no era muy satisfactorio en la práctica. Se llamaba el “método de la montaña al mar”. El blanco representaba la máxima intensidad porque indicaba la cima de una montaña de nieves perpetuas, después venía el verde de los bosques que cubrían las laderas, a continuación el amarillo de los cereales de las praderas y finalmente el azul, el mínimo, representando las aguas al nivel del mar₆. Las distintas tonalidades de gris, debido a su jerarquía visual natural, muestran las cantidades variables mejor que el color. Diez tonos de gris representan eficazmente el mapa de las galaxias:

El éxito del gris comparado con el color mas espectacular a la vista nos da una pista sobre cómo los elementos gráficos multifuncionales pueden comunicar información compleja sin convertirse en rompecabezas. Los tonos de gris proporcionan un orden fácilmente comprensible para las unidades de datos. Y ahí está la clave. Los métodos que organizan y ordenan el flujo de información gráfica son fundamentales para mantener la claridad frente a la complejidad de los datos. El siguiente paso es determinar cómo la arquitectura gráfica puede promover el flujo de información jerárquico, ordenado, secuenciado, desde el gráfico hasta la mente del lector. Y además cómo puede presentarse la información de los datos de forma que el lector sea capaz de extraer, capa tras capa, todos los datos del gráfico. Las múltiples capas de información se crean mediante múltiples profundidades de observación y múltiples ángulos de observación.

⁶ H. Gray Funkhouser, “Historical Development of the Graphical Representation of Statistical Data”, Osiris, 3 (1937), 326, cita a É. Cheysson, “Les méthodes de statistique graphique à l’Exposition universelle de 1878”, Journal de la Société de Statistique de Paris, 19 (1878), 331.

elementos gráficos multifuncionales 155

Los gráficos pueden diseñarse para lograr al menos tres profundidades de observación: (1) lo que se ve desde lejos: una estructura general que se forma a partir de una microestructura subyacente; (2) lo que se percibe desde cerca, es decir, la estructura detallada de los datos; y (3) lo que se ve implícitamente, la estructura subyacente que se encuentra más allá del gráfico. El siguiente mapa de la población de Estados Unidos elaborado por la Oficina del Censo es una maravilla de la cartografía moderna. Cada punto, excepto en los centros urbanos, representa a 500 personas. Observe cómo conecta los grandes centros urbanos mediante corredores; los efectos del paisaje en la distribución de la población (el valle central de California, los valles y sierras de los Apalaches y la concentración a lo largo de los ríos); los pueblos junto a las autopistas, unidos como un collar de perlas. El mapa presenta unos 400,000 puntos en su cuadrícula implícita. El uso de un ángulo visual para cada aspecto distinto de los datos también contribuye a organizar la información gráfica. Cada línea de visión debería permanecer constante (preferentemente horizontal o vertical), mientras el lector busca las variaciones en los datos de esa única línea de visión. En los casos en que haya variables múltiples, pueden crearse varias líneas claras. Recordemos el diagrama de Ayres de las divisiones del ejército norteamericano en Francia. Aunque presenta datos interrelacionados y complejos, el gráfico no es un rompecabezas. Los tres ángulos visuales independientes dan coherencia al flujo de información: el perfil del horizonte para la serie temporal que avanza de abajo a arriba, el vertical para la composición de cada barra y el horizontal para la estancia de cada división. Así pues, aunque cada gota de tinta cumple tres funciones distintas en la presentación de los datos, cada una de las tres se presenta al lector de forma independiente e íntegra.

For Zabdiel Ramos Banda

For Zabdiel Ramos Banda

    

 Facturas recientes del Gobierno como porcentaje del Producto Interior Bruto,  y 

Suecia

.

Holanda Noruega

. .

Gran Bretaña

.

Francia Alemania

. .

Bélgica Canadá Finlandia

. . .

Italia Estados Unidos

. .

Grecia Suiza

. .

España

.

Japón

.

 .

Suecia

.

Holanda

.

Noruega

. . .

Francia Bélgica Alemania

. .

Gran Bretaña Finlandia

. .

Canadá Italia

.

Suiza

.

Estados Unidos

.

Grecia

. .

España Japón

elementos gráficos multifuncionales 159

Del mismo modo, esta tabla organiza los datos para ser observados en distintas direcciones. Leído verticalmente, el gráfico organiza 15 países según la recaudación de impuestos del gobierno en 1970 y 1979, con los nombres espaciados en proporción a los porcentajes. Comparando las dos columnas se puede ver cómo los porcentajes han cambiado con los años. Las pendientes también pueden compararse leyendo el conjunto de líneas de arriba a abajo y las líneas que presentan una pendiente inusual destacan en el patrón dominante de líneas ascendentes. La información se muestra de forma integrada y separada a la vez; integrada por la conexión de sus contenidos y separada por los caminos independientes que recorre la vista al estudiar los datos:

El análisis de la arquitectura visual de un gráfico ayudará a crear y a evaluar los diseños que organizan la información compleja jerárquicamente.

For Zabdiel Ramos Banda

8

Alta Resolución en Gráficos de Datos

El ojo humano es capaz de percibir un gran número de distinciones en un área muy pequeña. Mediante una cuadrícula muy fina, se pueden localizar con facilidad 625 puntos en una pulgada cuadrada o 100 puntos en un centímetro cuadrado. Observe cómo divide el espacio una cuadrícula de 80 por 80 en una pulgada cuadrada - 30 por 30 en un centímetro cuadrado - divide el espacio para formar 25,281 posiciones distintas.¹: Con la ayuda del contexto y de considerable redundancia, el ojo percibe constantemente mínimas distinciones de este tipo. En cambio, los instrumentos de medida utilizados en ingeniería, arquitectura y mecánica usan escalas de 20 incrementos por centímetro y 50 por pulgada. Lo mismo se aplica a la letra pequeña. Esta muestra del Statistical Abstract (Índice estadístico norteamericano), incluye 12 líneas por pulgada vertical o 4.7 por centímetro vertical. Cada línea contiene unos 23 caracteres por pulgada o 9.1 por centímetro, con una densidad máxima de 276 caracteres por pulgada cuadrada o 42.5 por centímetro cuadrado. La densidad real, incluyendo el espacio en blanco, es en este caso de 185 caracteres por pulgada cuadrada o 28 por centímetro cuadrado. Para el análisis serio de datos, así como en la estadísticas deportivas, la densidad de datos en las tablas es intensa, como se muestra en el cuadro de puntuación de béisbol de la derecha. Millones de personas leen habitualmente tablas de alta resolución de deportes, clima y datos financieros. Estas tablas proporcionan un modelo excelente para todas las tablas, incluso aquellas en presentaciones corporativas.

¹ Una cuadrícula formada en cada lado por n paralelas negras y n–1 paralelas blancas (las esquinas de los cuadrados) contiene n² intersecciones de dos líneas negras (esquinas de los cuadrados), (n–1)² intersecciones de dos líneas blancas (los cuadrados blancos) y 2n(n–1) intersecciones de líneas blancas y negras (lados de los cuadrados), formando un total de (2n–1)² intersecciones de rectas o posiciones distintas.

alta resolución en gráficos de datos 161

Los mapas suelen presentar incluso mayor detalle. Según un cartógrafo, “el poder de resolución del ojo humano permite percibir diferencias de hasta 0.1 mm si es necesario. La concisión, que es esencial, y los gráficos de alta resolución son denominadores comunes de la cartografía”². Las distinciones de 0.1 mm equivalen a 254 por pulgada. ¿Cuántos gráficos estadísticos se aprovechan de la habilidad de nuestra vista para percibir grandes cantidades de información en espacios pequeños? ¿Cuánta información deberían desplegar los gráficos? Comencemos por considerar una medida empírica de la actividad gráfica: la densidad de datos.

² D. P. Bickmore, “The Relevance of Cartography”, en John C. Davis y Michael J. McCullagh, eds., Display and Analysis of Spatial Data (Londres, 1975), 331.

Densidad de Datos en la Práctica Gráfica Los números incluidos en un gráfico pueden organizarse en una matriz de datos de observaciones por variable. Considerando el tamaño del gráfico en relación a la cantidad de datos representados se obtiene la densidad de datos: densidad de datos =

número de entradas en la matriz de datos área del gráfico

Las matrices y la densidad de datos varían enormemente. En un extremo, este diseño sobrecargado (originalmente impreso en cinco colores) presenta una matriz muy pobre, con solamente cuatro entradas: los nombres y los números de las dos barras de la derecha, pues la barra de la izquierda es la suma de las otras dos. El gráfico cubre 26.5 pulgadas cuadradas (171 centímetros cuadrados), lo cual resulta en una densidad de 0.15 números por pulgada cuadrada (0.02 números por centímetro cuadrado). Por el contrario, las tablas diarias utilizadas en la presentación de datos deportivos, que millones de personas leen felizmente todos los días, tienen densidades de datos 100 veces más grandes, que la inconveniente gráfica a la derecha. Las gráficas científicas de primer nivel tienen una densidad de datos 1000 veces mayor. Las pantallas de alta densidad pueden ser realmente interactivas, permitiendo a los espectadores elegir, volver a narrar, analizar y personalizar los datos para su propio pensamiento. Así, el control de la información es entregada a los espectadores, no a los editores, decoradores, y mal diseñadores gráficos por ordenador (como PowerPoint y Excel). Los diseños con información de datos insuficientes llevan los espectadores hacia la ignorancia y pasividad, y a veces disminuyen la credibilidad de la fuente. La pobreza de datos despierta sospechas rápidamente, de que los diseñadores han elegido la información de manera especulativa: “¿Qué están dejando a un lado? ¿Eso es todo lo que saben? ¿Ese es todo el trabajo de análisis que hicieron? ¿Piensan que somos tontos? ¿Por qué estamos teniendo esta reunión?”

Executive Office of the President, Office of Management and Budget, Social Indicators,  (Washington, D.C., 1973), 86.

For Zabdiel Ramos Banda

    

El ejemplo del manual de estilo del Journal of the American Statistical Association es un peso pluma con . números por centímetro cuadrado y una matriz de datos de tan sólo  entradas:

En contraste, el resumen del clima de Nueva York se ve muy bien con  números por pulgada cuadrada o  números por centímetro cuadrado:

New York Times,  de enero de , .

      

Al igual que el informe anual de horas de sol, con  números por pulgada cuadrada o  números por centímetro cuadrado:

Al invertir la imagen, la metáfora visual se corresponde mejor con los datos, de forma que las zonas claras son las horas en las que brilla el sol:

F. J. Monkhouse y H. R. Wilkinson, Maps and Diagrams (Londres, tercera edición, ), –.

For Zabdiel Ramos Banda

164 teoría de los gráficos Jacques Bertin, Sémiologie graphique (París, segunda edición, 1973), 152.

Este mapa (27 pulgadas cuadradas, 175 centímetros cuadrados) muestra la localización y las fronteras de las 30,000 comunas francesas. Harían falta al menos 240,000 números para recrear los datos del mapa 30,000 latitudes y 30,000 longitudes, y quizás seis números para describir el tamaño de cada una). La densidad de datos es de casi 1400 números por centímetro cuadrado. El nuevo mapa de las galaxias ubica 2,275,328 rectángulos sobre una superficie bidimensional de 61 pulgadas cuadradas (390 centímetros cuadrados). Cada uno representa tres números (dos por su ubicación, uno por su sombreado), lo que supone una densidad de datos de 110,000 números por pulgada cuadrada o 17,000 números por centímetro cuadrado. Todo un récord.

      165

Densidad de Datos y Dimensiones de la Matriz de Datos: Prácticas Editoriales La siguiente tabla muestra la densidad de datos y las dimensiones de la matriz de datos de gráficos extraídos de publicaciones científicas y periodísticas. Se examinaron al menos 20 gráficos de cada publicación. La tabla contiene una enorme variedad, tanto dentro de cada publicación, como en conjunto. Casi todas las revistas presentan algún diagrama rico en datos. La oportunidad está ahí, pero pocas veces se aprovecha: el gráfico medio es bastante ligero, con unos 50 números de media,

Densidad de Datos y Dimensiones de la Matriz de Datos, Gráficos Estadísticos en Publicaciones Escogidas, Circa 1979–1980 Densidad de datos (no por pulgada cuadrada) media mínima máxima

Dimensiones de la matriz de datos media mínima máxima

Nature

48

3

362

177

15

3780

Journal of the Royal Statistical Society, B

27

4

115

200

10

1460

Science

21

5

44

109

26

316

Wall Street Journal

19

3

154

135

28

788

Fortune

18

5

31

96

42

156

The Times (Londres)

18

2

122

50

14

440

Journal of the American Statistical Association

17

4

167

150

46

1600

Asahi

13

2

113

29

15

472

New England Journal of Medicine

12

3

923

84

8

3600

The Economist

9

1

51

36

3

192

Le Monde

8

1

17

66

11

312

Psychological Bulletin

8

1

74

46

8

420

Journal of the American Medical Association

7

1

39

53

14

735

New York Times

7

1

13

35

6

580

Business Week

6

2

12

32

14

96

Newsweek

6

1

13

23

2

96

Annuaire Statistique de la France

6

1

25

96

12

540

Scientific American

5

1

69

46

14

652

Statistical Abstract of the United States

5

2

23

38

8

164

American Political Science Review

2

1

10

16

9

40

0.2

0.1

1

5

4

20

Pravda

For Zabdiel Ramos Banda

166 teoría de los gráficos

mostrando sólo 10 por pulgada cuadrada. Entre la prensa internacional, The Wall Street Journal, The Times (Londres) y el japonés Asahi publican gráficos cargados de datos, con la misma densidad que los del Journal of the American Statistical Association. Casi toda la prensa norteamericana, junto con el Pravda moscovita, publican menos datos por gráfico que los periódicos importantes de otros países industrializados. Pocos gráficos estadísticos consiguen presentar tanta información como los mapas. Los mapas más detallados despliegan de 100,000 a 150,000 bits de información por pulgarada cuadrada. Por ejemplo, en los mapas topográficos del Instituto Geológico Norteamericano, un cuadrángulo (de 17 por 23 pulgadas) contiene unos 100 millones de bits de información, o cerca de 250,000 por pulgada cuadrada (40,000 por centímetro cuadrado)³. Tal vez algún día los gráficos estadísticos consigan representar información con tanto éxito como los mapas.

³ Morris M. Thompson, Maps for America (Washington, D.C., 1979), 187.

Gráficos de Gran Capacidad Informativa Los gráficos de datos deberían basarse en grandes matrices de datos de muy alta densidad. Cuánto más información mejor, especialmente si los costos marginales de manejar e interpretar información adicional son bajos, como suele ocurrir en la mayoría de los gráficos. Los conjuntos de datos complicados y extensos sólo pueden comunicarse mediante gráficos; en cambio, los más sencillos se expresan mejor mediante tablas y texto. Si la densidad del gráfico fuese excesiva (aunque varios miles de números pueden representarse sin problemas) existe una variedad de técnicas para reducir los datos antes de trazar el diagrama — medias, agrupamiento, pulido⁴. Los diagramas cargados de información pueden generar otros más resumidos, pero si comenzamos con un diseño pobre en datos, no llegaremos a ninguna parte. Los diseños ricos en información confieren contexto y credibilidad a la evidencia estadística. Los pobres son sospechosos: ¿Qué habrán dejado fuera? ¿Qué esconderán? ¿Por qué nos mostrarán tan poco? Los gráficos de alta densidad nos ayudan a hacer comparaciones internas en los datos, poniendo a nuestro alcance gran cantidad de información: leemos las páginas de una en una y cuanta más información haya en cada página, más efectiva y comparativa será nuestra lectura⁵. El principio, por lo tanto, es el siguiente: Maximice la densidad de los datos y el tamaño de la matriz de datos, dentro de lo razonable. Los gráficos con mucha información deben diseñarse con especial cuidado. Al aumentar el volumen de datos, las unidades de datos deben hacerse más pequeñas (puntos más pequeños para los diagramas de

⁴ Paul A. Tukey y John W. Tukey, “Summarization: Smoothing; Supplemented Views”, en Vic Barnett, ed., Interpreting Multivariate Data (Chichester, Inglaterra, 1982), cap. 12; y William S. Cleveland, “Robust Locally Weighted Regression and Smoothing Scatterplots”, Journal of the American Statistical Association, 74 (1979), 829–836, son publicaciones recientes en la extensa bibliografía sobre el tema. ⁵ Como se sugiere en el análisis de radiografías, hay que “buscar una imagen reducida para que el total pueda percibirse de un vistazo sin grandes movimientos oculares”. Edward Llewellyn Thomas, “Advice to the Searcher or What Do We Tell Them?” en Richard A. Monty y John W. Senders, eds., Eye Movements and Psychological Processes (Hillsdale, Nueva Jersey, 1976), 349.

      67

dispersión, líneas más delgadas para las series temporales). La acumulación de chatarra gráfica y de elementos no informativos o redundantes es incluso más negativa en los diseños ricos en datos. Para incrementar la densidad de los datos, además de agrandar la matriz, se puede reducir el área del gráfico. El principio de reducción tiene muchas aplicaciones: Los gráficos pueden encogerse muchísimo. Muchos gráficos pueden reducir su área a la mitad sin perder prácticamente legibilidad ni información. Por ejemplo, la línea elegante y nítida de Bertin permite desplegar 17 gráficos pequeños en una sola página, junto a considerable texto. El uso repetido de este principio conduce a una modalidad poderosa y eficaz del diseño gráfico: los minidiagramas múltiples.

Jacques Bertin, Sémiologie graphique (París, segunda edición, 1973), 214.

For Zabdiel Ramos Banda

168 teoría de los gráficos

Minidiagramas Múltiples Los minidiagramas múltiples se parecen a los fotogramas de una película: una serie de gráficos con la misma combinación de variables, ordenados según los cambios de otra variable. En este caso se presenta la contaminación atmosférica de Los Angeles a lo largo de veintitrés horas. Basándose en una cinta de vídeo generada por ordenador, se muestra la distribución media en cada hora de las emisiones reactivas de hidrocarburos. El diseño permanece constante en todos los cuadros y de esta forma la atención se concentra en las alteraciones de los datos:

A partir de un vídeo de Gregory J. McRae, California Institute of Technology. El modelo aparece descrito en G. J. McRae, W. R. Goodin y J. H. Seinfeld, “Development of a Second-Generation Mathematical Model for Urban Air Pollution. I. Model Formulation”, Atmospheric Environment, 16 (1982), 679–696.

      69

Edmond A. Murphy, “One Cause? Many Causes? The Argument from the Bimodal Distribution”, Journal of Chronic Diseases, 17 (), .

Cada una de estas doce distribuciones está basada en una muestra de  desviaciones aleatorias, para demostrar los efectos de los errores en la toma de muestras:

=

Estos minidiagramas múltiples muestran la distribución de los casos de melanoma. Se ha registrado la ubicación de 269 melanomas primarios, junto con la distribución en hombres y mujeres. Nótese la aritmética de los datos, similar al diagrama de ventanas.

+

Arthur Wiskemann, “Zur Melanomentstehung durch chronische Lichteinwirkung”, Der Hautarzt, 25 (1974), 21.

Seis distribuciones, a la derecha, muestran la composición por edades anual de las capturas de Arenque entre 1908 y 1913, en las grandes pescas del Norte de Europa. Observe la diferencia en la edad según los años van pasando. Un enorme número de Arenques fue engendrado en el año 1904, y esta generación comenzó a dominar las capturas de 1908, con Arenques de cuatro años de edad, capturas de cinco años de edad en 1909, y así sucesivamente. ¿No son los datos maravillosos? Las multirepresentaciones bien diseñadas son inevitablemente comparativas, multivariantes, reducidas, gráficas de alta densidad, generalmente basadas sobre una gran fuente de datos representadas casi por completo con tinta informativa, eficientes en interpretación y con frecuencia con contenido narrativo, mientras muestra los cambios en la relación entre las variables, conforme la variable índice cambia (en respuesta muestra interacción o efectos multiplicadores). Las multirepresentaciones son una excelente arquitectura para mostrar grandes cantidades de datos multivariantes.

Johan Hjort, “Fluctuations in the Great Fisheries of Northern Europe”, Rapports et procès-verbaux,  (), en Susan Schlee, The Edge of an Unfamiliar World (Nueva York, ), .

For Zabdiel Ramos Banda

 teoría de los gráficos

El próximo diseño compara un conjunto complejo de datos: de izquierda a derecha, se muestran los cromosomas del hombre, chimpancé, gorila y orangután. Las similitudes entre los humanos y los grandes simios son notables.

Jorge J. Yunis y Om Prakash, “The Origin of Man: A Chromosomal Pictorial Legacy”, Science, 215 (19 de marzo de 1982), .

      

Sparklines: Gráficos Intensos, Sencillos y del Tamaño de una Palabra ⁶ Los datos más comunes están compuestos por un sustantivo acompañado de un número. Por ejemplo, el nivel actual de glucosa de un paciente, es reportado en un registro clínico con una palabra y número:

⁶ Véase Edward Tufte, Beautiful Evidence (), -. Los últimos trabajos sobre sparklines y su codificación informática abierta están publicados en www.tufte.com.

glucose 6.6

Colocado en el contexto relevante, un solo número gana significado. Por lo tanto, la más reciente medición de la glucosa, se debe comparar con las medidas anteriores del paciente. Estos datos en gráfica, muestran la ruta de las últimas  lecturas de glucosa: glucose 6.6

Con la falta de una escala de medición, la gráfica flotante esta descuantificada. Por lo menos sabemos el valor de la línea en el punto rojo, que corresponde al valor más reciente de la glucosa, cantidad registrada en el extremo derecho. Las representaciones de la lectura más reciente están ligadas entre sí con un toque de color: glucose 6.6

Un contexto útil es logrado mostrando el rango normal de la glucosa, indicando aquí con la banda gris. Con respecto a los límites normales, las lecturas del nivel de glucosa por encima del horizonte de la banda grís están altos, los que están por debajo están bajos: glucose 6.6

or

glucose

6.6

Para análisis clínicos, la tarea consiste en detectar y evaluar rápidamente las desviaciones de los límites normales, que aquí se muestran fuera de la banda gris. Reproduciendo este formato aportamos datos adicionales al historial médico; con un cúmulo de datos, que pueden mostrar cientos de variables y miles de mediciones, permitiendo comparaciones paralelas rápidas y eficaces: glucose 6.6

respiration 12 temperature 37.1° C

Estas líneas de datos, debido a su calidad activa a través del tiempo, se denominan sparklines para crear gráficos pequeños de alta resolución, integrados por lo general en un contexto completo de palabras, números e imágenes. Sparklines son palabras de datos: con gran cantidad de información, de diseño sencillo, gráficos del tamaño de una palabra. Sparklines y graficos tipo sparklines, pueden moverse también dentro de espacios complejos multivariados, al igual que en estos resultados secuenciales de  pasos (leyendo las columnas hacia abajo) que fusionan y seleccionan  tipos diferentes de archivos de entrada. Cuatro variables y , números se indican en estas pequeñas cadenas.

A continuación, Robert Sedgwick, Algorithms in C (Reading, Massachusetts, ), .

For Zabdiel Ramos Banda

    

S  tienen una aplicación obvia para presentar datos económicos y financieros, para dar seguimiento y comparar cambios a través del tiempo, mostrando las tendencias e incluyendo los detalles. Integrado en una tabla de datos, este sparkline representa el precio diario de un euro en dólares durante un año. 2003.4.28

12 months

Euro foreign exchange $ 1.1025

2004.4.28

1.1907

low

high

1.0783 1.2858

Los colores ayudan a vincular el sparkline con los números: rojo = el precio mas antiguo y el mas reciente de la serie; azul = el precio mas alto y el mas bajo durante un año de tipos de cambio diarios. Ampliar esta tabla gráfica es sencillo; observe el precio del euro frente a otras  monedas durante  meses y  meses. 1999.1.1

65 months

2004.4.28

low

high

2003.4.28 12 months

2004.4.28

low

high

Euro foreign exchange $ 1.1608

1.1907

.8252 1.2858

$ 1.1025

1.1907

1.0783 1.2858

Euro foreign exchange ¥ 121.32

130.17

89.30 140.31

124.80 140.31

0.6665

.5711 0.7235

¥ 132.54 £ 0.6914

130.17

Euro foreign exchange £

0.6665

0.6556 0.7235

0.7111

Información diaria, puede ser estandarizada y escalada en todas las formas posibles con sparklines en función de su contenido: por rango de precios, precios ajustados por la inflación, variación porcentual, porcentaje de cambios de un mercado de referencia. Por lo tanto múltiples sparklines pueden describir el mismo sustantivo, así como varias columnas de números informarían diversas medidas de rendimiento. Estos sparklines revelan los detalles de los  meses mas recientes, en un contexto de una secuencia diaria de  meses (como el que se muestra en la estructura fractal de la derecha). Consumiendo una longitud horizontal del espacio de solo  letras cada sparkline anteriormente proporcionado, provee un panorama del precio y sus cambios diarios, durante años y ademas el patrón del tiempo total. Este cuadro financiero reporta  números exactos sobre  dígitos significativos; los sparklines que lo acompañan muestran aproximadamente , números legibles de  a  dígitos significativos. La idea es estar aproximadamente correcto que precisamente mal.⁷ Mostrando los cambios recientes en relación con muchos de los cambios historicos, los sparklines proporcionan un contexto de análisis matizado y se espera una mejor toma de decisiones. Por otra parte, la información histórica anual reduce el riesgo de crearse prejuicios la persistente y extendida sobre ponderación de los recientes acontecimientos, en la toma de decisiones. Las tablas a veces refuerzan los prejuicios, mostrando solamente los niveles actuales o cambios recientes, sesgando la información histórica; los sparklines mejoran la capacidad de atención en las tablas. Tablas de números, alcanzan densidades máximas de sólo  caracteres por pulgada cuadrada o  caracteres por centímetro cuadrado. Por el contrario, las gráficas tienen mucho mayor resolución; recordemos que “el poder de resolución del ojo le permite diferenciar a . mm donde lo origina.”⁸ Distinciones en . mm significan  por pulgada lineal, lo que implica , por pulgada cuadrada o , por centímetro cuadrado, que es suficiente.

5+ years 1 year

⁷ En estar “aproximadamente correcto que precisamente mal” (Approximately right rather than exactly wrong) ver John W. Turkey, “The Technical Tools of Statistics,”American Statistician,  (), -.

⁸ D. P. Bickmore, “The Relevance of Cartography,” en J. C. Davis y M. J. McCullagh, eds., Display and Analysis of Spatial Data (Londres, ), .

      

A continuación un cuadro financiero convencional que compara diferentes tasas de retorno de  fondos mutuos populares:

“Favorite Funds,” The New York Times,  de agosto del , -.

Popular mutual funds, based on assets under management. RETURN

ASSETS (MIL.) FUND

$64,368 62,510 50,329 47,355 40,500 37,641 31,161 28,296 25,314 24,155

4 WKS.

Vanguard Index 500 Index Fidelity Magellan Amer A Invest Co of Am Amer A WA Mutual Inv PIMCO Instl Tot Return Amer A Grow Fd of Amer Fidelity Contrafund Fidelity Growth & Inc Amer A Inc Fund of Amer Vanguard Instl Index

-

2.0% 2.1 1.2 1.5 2.3 2.9 1.0 1.8 0.5 2.0

2003

3-YR.

+ 12.2% + 11.3 +0 9.4 +0 9.9 +0 2.4 + 14.1 + 10.7 + 8.2 + 9.9 + 12.3

- 11.7% - 12.9 - 3.9 + 00.8 + 09.4 - 11.0 - 6.5 - 8.7 + 05.5 - 11.6

5-YR.

+ + + + + + -

0.8% 0.2 4.0 3.0 7.6 7.4 3.0 0.1 5.4 0.7

Esta es una muestra común del análisis de datos: una lista de los sustantivos (fondos de inversión, por ejemplo) con algunos números (de activos, cambios) que acompañan a los sustantivos. La tarea del analista es revisar la fuente de datos y decidir si hace una locura o no - o por lo menos tomar una decisión (comprar, vender, mantener) sobre el sustantivo basado en los datos. Pero con el resumen de datos tabulares, vamos a analizar la ruta de los precios día a día y sus cambios durante todo el año pasado. A continuación la tabla de sparklines:⁹ $64,368 62,510 50,329 47,355 40,500 37,641 31,161 28,296 25,314 24,155

Vanguard 500 Index Fidelity Magellan AmerA Invest Co Am Amer A WA Mutual Inv PIMCO Instl Tot Return Amer A Grow Fd Amer Fidelity Contrafund Fidelity Growth & Inc Amer A Inc Fund Amer Vanguard Instl Index

-2.0% -2.1 -1.2 -1.5 -2.3 -2.9 -1.0 -1.8 -0.5 -2.0

+12.2% +11.3 +09.4 +09.9 +02.4 +14.1 +10.7 +08.2 +09.9 +12.3

-11.7% -12.9 -03.9 +00.8 +09.4 -11.0 -06.5 -08.7 +05.5 -11.6

-0.8% -0.2 +4.0 +3.0 +7.6 +7.4 +3.0 -0.1 +5.4 -0.7

Es desconcertante como las similitudes finamente detalladas de estos datos históricos en los sparklines, no son sorprendentes después de todo. Frecuentemente los fondos de mercado utilizan el seguimiento del indice u otras estrategias de imitación y todos los fondos son impulsados a diario por la mismas fuerzas externas (noticias, modas, políticas económicas, pánicos y burbujas). De los  fondos, solo el desafortunado llamado PIMCO, es el único fondo de bonos en la tabla, que se aleja del patrón común de los  fondos de acciones, como se ve al comparar los sparklines de PIMCO con los otros  sparklines de la derecha. En los cuadros financieros de papel, en las largas columnas de números, se pueden agregar sparklines a las tablas a  líneas por pulgada (como en el ejemplo anterior). Esto produce unos  sparklines por columna, o 400,000 precios de gráficos diarios adicionales y sus cambios en un A o  por  pulgadas de papel. Los lectores pueden revisar las tablas de sparklines, haciendo simultáneas comparaciones, en busca de patrones no aleatorios, en los patrones aleatorios de los precios.

⁹ En nuestro nuevo diseño de la tabla, el tipo de letra Gill Sans queda bastante bien, en comparación con la Helvetica de la tabla original del Times. Más pequeña que la Helvetica, la Gill Sans es solida y mas fácil de leer, en parte debido al aumento de espacio en blanco que resulta de la menor altura de la x y la reducción de tamaño. El área de datos (sin las etiquetas de la columna) para nuestra tabla de sparklines es sólo el % más grande que el área de datos de la original, sin embargo, los sparklines ofrecen una visión aproximadamente de  números más.

 Instl Total Return fund All 9 other funds, overlapped All 10 funds, overlapped,  in red

For Zabdiel Ramos Banda

    

Los sparklines muestran y narran de manera eficiente los datos binarios (presencia/ausencia, ocurrencia/no ocurrencia, victorias/derrotas). Para el béisbol, aquí está la historia de la temporada larga de victorias (hacia arriba) y las pérdidas (hacia abajo) para un equipo, . Esta secuencia gráfica de 162 juegos permite a los aficionados al deporte recordar el mal comienzo, los primeros triunfos dispersos, otra mala racha, y así sucesivamente a través de toda la temporada. Los sparklines mostrados en secuencia, pueden ayudar a informar todo tipo de noticias diarias. Este sparkline, añadido a un enunciado se convierte en una palabra de datos definiendo la secuencia de victorias y derrotas para los primeros 39 partidos de la temporada. La mayoría de los aficionados al deporte podrán rápidamente entender el significado del sparkline en el contexto, casi todos los lectores podrán entender el significado la segunda vez que un sparkline es publicado. Muy bueno para una palabra nueva. Los sparklines pueden albergar múltiples variables simultáneamente. Un equipo juega en su propio campo y en campos de la oposición, se hace una distinción gráfica para indicar los partidos en casa con una linea horizontal y sin linea para los partidos fuera de casa, . La correlación serial aparente (ondas cortas de mayor o menor éxito) en esta serie de tiempo es el resultado de un programa de alternancia de partidos en casa y fuera de casa, ya que los equipos tienen más éxito en en casa. Una estrategia útil para mostrar datos consiste en multiplicar un buen diseño. Estos sparklines comparan las temporadas de juego: New York

101-61

Boston

98-64

ORIOLES EXTIENDE SUS VICTORIAS EN SERIE Ayer, el equipo de Baltimore Orioles quien se esta levantando sorprendentemente, gana su cuarto partido en serie. Aún así, el equipo apenas se ha recuperado de un mal comienzo, con un récord de la temporada hasta el momento de 8 victorias y 31 derrotas , actualmente el peor equipo del béisbol.

Una marca roja indica que el equipo perdedor se llevó a cabo sin goles. Estos 2 sparklines representan y comparan 5 variables (secuencia ordenada de partidos, victorias/derrotas, casa/fuera de casa, no blanqueada/blanqueada y equipo) para 162 juegos. A continuación, 6 párrafos de sparklines cuentan la historia de la temporada  de 6 divisiones, mostrando caminos competitivos (ganados - pérdidos = juegos netos de más de .) por  equipos de béisbol de los 162 partidos jugados por cada equipo. Las tablas informan  dígitos, estos sparklines trazan el resultado de  ganados/perdidos: American East

home road pct +40 NY Yankees 101-61 57-24 44-37 .623 +34 Boston 98-64 55-26 43-38 .605 – 06 Baltimore – 22 Tampa Bay – 27 Toronto

American Central

National Central

92-70 45-36 47-34 .568 91-71 52-29 39-42 .562 89-73 51-30 38-43 .549

–36 Seattle

63-99 38-44 25-55 .389

+48 St. Louis +22 +16 – 10 – 17 – 27

72-90 38-43 34-47 .444

+22 LA Angels +20 Oakland +16 Texas

home road pct 96-66 49-32 47-34 .593

–20 NY Mets 71-91 38-43 33-48 .438 – 28 Washington 67-95 35-45 32-50 .414

–46 Kansas City 58-104 33-47 25-57 .358 American West

+30 Atlanta

+10 Philadelphia 86-76 42-39 44-37 .531 83-79 42-38 41-41 .512 +04 Florida

78-84 38-43 40-41 .481 70-91 41-39 29-52 .435 67-94 40-41 27-53 .416

+23 Minnesota 92-70 49-32 43-38 .568 +34 Chicago Sox 83-79 46-35 37-44 .512 80-82 44-37 36-45 .494 – 03 Cleveland – 18 Detroit

National East

National West

105-57 53-28 52-29 .648

Houston 92-70 ChicagoCubs 89-73 Cincinnati 76-86 Pittsburgh 72-89 Milwaukee 67-94

48-33 45-37 40-41 39-41 36-45

44-37 44-36 36-45 33-48 31-49

.568 .549 .469 .447 .416

+24 LA Dodgers 93-69 49-32 44-37 .574 +20 San Francisco 91-71 47-35 44-36 .562 +12 San Diego 87-75 42-39 45-36 .537 – 26 Colorado – 60 Arizona

68-94 38-43 30-51 .420 51-111 29-52 22-59 .315

      75

Las palabras de datos de los sparklines aumentan enormemente la cantidad de datos a la vista. Funcionando con la resolución de un buen tipo de letra, los sparklines pueden estar en todas partes donde un número o una palabra podría estar. Con una resolución de: 5 a 100 veces mayor que los gráficos y las tablas convencionales, los sparklines nos dan una mejor oportunidad de aprender de la gran cantidad de números, producto de mediciones modernas, monitoreo y vigilancia. Al proporcionar una perspectiva directa y contextual en pruebas intensas, los sparklines pueden ayudarnos, en las palabras de John Tukey, para encontrar una respuesta aproximada a la pregunta correcta (en lugar de una respuesta exacta a la pregunta equivocada). Aproximadamente el 5% de los gráficos publicados en las principales revistas científicas, representan datos con resoluciones similares a sparklines, como en la secuencia del cromosoma, monitoreo de eventos, análisis acústico, y muchos tipos de mapeos. Gráficas de alta resolución (200 números por centímetro cuadrado, o 1200 por pulgada cuadrada) nos ayudan a describir, explorar, presentar y comprender los enormes conjuntos de datos de investigación científica. En el año 2009, la gráfica de datos mediana publicada en Nature and Science presentó > 1200 números. Para estas importantes revistas científicas durante los últimos 10 años, las densidades de datos de gráficas publicadas se han duplicado como medición científica y la resolución ha aumentado considerablemente. Grandes cantidades de datos (como en la ciencia, la ingeniería, la medicina, las finanzas, los deportes, el clima) requieren de alta resolución en gráficas estadísticas y tablas. ¿De que otra forma podemos ver los datos?

Para la tinta sin información, menos es más. Para la tinta informativa, menos es poco.¹⁰

¹⁰ Los dos aforismos sobre el significado de “menos” usualmente son acreditados a los arquitectos Ludwig Mies van der Rohe y Robert Venturi.

For Zabdiel Ramos Banda

9

Estética y Técnica en el Diseño de Gráficos de Datos

Minard elaboró al menos dos versiones de la marcha de Napoleón hacia Moscú, la segunda de ellas en colores y con un texto adicional que describía sus fuentes de información. En las placas de 1869 se añadió otra “Carte Figurative” sobre la campaña de Aníbal en España, Galia y el norte de Italia. Su uso refinado del color contrasta con los tonos agresivos tan comunes en los gráficos de hoy en día. ¿Cómo se consigue esta elegancia? ¿En qué se basa la calidad de los gráficos de Minard, Playfair y Marey, y de algunas obras recientes, como la nueva imagen de las galaxias? Un buen diseño tiene dos elementos clave: La elegancia gráfica nace de la simplicidad del diseño y la complejidad de los datos. Los gráficos que resultan atractivos a la vista resultan efectivos también por su contenido e interpretación, más allá del despliegue de unos cuantos números. Los mejores gráficos tratan sobre temas útiles e importantes, sobre la vida y la muerte, sobre el universo. Los gráficos hermosos no pierden el tiempo en asuntos triviales. En contadas ocasiones la arquitectura gráfica combinada con el contenido de los datos produce un gráfico espectacular. Aunque podemos describirlos y admirarlos, no existen principios de composición para crear ese gráfico único entre un millón. “La estética es para el artista lo que la ornitología es para los pájaros”, como dijo Barnett Newman. No obstante, podemos ofrecer algunas sugerencias para mejorar la calidad visual de los diseños más rutinarios y habituales. Los diagramas estadísticos atractivos: • tienen un formato y un diseño apropiado; • usan conjuntamente palabras, números y dibujos; • reflejan equilibrio, proporción y una escala con sentido; • despliegan una complejidad accesible del detalle; • suelen tener calidad narrativa, una historia que contar sobre los datos; • están trazados de forma profesional, con atención a los detalles técnicos; • evitan la decoración sin contenido, incluyendo la chatarra gráfica.

Charles Joseph Minard, Tableaux graphiques et cartes figuratives de M. Minard, 1845–1869, carpeta con su obra de la Bibliothèque de l’École Nationale des Ponts et Chaussées, París.

For Zabdiel Ramos Banda

178 teoría de los gráficos

Elección del Diseño: Frases, Tablas de Texto, Tablas, Semi-Gráficos y Gráficos El contenido, el tamaño de los rótulos, y el volumen y el orden de los datos ayudan a determinar la elección del método para representar los materiales cuantitativos. Las estructuras básicas para mostrar los datos son la frase, la tabla y el gráfico. A menudo, deben combinarse dos o tres de estos elementos. Cuando queremos mostrar más de dos números, la frase convencional es poco apropiada porque no permite la comparación de los datos entre sí. La organización lineal de las palabras, cortada arbitrariamente según el ancho de la columna del texto, no ofrece ni siquera una dimensión eficaz para organizar los datos. En lugar de: Casi el 53% del grupo tipo A hizo esto o aquello comparado con el 46% del tipo B y algo más del 57% del C. Se puede ordenar el texto para facilitar la comparación, como en esta tabla de texto: Los tres grupos difieren en cómo hicieron esto o aquello: Grupo A 53% Grupo B 46% Grupo C 57% Y casi siempre hay otro orden mejor que el alfabético, por ejemplo, el contenido o los valores de los datos: Grupo B 46% Grupo A 53% Grupo C 57% Las tablas son el mejor método de mostrar valores numéricos exactos, aunque éstos también pueden organizarse en forma de semi-gráficos. Para los conjuntos pequeños de datos, las tablas son preferibles a los gráficos¹, y además, casi siempre superan a los aburridos gráficos circulares o de pie; lo único peor que un gráfico circular es un grupo de ellos, porque obligan a comparar cantidades desperdigadas por el espacio, dentro de cada gráfico y entre los distintos gráficos, como en este ejemplo encontrado en un atlas. Debido a su baja densidad de datos y su incapacidad para ordenar números de acuerdo a una dimensión visual, los gráficos de sectores no deberían usarse nunca².

Department of Surveys, Ministry of Labour, Atlas of Israel (Jerusalén, 1956–), vol. 8, 8.

¹ Sobre el diseño de tablas, véase A. S. C. Ehrenberg, “Rudiments of Numeracy”, Journal of the Royal Statistical Society, A, 140 (1977), 277–297. ² Jacques Bertin se expresa con claridad sobre ello en La graphique et le traitement graphique de l’information (París, 1977). Bertin describe los diagramas de sectores múltiples como “completamente inútiles” (p. 111).

Las tablas también funcionan bien cuando la presentación de los datos requiere muchas comparaciones localizadas. En esta tabla de 410 números que diseñé por encargo del New York Times se muestra con detalle la distribución de los votos en las elecciones presidenciales en los Estados Unidos. En cada línea se leen las comparaciones entre las elecciones de 1980 y 1976; el análisis de cada una de ellas se hace leyendo hacia abajo los grupos de tres a siete líneas. Las líneas horizontales dividen los datos según su tema y las filas están ordenadas para contar una historia sobre las elecciones. Este tipo de tabla elaborada, una supertabla, atraerá a los lectores y los intrigará por sus detalles ordenados y secuenciados, y por su calidad como índice de referencia. Una supertabla es mucho mejor que un centenar de gráficos de barras.

New York Times, 9 de noviembre de 1980, a-28.

For Zabdiel Ramos Banda

180 teoría de los gráficos

Para conjuntos de números con muchas explicaciones funcionan bien los gráficos con muchas palabras, muy cercanos al texto puro. Esta tabla de números queda bien organizada en un gráfico:

New York Times, 2 de enero de 1979, d-3.

Hacer Accesible lo Complejo Combinando Palabras, Números e Imágenes Las explicaciones que nos permiten acceder a la riqueza de los datos hacen que los gráficos sean más atractivos para el lector. A veces, las palabras y las imágenes se tornan rivales en la lucha de los artistas y los redactores por adueñarse del poco espacio disponible. Una desgraciada herencia de esta rencilla profesional es la separación artificial entre palabras e imágenes; algunos manuales de estilo han llegado incluso a prohibir el uso de texto en los gráficos. El error consiste en dar preferencia a las técnicas de producción por encima de la información. Las palabras y las imágenes pertenecen a la misma familia. Los lectores necesitan la ayuda de las palabras, que en el contexto gráfico no son accesorias sino informativas e utilizan eficazmente el espacio que queda libre al reducir la tinta decorativa o redundante. Casi siempre es útil escribir pequeños rótulos en el espacio del gráfico para explicar los datos, identificar los ejemplos excepcionales o interesantes, escribir ecuaciones y a veces tablas en el gráfico mismo, e integrar los rótulos y las leyendas en el diseño de forma que el lector no se vea obligado a alternar entre el

estética y técnica 181

material textual y el gráfico. (El tamaño de la letra en el gráfico puede ser bastante pequeño, ya que las frases no suelen ser muy largas, y por tanto los lectores no se cansarán como ocurriría con textos más extensos). El principio de integración de datos y texto es: Los gráficos estadísticos son párrafos sobre datos y deben ser tratados como tales. Las palabras, gráficos y tablas son distintos mecanismos con un objetivo común: presentar información. ¿Por qué romper el flujo de información en distintos lugares de la página sólo porque la información esté en formatos distintos? A veces puede ser útil presentar distintas líneas narrativas o varios niveles de información, pero ésta debe ser una decisión consciente, no algo decidido por los requisitos de producción. Imagine que los gráficos fueran sustituidos por párrafos y éstos se dispersaran por la página sin mantener ninguna conexión con el resto del texto. Precisamente esto es lo que ocurre con los gráficos y tablas en el diseño de muchas páginas impresas, particularmente en las revistas científicas y las publicaciones profesionales. Las tablas y los gráficos deben integrarse en el texto siempre que sea posible, evitando la torpe distracción que suponen las llamadas del tipo, “Véase Fig. 2” (figuras que a menudo se encuentran en el reverso de la página adyacente)³. Si se habla de un diagrama en varias partes distintas del texto, no estaría de más reproducirlo cada vez que lo citamos, quizás a menor tamaño que la primera ocasión. El principio de integración de textos, gráficos y tablas también sugiere el uso del mismo tipo de letra en el texto y en el gráfico y, además, evitar las líneas de separación entre distintos tipos de información. Albert Biderman menciona que las ilustraciones solían aparecer integradas en el texto de manuscritos científicos, como los de Newton o Leonardo da Vinci, pero los gráficos estadísticos se separaron de los textos y las tablas con la llegada de la imprenta: La evolución de los métodos gráficos como elemento científico se ha visto entorpecida por su posición adjunta, segregada y marginal. Las exigencias tipográficas que desplazaron los gráficos a una posición separada en la página impresa, han contribuido a su segregación y marginalidad intelectuales. Existía además una segregación organizativa, pues las decisiones sobre los gráficos pasaban de las manos del analista que los concibió a las del especialista gráfico: los artistas comerciales y diseñadores de los departamentos gráficos y tiendas de audiovisuales, por ejemplo, cuyas predilecciones y habilidades suelen estar más en la línea de los decoradores y vendedores que de los analistas científicos y comunicadores⁴.

³ “Fig.” se usa a menudo para referirse a las gráficas, es una abreviatura fea y no merece la pena usarla por solo ahorrarse dos espacios.

⁴ Albert D. Biderman, “The Graph as a Victim of Adverse Discrimination and Segregation”, Information Design Journal, 1 (1980), 238.

For Zabdiel Ramos Banda

182 teoría de los gráficos

En los manuscritos de da Vinci se observa la integración elegante y absoluta entre texto y figura, una cualidad que escasea en las páginas actuales:

Por último, una advertencia: el uso conjunto de palabras e imágenes requiere una sensibilidad especial hacia el propósito del diseño. Más concretamente, hay que determinar si se trata de comunicar e ilustrar un hallazgo determinado o de explorar un conjunto de datos. Las palabras en el gráfico, o alrededor de él, son muy efectivas, a veces demasiado, a la hora de indicar a los lectores cómo dirigir su atención a las distintas partes del diagrama⁵. Así pues, en los gráficos destinados al análisis exploratorio de los datos, las palabras deben indicar al lector cómo leer el diseño (si es un diagrama técnicamente complejo), pero nunca qué leer en términos de contenido, es decir, cómo interpretarlo.

Leonardo da Vinci, Treatise on Painting [Codex Urbinas Latinus ], vol. 2, facsímil (Princeton, 1956), 234, párrafo 827.

⁵ Los experimentos en percepción visual indican que las instrucciones textuales determinan sustancialmente el movimiento ocular al estudiar imágenes. Véase John D. Gould, “Looking at Pictures”, en Richard A. Monty y John W. Senders, eds., Eye Movements and Psychological Processes (Hillsdale, Nueva Jersey, 1976), 323–343.

estética y técnica 183

Complejidad Accesible: El Gráfico Amistoso De vez en cuando, un gráfico exhibe un diseño tan cuidadoso que resulta particularmente accesible y directo, como si el diseñador hubiera tenido en cuenta al lector en cada paso de su elaboración. Lo llamaremos gráfico amistoso. Hay muchas diferencias entre los gráficos amistosos y los hostiles: amistosos:

hostiles:

Palabras sin abreviar, evitan códigos misteriosos y elaborados

Abundantes abreviaturas, el lector debe descodificarlas con la ayuda del texto

El texto se lee de izquierda a derecha, como es habitual en los idiomas occidentales

Palabras en sentido vertical , sobretodo junto al eje Y; palabras que se leen en direcciones distintas

Rótulos pequeños que ayudan a explicar los datos

El gráfico es críptico, requiere repetidas referencias al texto disperso

Evitan códigos elaborados de sombreados, líneas y colores; en cambio usan notaciones en el gráfico mismo, sin leyendas

Códigos oscuros requieren consultar repetidas veces gráfico y leyenda

Atraen al lector, provocan curiosidad

Repelentes, llenos de chatarra

Si hay colores, son elegidos para que puedan interpretarlos los daltónicos (del 5 al 10% de los lectores; casi todos pueden distinguir el azul de los demás colores)

Insensibles al lector daltónico; el rojo y el verde utilizados para contrastes esenciales

El texto es claro, preciso, modesto; puede trazarse a mano

El texto es denso, excesivo

Hay mayúsculas y minúsculas, con serifs

Todo mayúsculas, sans serif

Respecto a la tipografía, Josef Albers escribe: El concepto de que “cuanto más simple es la forma de la letra, más fácil es de leer” se convirtió en una obsesión del constructivismo, algo como un dogma al que todavía obedecen los tipógrafos “modernistas”.[…] La oftalmología ha descubierto que cuanto más distintas son las letras unas de otras, más fácil resulta la lectura. Sin entrar en detalles y comparaciones, debemos darnos cuenta de que las palabras escritas exclusivamente con mayúsculas son las más difíciles de leer, porque tienen la misma altura, el mismo volumen, y, en su mayoría, la misma anchura. En cuanto a las letras con serif y sans serif, ésta última es más difícil de leer. Que las sans serif estén de moda no implica competencia histórica ni práctica⁶.

⁶ Josef Albers, Interaction of Color (New Haven, 1963, edición revisada 197), 4.

For Zabdiel Ramos Banda

184 teoría de los gráficos

Proporción y Escala: Ancho de Línea y Rotulación Los elementos gráficos quedan mejor juntos cuando sus proporciones relativas están equilibradas. De esta forma alcanzan una integración y un nexo visual apropiado entre los distintos elementos. Esta partitura de Karlheinz Stockhausen es una muestra de equilibrio visual:

Karlheinz Stockhausen, Texte, vol. 2 (Colonia, 1964), p. 82, de la partitura de “Zyklus für einen Schlagzeuger”.

En cambio, el siguiente diseño es muy torpe, con casi todos sus elementos en desequilibrio: la tinta apelmazada, los rótulos pobres, la presentación hinchada a partir de unos pocos datos, la poca resolución de todo el diagrama, y la falta de coordinación entre la imagen y el texto que la rodea:

Edward R. Tufte, “The Relationship Between Seats and Votes in Two-Party Systems”, American Political Science Review, 67 (junio de 1973), 551.

estética y técnica 185

Las líneas deben ser delgadas. Los gráficos de los siglos XVIII y XIX tienen una imagen tan hermosa, porque se grababan en láminas de cobre con trazos tan delgados como un cabello. Los rotuladores del siglo XX ensancharon la línea, haciéndola torpe y poco atractiva. Un recurso estético muy efectivo es la intersección ortogonal de líneas de distinto grosor: Póster de la exposición “Mondrian and Neo-Plasticism in America”, Yale University Art Gallery, del 18 de octubre al 2 de diciembre de 1979. El dibujo original fue realizado en 1941 por Diller; véase Nancy J. Troy, Mondrian and Neo-Plasticism in America (New Haven, 1979), 28.

Casi todas las intersecciones de este diseño (basado en un dibujo de Burgoyne Diller) incluyen líneas de distinto grosor. Cuando se iguala la anchura de las mismas, el dibujo pierde carácter:

For Zabdiel Ramos Banda

186 teoría de los gráficos

Del mismo modo, los gráficos de datos pueden mejorarse con la intersección perpendicular de líneas de distinto grosor. La línea más gruesa debe ser una unidad de datos. Por ejemplo, en una serie temporal:

El contraste en el grosor representa un contraste en importancia. Cuanta mayor importancia, mayor grosor; de esta forma, la línea de los datos debería resaltarse más que las verticales conectoras. En este caso, se trata de una lógica equivalente, aunque en otro idioma, al principio de la maximización de la tinta informativa.

Proporción y Escala: La Forma de los Gráficos Los gráficos deben tender hacia una forma horizontal, más larga que alta: menor altura

mayor longitud

Varios argumentos apoyan los gráficos horizontales sobre los verticales. En primer lugar, la analogía con el horizonte. El ojo humano está más acostumbrado a percibir variaciones en el horizonte, y el diseño gráfico debería aprovecharse de este hecho. Las series temporales que progresan en sentido horizontal se leen más fácilmente:

estética y técnica 187

La analogía con el horizonte también sugiere que un diagrama sombreado, con elevado contraste, en ocasiones puede resultar mejor que una sola línea. El sombreado deberá ser discreto, evitando los efectos moiré.

En segundo lugar, facilitar los rótulos. Es más fácil leer y escribir de izquierda a derecha sobre un marco horizontal:

un rótulo un rótulo

en lugar de

otro rótulo otro rótulo

En tercer lugar, resaltar la causalidad. Muchos gráficos colocan, en esencia,

el efecto

la causa

pero un eje horizontal más largo ayuda a explicar con más detalle el mecanismo de la variable causal.

For Zabdiel Ramos Banda

188 teoría de los gráficos

En cuarto lugar, el consejo de Tukey.

⁷ John W. Tukey, Exploratory Data Analysis (Reading, Mass., 1977), 129.

La mayoría de los diagramas analíticos incluyen o bien una dependencia más o menos definida que varía mucho, o una nube de puntos. En general, la mayoría de los diagramas mejoran cuando son más anchos que altos, pues es más fácil para la vista leer de izquierda a derecha. Tal vez la recomendación más general que podemos ofrecer es que las curvas con variaciones suaves pueden ser más altas que anchas, pero las más irregulares necesitan una anchura mayor.[…]⁷ Y, por último, el ejemplo de Playfair. De los 89 gráficos incluidos en seis libros suyos, la mayoría (el 92%) son más anchos que altos. Entre las excepciones, destacan los gráficos sobre el aumento de la deuda pública. Este diagrama muestra las dimensiones de los 89 gráficos:

Gráfico más ancho que alto

Gráfico más alto que ancho Gráfico cuadrado

Altura (pulgadas)

12

8

Cada punto representa la esquina superior derecha de un gráfico de Playfair; por ejemplo:

4

4

8

12

16

Longitud (pulgadas)

estética y técnica 189

Si los gráficos tienden hacia la horizontal más que a la vertical, ¿cual debe ser la proporción? Una norma de proporción estética venerable (siglo V a.C.) pero dudosa, es la sección áurea: “una división divina” de una recta⁸. La línea se divide de forma que la parte menor y la mayor guarden entre sí la misma proporción que la mayor y el todo:

Resolviendo la ecuación, cuando a = 1 resulta que b =

⁸ Para la combinación de geometría y misticismo que rodea el Rectángulo Áureo, véase Miloutine Borissavlièvitch, The Golden Number and the Scientific Aesthetics of Architecture (Nueva York, 1958) y Tons Brunés, The Secrets of Ancient Geometry (Copenhague, 1967), vols. 1 y 2.

⻫ + 1 = 1.618.[…] 2

A su vez, el Rectángulo Áureo es

La elegante geometría del Rectángulo Áureo no es única; Birkhoff señala que al menos otros cinco rectángulos (incluyendo el cuadrado) tienen alguna propiedad matemática simple que justifica su valor estético⁹:

Playfair favoreció proporciones de entre 1.4 y 1.8 en casi dos tercios de sus gráficos publicados. La mayoría de las excepciones eran más horizontales que la receta de áurea:

⁹ George D. Birkhoff, Aesthetic Measure (Cambridge, 1933), 27–30.

Rectángulo Áureo

For Zabdiel Ramos Banda

190 teoría de los gráficos

Las preferencias visuales hacia las proporciones rectangulares han sido estudiadas por los psicólogos desde 1860, pero incluso en el caso poco probable de que tales estudios fueran relevantes para el diseño gráfico, los hallazgos no son decisivos. Se encuentra una ligera preferencia por las proporciones cercanas al Rectángulo Áureo, pero las proporciones altura/longitud varían mucho, entre

e

Y como suele pasar en los experimentos sobre la percepción gráfica, las respuestas de los lectores reflejaban la influencia del contexto¹⁰. Las conclusiones: • Si la naturaleza de los datos sugiere la forma del gráfico, siga esa sugerencia. • En caso contrario, elija los gráficos horizontales un 50% más anchos que altos:

¹⁰ Me baso en Leonard Zusne, Visual Perception of Form (Nueva York, 1970), cap. 10, para el resumen de la extensa bibliografía al respecto.

Epílogo: Diseños Para Representar Información

El diseño se basa en la capacidad de elegir. La teoría de la representación visual de información cuantitativa consiste en varios principios que generan distintas opciones de diseño y que ayudan a elegir entre ellas. Los principios no deben aplicarse estrictamente ni a toda costa; no son certezas lógicas o matemáticas. Es preferible violar cualquier principio a colocar elementos sin gracia ni elegancia sobre el papel. La mayoría de los principios de diseño deben recibirse con escepticismo, porque la autoridad de la palabra podría llegar a dominar nuestra visión, cegando nuestra propia perspectiva. El objetivo de un buen diseño es representar información compleja con claridad. No se trata de complicar lo simple; la tarea del diseñador consiste en proporcionar acceso a lo sutil y lo difícil, es decir, Revelar lo complejo.

For Zabdiel Ramos Banda

Índice

194 indice

ahorro de combustible, gráfico 57–59 Akahata (“Bandera Roja”) 83 Albers, Josef 183 Alder, Berni 134, 145 alta resolución en gráficos de datos 160–175 American Education 118 American Political Science Review 165 American Statistical Association 79 amistosos, gráficos de datos 183 anchura de línea 185 Anderson, Robert 85 Aníbal, campaña de 176–177 Annuaire Statistique de la France 165 Anscombe, F. J. 14 Anscombe’s quartet 13–14 antes y después, series temporales 39 Apianus, Petrus 22 área y cantidad 69–73 Arkin, Herbert 112 arquitectura visual 159 Asahi 83, 165, 166 Asch, S. E. 56 astronómicos, gráficos 26–29, 154, 164 automóviles, frecuencia de reparación 174 Ayres, Leonard P. 141, 155 Ayres, Richard E. 95 Bamburger, Clara Francis 82 Bancroft, T. A. 53, 140 Barabba, Vincent P. 153 Barnett, Vic 114, 166 béisbol 174 Beniger, James R. 20, 86 Berg, William J. 112 Bertin, Jacques 112, 164, 167, 178 Bickmore, D.P. 161, 172 Biderman, Albert D. 181 Biochemistry 110 Biochimica et Biophysica Acta 110 Birkhoff, George D. 189 Blot, William J. 16 Bonner, John Tyler 94 Borissavlièvitch, Miloutine 189 Bowen, William G. 95 Brier, Stephen S. 14 Brinton, Willard C. 112 Brown, Denise Scott 116–117 Brunés, Tons 189 Bryan, Kirk 99 Business Week 63, 83, 165

caballito de mar 36 cálculo 9 cálculo, gráfico 46 California Water Atlas 119 Cámara de Representantes 37 Campbell, Angus 147 Campbell, Donald T. 75 cáncer de pulmón 16–20, 47 cáncer 16–20, 47, 169 cáncer, mapas del 16–20, 121 Cappon, Lester J. 146 caras de Chernoff 97, 142 causa y efecto 3 7, 47, 82,187 cem 56 chatarra gráfica 107–121 Chavannes, E. 21 Chernoff, Herman 136,142 Cheysson, É. 154 Cleveland, William S. 38, 166 clima de Nueva York 30, 121, 162 cobre, conducitividad del 49 codificación 178, 183 color 153–154, 183 Colton, Raymond R. 112 communes francesas 166 condado, mapas de 16–20, 153 Congreso de EE.UU 37 Consumer Reports 80, 174 consumo de combustible, gráficos 57–59 contaminación atmosférica 42 contexto 74–75 Converse, Philip E. 147 coordenadas cartesianas 9 Cornford, Eain M. 109 correo, Cámara de Representantes 37 Correos italiano 72 corrientes oceánicas 99 Cosmographia 22 Cox, Michael D. 99 cromosomas 170 Crotty, William J. 95 cuadrícula 112–116 cuadrícula blanca 127–129, 136 cuadrícula gris 116 cuadrícula informativa 145–148 cuarteto de Anscombe 13–14 Curti, Merle 85 Dahl, Robert A. 85 Dakin, Edwin F. 15 Daniel, Cuthbert 133

datos económicos 15, 32–34, 38, 54–55, 61–68, 70, 91–92, 108, 126, 148, 152, 158, 160, 172, 173, 180 datos médicos 171 Davis, John C. 161 Day Mines, Inc. 54 decodificador visual 153–154 densidad de datos 160–167 densidad de población, mapa de 155–157 Der Spiegel 83 Desnudo descendiendo una escalera 36 Dewey, Edward R. 15 diagrama de “hoja y tallo” 140 diagrama de cajas 97, 123, 129 diagrama de cuartil 124, 136, 139 diagrama de dispersión 130–135 diagrama de puntos y líneas 133, 136, 139, 152 diagrama de tapete 135, 136 diagrama de ventanas 114 diagrama esquemático paralelo 125 Die Zeit 83 Diller, Burgoyne 185 dinero no ajustado por la inflación 65–68 distorsión gráfica 55–59 dólares constantes 65–68 Doll, R. 47, 82 Duchamp, Marcel 36 ‘Easter Wings’ 143 Ehrenberg, A. S. C. 178 electroencefalograma 93 elegancia gráfica 177 elementos multifuncionales 139-159 elementos químicos 102–105 eliminación, principios de 96–100, 136 Eliot, T. S. 100 Erbring, Lutz 120 error en la toma de muestras 169 escarabajo japonés 43, 121 Escuela Pravda de Gráficos Ordinales 76 estadísticas aburridas 79–80, 87 estética gráfica 177–191 estrella de mar 36 exámenes de admisión Facultad de derecho, gráficos 86 exámenes escolares, gráficos de 86 excelencia gráfica 13–51 experimentos psicológicos 55–56 extraños 142

For Zabdiel Ramos Banda

indice 195

Factor de mentira 57 Fienberg, Stephen E. 14 ‘Fig.’ 181 Finkner, Alva L. 153 Finley, Dawn 40 Fiorina, Morris 66 Fisher, R. A. 133 Flanigan, William H. 85 Flury, Bernhard 97 forma gráfica 186–190 Fortune 167 Francolini, C. M. 153 Frankfurter Allgemeine 83 Fraumem, Joseph F. 16 Funkhouser, H. Gray 20, 28, 154 Gabaglio, Antonio 72 galaxias, mapa de las 26–27, 154, 164 Galileo 175 gasto gubernamental 64–68, 158 gecko 36 Geller, Margaret J. 26 Gilbert, E. W. 24 Gill Sans, tipografía 173 Goldenberg, Edie N. 120 Goodin, W. R. 168 Gould, John D. 182 gráfica circular o de pie 178 gráfico de barras 96–97, 126–128, 129 “Gráfico de los paralelepípedos mágicos” 68 gráfico de votos en las presidenciales 147, 179 gráficos amistosos 183 gráficos astronómicos 26–29, 154, 166 gráficos electorales 147, 179 gráficos estadísticos 171–174 “Gráficos estadísticos de alta costura” 118 gráficos japoneses 82–84 gráficos mentirosos 76–77 gráficos por ordenador 26–27, 29, 42, 112, 116, 120–121, 136, 153, 170 gráficos relacionales 43–50 gráficos televisivos 76, 81 ‘Gran Pato’ 116, 117 Groth, Edward J. 26 Gurnett, Donald A. 29 Halley, Edmond 23 Hankins, Timothy H. 134 Hayward, Roger 102, 136 Herbert, George 143

Herdeg, Walter 80, 152 Hilgard, Ernest 85 histograma 126–128 histograma viviente 140 Hjort, Johan 169 Ho, C. Y. 49, 150 Hoover, Robert 16 horario de trenes 31, 98, 115–116, 121 horas de sol en Gran Bretaña 163 horizonte, analogía con 186–187 Huchra, John P. 26 Huot, Marie E. 109 Instituto geológico, mapas del 168 integración datos/texto 180–182 Israel, atlas de 178 Izenour, Steven 117 Japón, gráficos de exámenes universitarios 86 jerarquía en gráficos 153–159 Joiner, Brian L. 140 Journal of the American Chemical Society 110 Journal of the American Medical Association 165, 166 Journal of the American Statistical Association 110, 150–151, 162, 165, 166 Journal of Biological Chemistry 110 Journal of Chemical Physics 110 Journal of the Royal Statistical Society 165 Júpiter, gráfico de 29 Kahrl, William L. 119 Kelley, Stanley 95 Knapp, Gillian R. 26 Kolers, Paul A. 79 Kooi, Kenneth 93 Kouchoukos, Nicholas T. 109 Kuznicki, James T. 100, 109 Lambert, Johann Heinrich 29, 32, 45–46 Lancet 110 Larsen, Wayne A. 129 Lauer, A. R. 144 Le Monde 83, 167 Learning from Las Vegas 116–117 lectores daltónicos 183 Leonardo da Vinci 181–182 libros de texto 84–85 Liley, P. E. 49, 150 líneas de la calzada 144

líneas, grosor 185 líneas ortogonales 185–186 líneas perpendiculares 185–186 Long, John Hamilton 146 Los Ángeles, smog 42, 168 Los Angeles Times 42, 69 Macdonald-Ross, Michael 56 MacGregor, A. J. 112 Malcolm, Andrew H. 84 manipulación gráfica 59 manual de estilo de JASA 110, 150–151, 162 manuales, gráficos estadísticos 112 Manvel, Allen D. 81 mapa de Israel 178 mapa de las galaxias 26–27, 154, 164 mapa de polígonos 20 mapa de Yü Chi Thu 20–21 mapa del cólera 24 mapa del vino francés 25–26 mapa temático 16–27 mapas de condado 16–20, 153 mapas de datos 16–27 mapas de puntos 20, 139 mapas del cáncer 16–20 marcas, tabuladores 127–129, 149 marco por extensión 130, 136, 139, 149, 152 Marey, E. J. 31, 34–36, 40, 115–116, 121 Mason, Thomas J. 6 Masterton, William 85 Matisse, Henri 160 matriz de datos 165–167 maximización de la tinta informativa 96–105, 123–137, 175, 186, 187 maximizar la densidad de datos 166 McClenaghan, William 85 McCracken, Paul 48 McCullagh, Michael J. 161 McCutcheon, N. Bruce 100, 109 McGill, Robert 129 McKay, Frank W. 16 McLeod, Randall 143 McRae, Gregory J. 42, 168 media cara 97, 136 Meihoefer, H. J. 56 melanoma 169 menos es mas 175 menos es poco 175 mentira, Factor de 57 mentiras, defensa de las 76–77 Mies van der Rohe, Ludwig 175 Miller, Arthur H. 120

196 indice

Miller, Warren E. 147 Minard, Charles Joseph 24–25, 39, 40–41, 51, 121, 176–177 minidiagramas múltiples 42, 48, 168–170 Mitchell, H. L. 5o Mondrian, Piet 185 Monkhouse, F. J. 112, 163 monopolo magnético 39 “montaña al mar” 154 Monty, Richard A. 166, 182 Moore, Carol 152 Morse, Elaine 40 Moscú, campaña de Napoleón 40–41, 121, 176–177 múltiples ángulos de observación 154–155 múltiples profundidades de observación 154-155 Murphy, Edmond A. 169 Museo de Arte Moderno 91 Napoleón, marcha sobre Moscú 40–41, 51, 121, 176–177 narrativos, gráficos 40–43 National Science Foundation 60 Nature 110, 165, 175 Necker, Ilusión óptica de 109 Needham, Joseph 20 New England Journal of Medicine 110, 165 New York Times 30, 54, 57, 61, 66, 71, 76, 80–83, 86, 121, 164, 167, 179, 180 Newman, Barnett 177 Newman, L. Hugh 43 Newsweek 165 Newton, Isaac 181 Nihon Keizai 83 Nueva York, clima de 30, 121, 162 números de identificación 149–150 observación errática 14, 142 Op-art, efectos ópticos 107-108 pasos del caballo 34–35 patos 116–121 Pauling, Linus 85, 102 Pearson, Karl 145 Peebles, P. James E. 26 periodicidad de los elementos 102–105 perros 50 pesca de arenque 169 Petchenik, Barbara Bartz 146 Phillips, curva de 48

pinos blancos 50 Pittsburgh Civic Commission 55 Playfair, William 9, 32–34, 43–45, 52, 64–65, 73, 91–92, 126, 148, 188–189 polígonos, mapas de 20 pollo de dos toneladas 73 Potter, D. E. 145 Powell, R. W. 49, 150 Prakash, Om 170 Pravda 83, 165, 166 precios de la Bolsa 15 precios del petróleo 61-63 prensa, sofisticación gráfica 82–84 Primera Guerra Mundial, gráfico 141 principios de eliminación 96–100, 136 Proceedings of the National Academy of Sciences, U.S.A. 110 proporción de tinta informativa 93–96 Psychological Bulletin 165 puente sobre el Ródano 39 Pugin 117 puntos ópticos 114 realeza, genealogía 34–35 Reinhardt, Ad 122 Reiss, Albert J. 14 Rickett, Barney J. 134 Riedwyl, Hans 97 Riley, Bridget 108 Roberts, K. V. 145 Robinson, Arthur H. 20, 40 Robyn, Dorothy L. 20 Rogers, Anna C. 112 rompecabezas gráficos 153 Ross, H. Laurence 75 rotulación 184 rótulos en gráficos 180–182, 183, 187 rótulos informativos 149–152 rótulos multifuncionales 149–152 Ruskin, John 117 Sampson, Roy J. 85 Samuelson, Paul 85 sans serif 183 sas ⁄ graph 112 Satet, R. 69, 112 Sato, Isao 82, 85 Scarf, F. L. 29 Schilling, Mark F. 140 Schlee, Susan 172 Schmid, Calvin F. 112 Schmid, Stanton E. 112

Science 39, 83, 109, 110, 165, 173, 175 Science Indicators, 4 60 Scientific American , 73, 165 Sedgewick, Robert 171 Seinfeld, J. H. 168 Seldner, Michael 26 semi-gráficos 178–180 Senders, John W. 168, 182 series temporales de antes y después 39 series temporales 28–39 servicio de correos italiano 72 Shinohara, Miyohei 82, 85 Shiskin, Julius 38 Shrink Principle 167 Shryock, Henry S. 113 Siebers, B. H. 26 Siegel, Jacob S. 113 Silverstein, Louis 80 simetría bilateral 97 Slowinski, Emil 85 smog 42, 168 Snow, Dr. John 24 Social Indicators,  161 sofisticación gráfica 82–86 sombreado gris 154 sparklines 171–175 Spear, Mary Eleanor 81, 112, 123 Statistical Abstract of the United States 160, 165 Stockhausen, Karlheinz 184 Stokes, Donald E. 147 Strunk, William 81 Sunday Times (London) 63 supertabla 179 Swift, Jonathan 106 Sypher, Wylie 139 tabla de texto 178–180 tabla-gráfico 145, 158–159 tablas 56, 178–180 tablas financieras 172–173 Tanur, Judith 85 tapete, diagrama de 135, 136 Tell-A-Graf 112 Terpenning, Irma J. 38 The Economist 63, 83, 165 The Times (London) 83, 165, 166 Thissen, David 142 Thomas, Edward Llewellyn 168 Thomas, LaVerne 85 Thompson, Morris M. 166 Thrower, Norman J. W. 23

For Zabdiel Ramos Banda

indice 197

Thurber, James 52 Tilling, Laura 32, 45–46 Time 62, 71, 79, 83 tinta informativa redundante 96–105 tinta informativa 91–105 tinta no informativa 96, 107 tipografía 173, 178–183 Todd, Lewis Paul 85 Troy, Nancy J. 18 5 Tufte, Edward R. 24, 29, 53, 75, 95, 117, 184 Tukey, John W. 53, 114, 123, 125, 129, 136, 140, 168, 188 Tukey, Paul A. 114, 166 tungsteno, conductividad del 150 unidades de datos informativas 139–144 unidades de datos 139–144

Valéry, Paul 153 variación de diseño 60–63 variación de los datos 60–61 Vasarely, Victor 108 Vauthier, L. L. 154 velocidad en Connecticut 74–75 Venturi, Robert 117, 139, 175 vibración moiré 107–112 vino francés, mapa del 25–26 Wainer, Howard 79, 142, 153 Waldrop, M. Mitchell 39 Wall Street Journal 83, 165–166 Washington Post 62, 70, 83 Watkins, Ann E. 140 Watkins, William 140 White, E. B. 81

White, Jan 79–80 Wilk, Martin B. 53 Wilkinson, H. R. 112, 163 Wilson, James Q. 85 Wiskenmann, Arthur 169 Wurman, Richard Saul 90 Yajima, Yokichi 85 Youden, W. J. 143 Yü Chi Thu map 20–21 Yunis, Jorge J. 172 Zeeman, E. C. 50 Zingale, Nancy H. 85 Zusne, Leonard 97, 190

Las siguientes ilustraciones y fotografías han sido reproducidas con autorización previa. Todos los derechos están reservados a los propietarios de los derechos de autor. El permiso para reproducir estas ilustraciones y fotografías se debe obtener directamente de los titulares de derechos de autor que figuran a continuación:

Holt, Rinehart and Winston. Corrientes oceánicas, Kirk Bryan, Princeton University y la American Meteorological Society. Gráfico de barras, experimentos sobre el gusto, James T. Kuznicki, Proctor & Gamble Company. Dibujo de Roger Hayward de la tabla periódica de los elementos, Linus Pauling.

capítulo 1. Cuarteto de Anscombe © 1973 American Statistical Association. Mapa de las galaxias, P. James E. Peebles, Princeton University. Emisiones de radio de Júpiter, Donald A. Gurnett, © 1979 American Association for the Advancement of Science. Resumen del clima en Nueva York © 2004 The New York Times Company. Texto sobre el correo franqueado © 1975 The New York Times Company. Monopolo magnético © 1982 American Association for the Advancement of Science. Puente sobre el Ródano, Bibliothèque de l’École Nationale des Ponts et Chaussées. El smog en Los Ángeles, de Bob Allen © 1979 The Los Angeles Times, basado en datos de Gregory J. McCrae, California Institute of Technology. El escarabajo japonés © 1965 Aldus Books, Londres. La curva de Phillips, Organisation for Economic Cooperation and Development, París. Perros © 1976 Scientific American, Inc.

capítulo 5. El reemplazo de la raíz aórtica, gráfico © , Massachusetts Medical Society, todos los derechos reservados. Barras verticales, transferencia de glucosa, Eain M. Cornford, © 1981 American Association for the Advancement of Science. Diagrama de ventanas, Paul A. Tukey. Cultivos de California, Estado de California, Office of Planning and Research. Contenido de la prensa © 1979 American Political Science Association.

capítulo 2. Pagos a agencias de viajes © 1978 The New York Times Company. Diseño de cem © 1961 The New Yorker Magazine, Inc. Normas de ahorro de combustible © 1978 The New York Times Company. Precios del petróleo de la opep © 1978 The New York Times Company. Precios del petróleo © 1979 Time, Inc. Precios del petróleo ©1979 The Washington Post. Precio auténtico del petróleo, Business Week, © 1979 McGraw-Hill, Inc. Precio auténtico del petróleo © 1979 The Sunday Times, Londres. Precio auténtico del petróleo © 1979 The Economist. Crecimiento del gobierno © 1977 Yale University Press. Presupuesto del Estado de Nueva York © 1976 The New York Times Company. El doctor menguante, de Bob Allen y Pete Bentevoja, © 1979 The Los Angeles Times. El dólar menguante © 1978 The Washington Post. Foto de las torres de petróleo © 1981 The New York Times Company. capítulo 3. Ideas sobre economía © 1980 The New York Times Company. Ritmo de la vida urbana © 1976 The New York Times Company. capítulo 4. Electroencefalograma © 1971 Harper & Row. Tiempo de generación © 1965 Princeton University Press. Porcentajes de registro © 1967 American Political Science Association. Porcentajes de registro © 1970 Addison-Wesley Publishing Company. Porcentajes de registro © 1970

capítulo 6. Diagrama esquemático paralelo © 1977 Addison-Wesley Publishing Company. Variación del diagrama de cajas © 1978 American Statistical Association. Señales de pulsar © 1975 Academic Press. Distribución acumulativa empírica © 1976 John Wiley. capítulo 7. Diagrama de “hoja y tallo” © 1972 The Iowa State University Press. Histograma viviente, Brian Joiner. Magnetohidrodinámica © 1970 Academic Press. Mapa de 1783 © 1976 Princeton University Press. Elecciones de 1956 y 1960 © 1966 John Wiley. capítulo 8. Resumen del clima de Nueva York © 2004 The New York Times Company. Communes francesas © 1973 Mouton y Gauthier-Villars. Minidiagramas múltiples de Bertin © 1973 Mouton y Gauthier-Villars. Melanoma © 1972 Springer-Verlag. Distribuciones normales © 1964 Pergamon Press, Ltd. Cromosomas, Jorge J. Yunis, © 1982 American Association for the Advancement of Science. Diagramas de Mergesort, Robert Sedgewick, Algoritmos en C: Partes -, Figura 8.8, p. 353 © 2003, 2002 Pearson Education, Inc., ha sido reproducida con la autorización de Pearson Education Inc. capítulo 9. Cómo votaron al presidente los distintos grupos © 1980 The New York Times Company. Predicciones © 1979 The New York Times Company. Facsímil de un dibujo de Leonardo da Vinci © 1956 Princeton University Press. Partitura musical, Karlheinz Stockhausen, © 1964 Verlag M. DuMont Schauberg. Gráfico votos-escaños © 1973 American Political Science Association. Ilustración de póster basada en Burgoyne Diller, “Geometrical Composition in Black, Red, and White”, Yale University Art Gallery, Collection Société Anonyme.

Agradecimientos, Segunda edición En la preparación de esta nueva edición, le estoy agradecido a Michael Arsenault, Michael y Winifred Bixler, Nicholas Cox, Inge Druckrey, Howard Gralla, Graham Lakin, MaryBeth Uryga, Carolyn Williams, y a . El maravilloso personal de “Graphics Press” continúa con su muy especial atención: Kate Atkinson, Karen Bass, Cynthia Bill, Donna Karosi, Elaine Morse, Kathy Orlando, Peter Taylor, y Carolyn Williams. Enero del 2001 Cheshire, Connecticut

For Zabdiel Ramos Banda

Agradecimientos Quisiera expresar mi gratitud a todos aquellos que, con su ayuda y consejo, han colaborado en la elaboración de este libro. Al Center for Advanced Study in the Behavioral Sciences, a la John Simon Guggenheim Foundation, a la Woodrow Wilson School de la Universidad de Princeton y a la Universidad de Yale, por apoyarme en la investigación durante varios cursos. A la Bibliothèque Nationale y la Bibliothèque de l’École Nationale des Ponts et Chaussées en París y a la Historical Medical Library y la Beinecke Rare Book and Manuscript Library de la Universidad de Yale, por permitirme acceder a sus magníficas colecciones. Al departamento de arte del New York Times y a mis alumnos de Diseño Gráfico del Departamento de Estadística de Yale, por ayudarme a apreciar el lado práctico de la producción de gráficos estadísticos. A Peter B. Cooper, Earle E. Jacobs, Jr. y Trudy Putsche, por su ayuda para establecer Graphics Press. A Howard I. Gralla y Minoru Niijima, por el diseño y la obra artística. A Michel Balinski, Jean Dubout, André Jammes y Claudine Kleb, por su ayuda y hospitalidad en París cuando estudié los diseños de Minard. A James Beniger, Inge Druckrey, Timothy Gregoire, Joanna Hitchcock, Joseph LaPalombara, Kathryn Scholle, Stephen Stigler, Howard Wainer y Ellen Woodbury, por ejemplos y sugerencias para mejorar el manuscrito. A Frederick Mosteller y John W. Tukey, por revisar el manuscrito y por su inspiración y ánimo durante los años que ha durado este proyecto. A Elena Abós, Liliana Lerchundi, Robert Sprung y Adela Hruby, de Harvard Translations, por haber producido esta excelente traducción. Y a Howard Gralla, Graham Larkin, Elaine Morse y Carolyn Williams por convertir esta traducción en una jubilosa realidad. Diciembre de 2000 Cheshire, Connecticut

                                                                                                                                               ,                 ,                                 

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF