Подборки

Виды диаграмм: 5 популярных способов визуализации данных

Статья написана совместно с экспертом — Анастасией Кузнецовой, аналитиком и преподавателем, автором телеграм-канала «настенька и графики» и онлайн-курса «Визуализация данных и основы работы в Tableau».

Разбираться в данных легче, когда изучаешь картинку, а не всматриваешься в длинный текст или большую эксельку. Если у вас маленькая пошаговая инструкция или пара статистических фактов, достаточно ёмко сформулировать главное и добавить иллюстрацию. Но если нужно наглядно и красиво донести большой объем информации, — плюс поискать интересные инсайты и паттерны, — потребуется визуализация.

В отличие от интеллект-карт, списков или презентаций, которые допускают свободу творчества, у диаграмм чёткие принципы построения. В них всегда есть система координат, шкала значений и отметки по этой шкале, которые как раз и несут в себе информацию.

Рассмотрим самые популярные базовые виды диаграмм, которые могут пригодиться для отчетов, статей или рассылок.

Что нужно показать Что для этого подходит
Сравнение нескольких категорий Барчарт (bar chart)
Распределение одной переменной Гистограмма (histogram)
Доли от целого Пайчарт (круговая диаграмма)
Развитие, динамику во времени Линейная диаграмма (line chart, график)
Корреляцию между двумя переменными Скаттерплот (scatter plot, диаграмма рассеяния)

Барчарт (bar chart)

С такой диаграммой вы наверняка уже сталкивались — она состоит из нескольких вертикальных или горизонтальных полосок разной длины. Вертикальные диаграммы ещё называют столбчатыми, а горизонтальные — линейчатыми.

Линейчатый барчарт (CFR), который показывает примерную стоимость проведения Олимпиады в разных городах мира

Линейчатый барчарт (CFR), который показывает примерную стоимость проведения Олимпиады в разных городах мира

Столбчатый барчарт (Справка Google Docs) визуализирует результаты опросов, оценку пользователей

Столбчатый барчарт (Справка Google Docs) визуализирует результаты опросов, оценку пользователей

Для чего нужно. Барчарт позволяет сравнивать несколько категорий по какой-то числовой переменной. Каждый столбик — это категория, а его длина отвечает на вопрос «Сколько?» — чем длиннее, тем больше значение.

Так можно визуализировать, в каком вузе выпускники быстрее трудоустраиваются, какое животное выше всех прыгает или какой источник приносит больше трафика на сайт.

Сортировка категорий от большего к меньшему облегчает восприятие данных. Получается рейтинг — сразу видно, где значения максимальные и минимальные. Если в категории есть какая-то внутренняя иерархия (например, дни недели), то лучше сортировать в рамках неё, а не по количеству значений.

Вообще в барчартах можно показывать как положительные, так и отрицательные значения.

Барчарт с позитивными и негативными значениями (ТАСС)

Барчарт с позитивными и негативными значениями (ТАСС)

Особенности. Столбчатые и линейчатые барчарты взаимозаменяемы: они выполняют одинаковую функцию. Единственный нюанс: если длинные названия категорий, лучше сделать горизонтальную диаграмму. Так для текста будет достаточно места, не придется его сокращать или переворачивать. Плюс читать так тоже сильно проще.

Линейчатый барчарт с длинными названиями категорий (Infogram)

Линейчатый барчарт с длинными названиями категорий (Infogram)

Важный момент: ось в барчарте всегда начинается с нуля. Читатель может ошибочно сравнить категории и сделать неправильные выводы, если обрезать столбцы — начать ось с большего значения.

Гистограмма (histogram)

Эта диаграмма внешне очень похожа на барчарт. Но она не сравнивает разные категории, а показывает распределение переменной. Каждый столбик — частотность в определенном интервале.

Для чего нужно. Визуализировать, как часто какие значения встречаются в наборе данных. Например, чтобы показать, какой размер обуви чаще покупают, по какой стоимости в основном продают дома, сколько времени чаще всего проводят на сайте.

Пример гистограммы (FlowingData) — она показывает, в каком возрасте женщины чаще всего впервые выходят замуж

Пример гистограммы (FlowingData) — она показывает, в каком возрасте женщины чаще всего впервые выходят замуж

Ещё примеры гистограмм (FlowingData). Они показывают средний доход в разных штатах

Ещё примеры гистограмм (FlowingData). Они показывают средний доход в разных штатах

Особенности. Важно не путать гистограмму с барчартом. Дополнительные отличительные признаки:

  • гистограмма всегда вертикальная;
  • значения по оси X у гистограммы — последовательные;
  • между столбцами обычно нет промежутка или он совсем небольшой — это показывает непрерывность числового ряда;
  • чаще всего гистограмма работает с одной переменной, тогда как барчарт — с двумя: числовой и категориальной.
Наглядное сравнение барчарта и гистограммы
Наглядное сравнение барчарта и гистограммы

Пайчарт (круговая диаграмма)

Эта визуализация в виде круга, разделенного на несколько частей (секторов). Напоминает то, как мы режем круглый пирог — отсюда и название.

Пайчарт (Influencer Marketing Hub). Показывает результаты опроса: кто измеряет рентабельность инвестиций (ROI), а кто нет

Пайчарт (Influencer Marketing Hub). Показывает результаты опроса: кто измеряет рентабельность инвестиций (ROI), а кто нет

Даже так — пайчарт в виде настоящей еды (Data-comics), который показывает, как pie chart переводится на разные языки

Даже так — пайчарт в виде настоящей еды (Data-comics), который показывает, как pie chart переводится на разные языки

Для чего нужно. Чтобы показать доли от целого — пропорцию или процентное соотношение. С помощью пайчарта можно визуализировать соотношение мужчин и женщин, распределение по опыту (junior, middle, senior), результаты опроса по любимым видам кофе или структуру выручки в компании.

Пример пайчарта-бублика (Think with Google), который визуализирует результаты исследования — немного другая форма, но суть одна

Пример пайчарта-бублика (Think with Google), который визуализирует результаты исследования — немного другая форма, но суть одна

Особенности. С круговыми диаграммами стоит быть осторожными: они красивые с точки зрения дизайна, но не всегда удобные для восприятия.

Из-за сложной формы кусочков «пирога» трудно сравнивать значения на глаз: разница между 70% и 30% будет очевидна, а между 53% и 47% — не совсем. Также в круг нельзя уместить слишком много значений — иначе доли получатся слишком тонкими, их будет совсем трудно различать, плюс будет мало места для подписей.

Ещё важный момент: сумма значений в пайчарте (донате) всегда должна быть 100%, так как диаграмма показывает доли от целого.

Пайчарт можно взять, если хотите визуализировать несколько долей со значительной разницей. В остальных случаях барчарт будет более репрезентативным.

Линейная диаграмма (line chart, график)

Линейная диаграмма строится по временной оси Х и каким-то значениям по оси Y.

Пример графика (ТАСС) — показывает изменение стоимости строительства «Зенит-Арены»

Пример графика (ТАСС) — показывает изменение стоимости строительства «Зенит-Арены»

Для чего нужно. Это идеальный вариант, чтобы показать изменение какого-то показателя во времени. Можно визуализировать динамику трафика, продаж, цен и многих других переменных. Линия хорошо подсвечивает резкие изменения, отклонения.

График роста состояния миллиардеров (Т—Ж)

График роста состояния миллиардеров (Т—Ж)

Динамика по вернувшимся пользователям в отчете Google Analytics
Динамика по вернувшимся пользователям в отчете Google Analytics

Особенности. Время всегда на горизонтальной оси и идет слева направо (от старого к новому).

Можно добавить несколько переменных, главное, не увлекаться количеством графиков и цветов. И аккуратнее с пропорциями: линейчатая диаграмма должна хорошо показывать какие-то резкие изменения.

Интересный пример (Datawrapper). Он показывает, сколько наборов Lego выпускали каждый год, а также как менялось среднее количество деталей в комплекте

Интересный пример (Datawrapper). Он показывает, сколько наборов Lego выпускали каждый год, а также как менялось среднее количество деталей в комплекте

Скаттерплот (scatter plot, диаграмма рассеяния)

График рассеяния (точечная диаграмма) показывает распределение элементов множества в плоскости между двумя переменными. Это позволяет увидеть возможные связи между ними.

Пример скаттерплота (Rockefeller Foundation). Он показывает связь между доходом и потреблением энергии на душу населения

Пример скаттерплота (Rockefeller Foundation). Он показывает связь между доходом и потреблением энергии на душу населения

Для чего нужно. Чтобы найти и визуализировать зависимость одной переменной от другой. И оценить силу корреляции через плотность точек на диаграмме. Так, можно определить, как связаны количество съеденных калорий и вес, расходы на рекламу и прямые заходы на сайт, просмотры и позиции в поиске.

Пример скаттерплота (Яндекс), который кодирует больше данных за счет цвета и размера точек. Главное, не увлекаться, иначе читателю будет сложно воспринимать информацию

Пример скаттерплота (Яндекс), который кодирует больше данных за счет цвета и размера точек. Главное, не увлекаться, иначе читателю будет сложно воспринимать информацию

Особенности. Независимую переменную стоит располагать на горизонтальной оси, а зависимую — на вертикальной.

Важно: correlation != causation. Наличие корреляции необязательно значит, что между переменными действительно есть зависимость. И что одна точно влияет на другую.

Диаграмма рассеяния (Swissinfo): чем выше в горах находится курорт, тем дороже стоит его абонемент

Диаграмма рассеяния (Swissinfo): чем выше в горах находится курорт, тем дороже стоит его абонемент