Виды диаграмм в аналитике для визуализации данных

Существует очень много видов диаграмм, но у каждого из них есть своя задача. Поэтому важно понимать, как правильно выбрать диаграмму, чтобы отчет был не только красивым, но и понятным для анализа.
30 мая 2022
Время чтения: 10 мин.

Виды анализа данных

Чтобы понять, какая диаграмма лучше подходит для построения графика, необходимо определиться с тем, что именно нужно показать, и какой вид анализа данных будет использован.

Всего их 4 вида:

  • рейтинг;
  • динамика;
  • структура;
  • взаимосвязи.

Понимание этих аспектов напрямую влияет на то, какой вид диаграммы вы выберете для проведения анализа. Для каждого вида анализа подойдет свой тип диаграмм. Остальные не будут правильно и максимально полно передавать информацию.

Разберем подробнее каждый вид анализа.

Рейтинг - вид анализа, который используется при сравнении между собой нескольких показателей. Например, нам нужно понять, у кого из менеджеров за месяц было больше закрытых сделок, чтобы правильно рассчитать премию, или определить, какой филиал или товар приносит больше прибыли. Рейтинг используется, когда вам нужно провести любое количественное сравнение нескольких показателей и расположить их по шкале от большего к меньшему.

Динамика - вид анализа, который используется для отслеживания изменения одного показателя. Например, увидеть, как меняется объем продаж товара в разные сезоны года.

Структура - вид анализа, который используется для разделения одного целого на разные доли, чтобы показать объем каждой из них. Например, при сегментации товаров на группы или для оценки структуры портфеля клиента. Анализируются именно доли, а количественные показатели отходят на второй план.

Взаимосвязи - редко используется, но нужен, чтобы установить отношение между двумя переменными. Например, сопоставить, как реагируют продажи на изменение курса доллара или определить взаимосвязь между выручкой и количеством товара.

Виды диаграмм, используемых для анализа

Глубокое понимание того, какие существуют виды диаграмм в аналитике, позволяет выбрать наиболее подходящий инструмент для визуализации. Для каждого из вида анализа данных подойдут определенные виды диаграмм. Базовыми и наиболее частыми в использовании являются:

  1. Линейчатая лиаграмма - диаграмма, столбцы которой располагаются горизонтально. Особенно эффективна линейчатая диаграмма для отображения ранжированных данных или сравнения показателей.
  2. Гистограмма - то же самое, что и линейчатая диаграмма, но с вертикальными столбцами.
  3. График - линия, на которой точками обозначены анализируемые данные.
  4. Круговая диаграмма - круг, который поделен на сектора. Может быть в форме бублика (кольцевая диаграмма).
  5. Пузырьковая диаграмма - разновидность точечной диаграммы. Измерение данных происходит по размеру пузырьков и их положению на графике относительно осей координат.

Как правильно выбрать диаграмму

Правила выбора диаграмм для удобства представлены на схеме. Слева располагаются виды анализа данных, а напротив них все диаграммы, которые подходят для построения визуализации.

соответствие диаграмм и видов анализа

На схеме видно, что кольцевая диаграмма подойдет только для отображения структуры, а пузырьковая только для анализа взаимосвязей. Подробно разберем каждый из видов диаграмм.

Линейчатая и гистограмма

Эти виды диаграмм удобно использовать для построения рейтинга. Какой из них лучше выбрать, можно определить по количеству показателей. Например, гистограмма будет неудобной для анализа большого числа элементов.

гистограмма

На примере хорошо отображено, что длинные подписи и большое количество данных делают такую визуализацию неудобной. Для таких случаев лучше выбрать линейчатую диаграмму.


Ориентироваться лучше по тому, сколько места вы готовы выделить на дашборде под диаграмму. Если у вас мало точек, то гистограмма будет не убедительной, но займет много места на экране.

продажи по курсам

Но если важно, чтобы данные были в правильном порядке по оси Х, лучше отобразить данные вертикально и выбрать гистограмму..

сегментация

График или гистограмма

Если нужно показать, как изменяется одна переменная с течением времени, можно использовать гистограмму или график. Но что из них выбрать?

график

Есть определенные правила, когда подойдет тот или иной вид графика. Так при небольшом количестве значений (как на картинке) график не будет информативным. Линия едва заметна и нужно еще время для сопоставления точек с осями. В таком случае лучше выбрать гистограмму.

График стоит выбрать, если точек больше 10, или на одном графике для удобного сравнения и экономии места строятся линии сразу по нескольким показателям.

несколько графиков

Круговая или кольцевая диаграмма

При выборе между кольцевой и круговой диаграммой можно руководствоваться своим вкусом. Они выполняют одну и ту же задачу и одинаково эффективно отражают информацию при правильном использовании.


Но есть несколько правил при их использовании:

  • отражают только структуру целого, то есть из каких частей оно состоит и сколько места в целом занимает каждая часть;
  • удобно использовать только для небольшого объема данных;
  • правильно сортировать данные от самого крупного сектора к самому маленькому;
  • отсчет должен начинаться с крайней верхней точки, там, где располагается цифра 12 на часах;
  • легенду лучше размещать в теле диаграммы, а не рядом с ней. Так будет удобнее с ней работать и не придется дополнительно искать описание к графику, чтобы посмотреть ее название.

круговая диаграмма

Точечная и пузырьковая диаграмма

Эти диаграммы очень редко используются, но и они могут быть информативны. особенно если вам нужно показать то, как связаны между собой несколько показателей. Не используйте эти виды диаграмм, если у вас только один показатель.

пузырьковая.png

Удачный пример использования пузырьковой диаграммы:

пример пузырьковой.png

На графике можно проследить, в каких городах больший оборот приносит большую прибыль и выделить наиболее рентабельные города. По оси Х откладывается один показатель (оборот), а по оси Y - другой, для которого изучается взаимосвязь.

На данном примере самыми привлекательными городами являются те, которые отмечены зеленым цветом: Сургут, Ханты-Мансийск, Мегион. Наименее привлекательные города отмечены красным цветом: Североуральск и Алапаевск. В них большой оборот, но прибыль от этого не растет.

Выбирать диаграммы необходимо не из-за красивого оформления, а в первую очередь ради упрощения восприятия данных. Поэтому нужно логически подходить к выбору диаграмм.

Какие основные виды диаграмм используются для визуализации данных?
К базовым видам относятся столбчатые (барчарты), линейные диаграммы, круговые (пайчарты), гистограммы, диаграммы рассеяния (scatter plot) и диаграммы с областями. Эти типы покрывают основные задачи: сравнение категорий, анализ динамики во времени, показ долей от целого, распределения и взаимосвязей между переменными.
Для сравнения категорий лучше всего подходят столбчатые и линейчатые диаграммы (барчарты), где каждая категория представлена отдельным столбцом или полосой. Их используют, когда важно показать, «кто больше/меньше», например, сравнить продажи по продуктам, источники трафика или результаты опросов по вариантам ответа.
Круговую диаграмму имеет смысл применять, когда нужно показать доли от целого для одного ряда данных и категорий немного (обычно до 5–7). Если категорий много или различия между долями небольшие, данные лучше отобразить столбчатой диаграммой или диаграммой с областями — так соотношения будут заметнее и читаемее.
Линейная диаграмма показывает изменение показателя во времени или по другому непрерывному параметру, соединяя точки линией — это удобно для анализа трендов и динамики. Гистограмма отображает распределение значений одной переменной по интервалам (корзинам) и используется для анализа формы распределения, выявления пиков и выбросов.
Для отображения связи между двумя числовыми показателями используют диаграмму рассеяния (scatter plot), где каждая точка отражает пару значений по осям X и Y. Если нужно добавить третий или четвертый параметр (например, размер и категорию), применяют пузырьковую диаграмму, где размер и цвет точки кодируют дополнительные переменные.
Инструмент
Компания ДЕНВИК занимается внедрением систем бизнес-аналитики. Подключим базы данных к системе, построим все необходимые отчеты и научим с ними работать. Оставляйте заявку для консультации, если хотите выйти на новый уровень при анализе данных.
Оставить заявку

Возникли вопросы?

Напишите нам — мы подскажем и поможем подобрать лучшее решение под вашу задачу.
Оставьте заявку

Другие статьи

От быстрой аналитики и первых дашбордов к масштабному контуру данных
От быстрой аналитики и первых дашбордов к масштабному контуру данных
Тернистый путь от View к Экстрактору 1С.
История начинается одинаково почти у всех
В компании появляется запрос на аналитику,...
Подробнее
Очистка данных: инструменты и особенности процесса
Очистка данных: инструменты и особенности процесса
Очистка данных — обязательный этап подготовки информации перед анализом и отчётностью.  В статье разбираем, какие проблем...
Подробнее
Импортозамещение SAP: переезд на 1С. Архитектура решения
Импортозамещение SAP: переезд на 1С. Архитектура решения
Как выстроить промышленный переезд с SAP на 1С: сценарии миграции, выгрузка данных через SAP ODP, подготовка и загрузка в 1С без рисков д...
Подробнее
Эволюция работы с данными в 1С: от Экстрактора 1C к единой экосистеме Denvic Visual Tools
Эволюция работы с данными в 1С: от Экстрактора 1C к единой экосистеме Denvic Visual Tools
Как мы прошли путь от создания инструмента для выгрузки данных из 1С до построения целостной экосистемы? В этой статье — эволюция Denvic ...
Подробнее
Все статьи