Как построить boxplot в питоне

Seaborn Box Plot – Учебник и примеры

В этом уроке мы рассмотрим, как построить BoxPlot в Seaborne и Python с подробными примерами построения и настройки.

Вступление

Боксовые графики используются для визуализации сводной статистики набора данных, отображая атрибуты распределения, такие как диапазон и распределение данных.

Импорт Данных

Мы начнем с импорта панд для загрузки и анализа набора данных. Мы, очевидно, захотим импортировать и Сиборна. Наконец, мы импортируем модуль Pyplot из Matplotlib, чтобы показать визуализации:

После того, как мы проверим согласованность нашего набора данных, мы хотим выбрать непрерывные объекты, которые мы хотим визуализировать. Мы сохраним их как собственные переменные для удобства:

Построение боксплота в Сиборне

Теперь, когда мы загрузили данные и выбрали объекты, которые хотим визуализировать, мы можем создать боксовые графики!

Однако, если есть конкретное распределение, которое мы хотим видеть сегментированным по типу, мы также можем предоставить категориальную переменную X и непрерывную переменную Y.

На этот раз мы можем увидеть прямоугольную диаграмму, сгенерированную для каждого дня недели, как указано в наборе данных.

Настройка сюжета коробки Сиборна

Изменение Цвета графика Коробки

Seaborn автоматически назначит различные цвета различным переменным, чтобы мы могли легко визуально различать их. Однако мы также можем предоставить список цветов, которые будут использоваться, если мы хотим их указать.

После выбора списка цветов с шестнадцатеричными значениями (или любого допустимого цвета Matplotlib) мы можем передать их в аргумент palette :

Настройка Меток Осей

Мы можем легко настроить метки по осям X и Y с помощью Seaborn, например, изменить размер шрифта, изменить метки или повернуть их, чтобы сделать тики более удобными для чтения:

Заказ Коробочных Участков

Если мы хотим просмотреть поля в определенном порядке, мы можем сделать это, используя аргумент order и указав имена столбцов в том порядке, в котором вы хотите их видеть:

Создание Подзаголовков

Boxplot С Точками Данных

Мы могли бы даже наложить болото на прямоугольную диаграмму, чтобы увидеть распределение и образцы точек, составляющих это распределение, с немного большей детализацией.

Вывод

В этом уроке мы рассмотрели несколько способов построения бокс-графика с использованием Seaborn и Python. Мы также рассмотрели, как настроить цвета, метки, порядок, а также наложить сюжеты роя и подзаголовки нескольких коробочных сюжетов.

Источник

pandas.DataFrame.boxplotВ¶

Make a box plot from DataFrame columns.

For further details see Wikipedia’s entry for boxplot.

Parameters column str or list of str, optional

by str or array-like, optional

ax object of class matplotlib.axes.Axes, optional

The matplotlib axes to be used by boxplot.

fontsize float or str

Tick label font size in points or as a string (e.g., large ).

rot int or float, default 0

The rotation angle of labels (in degrees) with respect to the screen coordinate system.

grid bool, default True

Setting this to True will show the grid.

figsize A tuple (width, height) in inches

The size of the figure to create in matplotlib.

layout tuple (rows, columns), optional

For example, (3, 5) will display the subplots using 3 columns and 5 rows, starting from the top-left.

return_type <‘axes’, ‘dict’, ‘both’>or None, default ‘axes’

‘axes’ returns the matplotlib axes the boxplot is drawn on.

‘dict’ returns a dictionary whose values are the matplotlib Lines of the boxplot.

‘both’ returns a namedtuple with the axes and dict.

backend str, default None

New in version 1.0.0.

Matplotlib equivalent plot.

The return type depends on the return_type parameter:

‘axes’ : object of class matplotlib.axes.Axes

‘dict’ : dict of matplotlib.lines.Line2D objects

‘both’ : a namedtuple with structure (ax, lines)

array (for return_type = None )

Use return_type=’dict’ when you want to tweak the appearance of the lines after plotting. In this case a dict containing the Lines making up the boxes, caps, fliers, medians, and whiskers is returned.

Boxplots can be created for every column in the dataframe by df.boxplot() or indicating the columns to be used:

Как построить boxplot в питоне. Смотреть фото Как построить boxplot в питоне. Смотреть картинку Как построить boxplot в питоне. Картинка про Как построить boxplot в питоне. Фото Как построить boxplot в питоне

Как построить boxplot в питоне. Смотреть фото Как построить boxplot в питоне. Смотреть картинку Как построить boxplot в питоне. Картинка про Как построить boxplot в питоне. Фото Как построить boxplot в питоне

A list of strings (i.e. [‘X’, ‘Y’] ) can be passed to boxplot in order to group the data by combination of the variables in the x-axis:

Как построить boxplot в питоне. Смотреть фото Как построить boxplot в питоне. Смотреть картинку Как построить boxplot в питоне. Картинка про Как построить boxplot в питоне. Фото Как построить boxplot в питоне

The layout of boxplot can be adjusted giving a tuple to layout :

Как построить boxplot в питоне. Смотреть фото Как построить boxplot в питоне. Смотреть картинку Как построить boxplot в питоне. Картинка про Как построить boxplot в питоне. Фото Как построить boxplot в питоне

Additional formatting can be done to the boxplot, like suppressing the grid ( grid=False ), rotating the labels in the x-axis (i.e. rot=45 ) or changing the fontsize (i.e. fontsize=15 ):

Как построить boxplot в питоне. Смотреть фото Как построить boxplot в питоне. Смотреть картинку Как построить boxplot в питоне. Картинка про Как построить boxplot в питоне. Фото Как построить boxplot в питоне

Источник

Matplotlib BoxPlot – Учебник и примеры

В этом уроке мы рассмотрим, как построить боксовые графики в Matplotlib с помощью Python. Мы подробно рассмотрим основные сюжеты коробок и настройку с примерами.

Matplotlib BoxPlot – Учебник и примеры

Вступление

В Python существует множество библиотек визуализации данных, но Matplotlib-самая популярная библиотека из всех. Популярность Matplotlib объясняется его надежностью и полезностью – он способен создавать как простые, так и сложные графики с небольшим количеством кода. Вы также можете настроить графики различными способами.

Боксовые графики используются для визуализации сводной статистики набора данных, отображая атрибуты распределения, такие как диапазон и распределение данных.

Импорт Данных

Мы начнем с импорта всех библиотек, которые нам нужны. Мы импортируем Pandas для чтения и анализа набора данных, и нам, конечно же, нужно будет также импортировать Matplotlib, или, точнее, модуль PyPlot:

Давайте проверим, готов ли наш набор данных к использованию. Мы распечатаем заголовок набора данных, чтобы убедиться, что данные были загружены правильно, а также проверим, нет ли отсутствующих записей данных:

Постройте коробочный график в Matplotlib

Как обычно, мы можем вызвать функции построения графика на экземпляре Plot ( plot ), экземпляре Figure или экземпляре Axes :

В любом случае это приводит к:

После создания графика мы можем увидеть некоторые сводные статистические данные для наших данных. На прямоугольном графике показана медиана набора данных (вертикальная линия посередине), а также межквартильные диапазоны (концы прямоугольников) и минимальные и максимальные значения выбранного объекта набора данных (дальний конец “усов”).

Теперь у нас есть гораздо больше работы, так как мы решили построить несколько столбцов.

Настройка Сюжета

Как вы можете видеть, хотя графики были успешно сгенерированы, без меток тиков на осях X и Y трудно интерпретировать график.

Атрибут notch=True создает формат notch для boxplot, patch_artist=True заполняет boxplot цветами:

Мы можем использовать аргумент mean line для отображения среднего значения на коробке, хотя этого следует избегать, если мы также показываем зарубки, так как они могут конфликтовать.

Вывод

Если вы заинтересованы в визуализации данных и не знаете, с чего начать, обязательно ознакомьтесь с нашей книгой о визуализации данных в Python .

Источник

Matplotlib Boxplot С настройкой в Python

Основные примеры Matplotlib boxplot в Python для нескольких наборов данных, а также настраиваемые boxplots с использованием различных атрибутов.

Matplotlib Boxplot С настройкой в Python

Здравствуйте программисты, в сегодняшней статье мы обсудим Matplotlib Boxplot в Python.BoxPlot-это сюжет Усов в более простых терминах. Прямоугольники создаются для суммирования значений данных, имеющих такие свойства, как минимум, первый квартиль, медиана, третий квартиль и максимум. В графе box создается коробка от первого квартиля до третьего квартиля.

Здесь также есть вертикальная линия, которая проходит через коробку на медиане. Здесь ось x обозначает данные, а ось y показывает частотное распределение. Модуль Pyplot библиотеки Matplotlib предоставляет функции, подобные MATLAB. Следовательно, функция matplotlib.pyplot.boxplot() используется для создания коробочных графиков. Прежде чем мы приведем примеры Matplotlib Boxplot, позвольте мне кратко ознакомить вас с синтаксисом и параметрами этого же приложения.

Синтаксис Matplotlib Boxplot в Python

Параметры: Matplotlib Boxplot

Тип возврата: Matplotlib Boxplot

Функция Matplotlib boxplot возвращает словарь, сопоставляющий каждый компонент boxplot со списком созданных экземпляров Line2D. Этот словарь имеет следующие ключи (предполагая вертикальные боковые диаграммы):

Пример Matplotlib Boxplot в Python

ОБЪЯСНЕНИЕ:

Во-первых, значения данных, заданные методу ax.boxplot (), могут быть массивом Numpy, списком Python или кортежем массивов. В приведенном выше примере мы создаем прямоугольную диаграмму с помощью numpy.random.normal() для создания некоторых случайных данных. Кроме того, в качестве аргументов он принимает среднее значение, стандартное отклонение и желаемое число значений.

Боксплот с несколькими наборами данных

ОБЪЯСНЕНИЕ:

Во-первых, в приведенном выше примере несколько наборов данных строят несколько коробочных графиков под одними и теми же осями. Четыре набора данных представляют собой массивы Numpy, использующие функцию numpy.random.normal (). Эти четыре набора данных затем передаются в качестве значений данных в data href=”https://en.wikipedia.org/wiki/Array_data_structure”>массив. Более того, этот массив данных в качестве аргумента функции matplotlib boxplot() используется, создается несколько boxplots. href=”https://en.wikipedia.org/wiki/Array_data_structure”>массив. Более того, этот массив данных в качестве аргумента функции matplotlib boxplot() используется, создается несколько boxplots.

Индивидуальный Matplotlib Boxplot

ОБЪЯСНЕНИЕ:

Во-первых, matplotlib.pyplot.boxplot() предоставляет множество возможностей настройки коробочного графика. Создает формат вырезки для коробчатого графика. Мы можем установить разные цвета для разных коробок. Он заполняет бокс-план цветами. Кроме того, атрибут создает горизонтальную прямоугольную диаграмму. Метки принимают те же размеры, что и количество наборов данных.

Boxplot С Легендой

Легенда очень полезна при описании элементов сюжетов. Используя matplotlib.pyplot.legend (), вы можете добавить в свой код пользовательские легенды, которые могут продемонстрировать детали графика. Ниже приведен пример этого –

Надо Читать

Вывод

В этой статье мы узнали о различных способах использования Matplotlib Boxplot в Python. Мы можем реализовать несколько бокс-графиков под одними и теми же осями, определив столько наборов данных, сколько требуется. Кроме того, Boxplot Matplotlib предоставляет бесконечные способы настройки boxplots. Также обсуждались различные атрибуты настройки. Обратитесь к этой статье в случае каких-либо запросов относительно функции Matplotlib boxplot ().

Однако, если у вас есть какие-либо сомнения или вопросы, дайте мне знать в разделе комментариев ниже. Я постараюсь помочь вам как можно скорее.

Источник

matplotlib.pyplot.boxplot¶

Draw a box and whisker plot.

The box extends from the first quartile (Q1) to the third quartile (Q3) of the data, with a line at the median. The whiskers extend from the box by 1.5x the inter-quartile range (IQR). Flier points are those past the end of the whiskers. See https://en.wikipedia.org/wiki/Box_plot for reference.

The input data. If a 2D array, a boxplot is drawn for each column in x. If a sequence of 1D arrays, a boxplot is drawn for each array in x.

notch bool, default: False

Whether to draw a notched boxplot ( True ), or a rectangular boxplot ( False ). The notches represent the confidence interval (CI) around the median. The documentation for bootstrap describes how the locations of the notches are computed by default, but their locations may also be overridden by setting the conf_intervals parameter.

In cases where the values of the CI are less than the lower quartile or greater than the upper quartile, the notches will extend beyond the box, giving it a distinctive «flipped» appearance. This is expected behavior and consistent with other statistical visualization packages.

vert bool, default: True

whis float or (float, float), default: 1.5

The position of the whiskers.

If a pair of floats, they indicate the percentiles at which to draw the whiskers (e.g., (5, 95)). In particular, setting this to (0, 100) results in whiskers covering the whole range of the data.

Beyond the whiskers, data are considered outliers and are plotted as individual points.

bootstrap int, optional

Specifies whether to bootstrap the confidence intervals around the median for notched boxplots. If bootstrap is None, no bootstrapping is performed, and notches are calculated using a Gaussian-based asymptotic approximation (see McGill, R., Tukey, J.W., and Larsen, W.A., 1978, and Kendall and Stuart, 1967). Otherwise, bootstrap specifies the number of times to bootstrap the median to determine its 95% confidence intervals. Values between 1000 and 10000 are recommended.

usermedians 1D array-like, optional

conf_intervals array-like, optional

positions array-like, optional

The positions of the boxes. The ticks and limits are automatically set to match the positions. Defaults to range(1, N+1) where N is the number of boxes to be drawn.

widths float or array-like

patch_artist bool, default: False

If False produces boxes with the Line2D artist. Otherwise, boxes are drawn with Patch artists.

labels sequence, optional

Labels for each dataset (one per dataset).

manage_ticks bool, default: True

If True, the tick locations and labels will be adjusted to match the boxplot positions.

autorange bool, default: False

When True and the data are distributed such that the 25th and 75th percentiles are equal, whis is set to (0, 100) such that the whisker ends are at the minimum and maximum of the data.

meanline bool, default: False

If True (and showmeans is True ), will try to render the mean as a line spanning the full width of the box according to meanprops (see below). Not recommended if shownotches is also True. Otherwise, means will be shown as points.

zorder float, default: Line2D.zorder = 2

The zorder of the boxplot.

A dictionary mapping each component of the boxplot to a list of the Line2D instances created. That dictionary has the following keys (assuming vertical boxplots):

boxes : the main body of the boxplot showing the quartiles and the median’s confidence intervals if enabled.

medians : horizontal lines at the median of each box.

whiskers : the vertical lines extending to the most extreme, non-outlier data points.

caps : the horizontal lines at the ends of the whiskers.

fliers : points representing data that extend beyond the whiskers (fliers).

means : points or lines representing the means.

Other Parameters showcaps bool, default: True

Show the caps on the ends of whiskers.

showbox bool, default: True

Show the central box.

showfliers bool, default: True

Show the outliers beyond the caps.

showmeans bool, default: False

Show the arithmetic means.

capprops dict, default: None

The style of the caps.

boxprops dict, default: None

The style of the box.

whiskerprops dict, default: None

The style of the whiskers.

flierprops dict, default: None

The style of the fliers.

medianprops dict, default: None

The style of the median.

meanprops dict, default: None

The style of the mean.

data indexable object, optional

Draw an estimate of the probability density function.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *