Как построить boxplot в питоне
Seaborn Box Plot – Учебник и примеры
В этом уроке мы рассмотрим, как построить BoxPlot в Seaborne и Python с подробными примерами построения и настройки.
Вступление
Боксовые графики используются для визуализации сводной статистики набора данных, отображая атрибуты распределения, такие как диапазон и распределение данных.
Импорт Данных
Мы начнем с импорта панд для загрузки и анализа набора данных. Мы, очевидно, захотим импортировать и Сиборна. Наконец, мы импортируем модуль Pyplot из Matplotlib, чтобы показать визуализации:
После того, как мы проверим согласованность нашего набора данных, мы хотим выбрать непрерывные объекты, которые мы хотим визуализировать. Мы сохраним их как собственные переменные для удобства:
Построение боксплота в Сиборне
Теперь, когда мы загрузили данные и выбрали объекты, которые хотим визуализировать, мы можем создать боксовые графики!
Однако, если есть конкретное распределение, которое мы хотим видеть сегментированным по типу, мы также можем предоставить категориальную переменную X и непрерывную переменную Y.
На этот раз мы можем увидеть прямоугольную диаграмму, сгенерированную для каждого дня недели, как указано в наборе данных.
Настройка сюжета коробки Сиборна
Изменение Цвета графика Коробки
Seaborn автоматически назначит различные цвета различным переменным, чтобы мы могли легко визуально различать их. Однако мы также можем предоставить список цветов, которые будут использоваться, если мы хотим их указать.
После выбора списка цветов с шестнадцатеричными значениями (или любого допустимого цвета Matplotlib) мы можем передать их в аргумент palette :
Настройка Меток Осей
Мы можем легко настроить метки по осям X и Y с помощью Seaborn, например, изменить размер шрифта, изменить метки или повернуть их, чтобы сделать тики более удобными для чтения:
Заказ Коробочных Участков
Если мы хотим просмотреть поля в определенном порядке, мы можем сделать это, используя аргумент order и указав имена столбцов в том порядке, в котором вы хотите их видеть:
Создание Подзаголовков
Boxplot С Точками Данных
Мы могли бы даже наложить болото на прямоугольную диаграмму, чтобы увидеть распределение и образцы точек, составляющих это распределение, с немного большей детализацией.
Вывод
В этом уроке мы рассмотрели несколько способов построения бокс-графика с использованием Seaborn и Python. Мы также рассмотрели, как настроить цвета, метки, порядок, а также наложить сюжеты роя и подзаголовки нескольких коробочных сюжетов.
pandas.DataFrame.boxplotВ¶
Make a box plot from DataFrame columns.
For further details see Wikipedia’s entry for boxplot.
Parameters column str or list of str, optional
by str or array-like, optional
ax object of class matplotlib.axes.Axes, optional
The matplotlib axes to be used by boxplot.
fontsize float or str
Tick label font size in points or as a string (e.g., large ).
rot int or float, default 0
The rotation angle of labels (in degrees) with respect to the screen coordinate system.
grid bool, default True
Setting this to True will show the grid.
figsize A tuple (width, height) in inches
The size of the figure to create in matplotlib.
layout tuple (rows, columns), optional
For example, (3, 5) will display the subplots using 3 columns and 5 rows, starting from the top-left.
return_type <вЂaxes’, вЂdict’, вЂboth’>or None, default вЂaxes’
вЂaxes’ returns the matplotlib axes the boxplot is drawn on.
вЂdict’ returns a dictionary whose values are the matplotlib Lines of the boxplot.
вЂboth’ returns a namedtuple with the axes and dict.
backend str, default None
New in version 1.0.0.
Matplotlib equivalent plot.
The return type depends on the return_type parameter:
вЂaxes’ : object of class matplotlib.axes.Axes
вЂdict’ : dict of matplotlib.lines.Line2D objects
вЂboth’ : a namedtuple with structure (ax, lines)
array (for return_type = None )
Use return_type=’dict’ when you want to tweak the appearance of the lines after plotting. In this case a dict containing the Lines making up the boxes, caps, fliers, medians, and whiskers is returned.
Boxplots can be created for every column in the dataframe by df.boxplot() or indicating the columns to be used:
A list of strings (i.e. [‘X’, ‘Y’] ) can be passed to boxplot in order to group the data by combination of the variables in the x-axis:
The layout of boxplot can be adjusted giving a tuple to layout :
Additional formatting can be done to the boxplot, like suppressing the grid ( grid=False ), rotating the labels in the x-axis (i.e. rot=45 ) or changing the fontsize (i.e. fontsize=15 ):
Matplotlib BoxPlot – Учебник и примеры
В этом уроке мы рассмотрим, как построить боксовые графики в Matplotlib с помощью Python. Мы подробно рассмотрим основные сюжеты коробок и настройку с примерами.
Matplotlib BoxPlot – Учебник и примеры
Вступление
В Python существует множество библиотек визуализации данных, но Matplotlib-самая популярная библиотека из всех. Популярность Matplotlib объясняется его надежностью и полезностью – он способен создавать как простые, так и сложные графики с небольшим количеством кода. Вы также можете настроить графики различными способами.
Боксовые графики используются для визуализации сводной статистики набора данных, отображая атрибуты распределения, такие как диапазон и распределение данных.
Импорт Данных
Мы начнем с импорта всех библиотек, которые нам нужны. Мы импортируем Pandas для чтения и анализа набора данных, и нам, конечно же, нужно будет также импортировать Matplotlib, или, точнее, модуль PyPlot:
Давайте проверим, готов ли наш набор данных к использованию. Мы распечатаем заголовок набора данных, чтобы убедиться, что данные были загружены правильно, а также проверим, нет ли отсутствующих записей данных:
Постройте коробочный график в Matplotlib
Как обычно, мы можем вызвать функции построения графика на экземпляре Plot ( plot ), экземпляре Figure или экземпляре Axes :
В любом случае это приводит к:
После создания графика мы можем увидеть некоторые сводные статистические данные для наших данных. На прямоугольном графике показана медиана набора данных (вертикальная линия посередине), а также межквартильные диапазоны (концы прямоугольников) и минимальные и максимальные значения выбранного объекта набора данных (дальний конец “усов”).
Теперь у нас есть гораздо больше работы, так как мы решили построить несколько столбцов.
Настройка Сюжета
Как вы можете видеть, хотя графики были успешно сгенерированы, без меток тиков на осях X и Y трудно интерпретировать график.
Атрибут notch=True создает формат notch для boxplot, patch_artist=True заполняет boxplot цветами:
Мы можем использовать аргумент mean line для отображения среднего значения на коробке, хотя этого следует избегать, если мы также показываем зарубки, так как они могут конфликтовать.
Вывод
Если вы заинтересованы в визуализации данных и не знаете, с чего начать, обязательно ознакомьтесь с нашей книгой о визуализации данных в Python .
Matplotlib Boxplot С настройкой в Python
Основные примеры Matplotlib boxplot в Python для нескольких наборов данных, а также настраиваемые boxplots с использованием различных атрибутов.
Matplotlib Boxplot С настройкой в Python
Здравствуйте программисты, в сегодняшней статье мы обсудим Matplotlib Boxplot в Python.BoxPlot-это сюжет Усов в более простых терминах. Прямоугольники создаются для суммирования значений данных, имеющих такие свойства, как минимум, первый квартиль, медиана, третий квартиль и максимум. В графе box создается коробка от первого квартиля до третьего квартиля.
Здесь также есть вертикальная линия, которая проходит через коробку на медиане. Здесь ось x обозначает данные, а ось y показывает частотное распределение. Модуль Pyplot библиотеки Matplotlib предоставляет функции, подобные MATLAB. Следовательно, функция matplotlib.pyplot.boxplot() используется для создания коробочных графиков. Прежде чем мы приведем примеры Matplotlib Boxplot, позвольте мне кратко ознакомить вас с синтаксисом и параметрами этого же приложения.
Синтаксис Matplotlib Boxplot в Python
Параметры: Matplotlib Boxplot
Тип возврата: Matplotlib Boxplot
Функция Matplotlib boxplot возвращает словарь, сопоставляющий каждый компонент boxplot со списком созданных экземпляров Line2D. Этот словарь имеет следующие ключи (предполагая вертикальные боковые диаграммы):
Пример Matplotlib Boxplot в Python
ОБЪЯСНЕНИЕ:
Во-первых, значения данных, заданные методу ax.boxplot (), могут быть массивом Numpy, списком Python или кортежем массивов. В приведенном выше примере мы создаем прямоугольную диаграмму с помощью numpy.random.normal() для создания некоторых случайных данных. Кроме того, в качестве аргументов он принимает среднее значение, стандартное отклонение и желаемое число значений.
Боксплот с несколькими наборами данных
ОБЪЯСНЕНИЕ:
Во-первых, в приведенном выше примере несколько наборов данных строят несколько коробочных графиков под одними и теми же осями. Четыре набора данных представляют собой массивы Numpy, использующие функцию numpy.random.normal (). Эти четыре набора данных затем передаются в качестве значений данных в data href=”https://en.wikipedia.org/wiki/Array_data_structure”>массив. Более того, этот массив данных в качестве аргумента функции matplotlib boxplot() используется, создается несколько boxplots. href=”https://en.wikipedia.org/wiki/Array_data_structure”>массив. Более того, этот массив данных в качестве аргумента функции matplotlib boxplot() используется, создается несколько boxplots.
Индивидуальный Matplotlib Boxplot
ОБЪЯСНЕНИЕ:
Во-первых, matplotlib.pyplot.boxplot() предоставляет множество возможностей настройки коробочного графика. Создает формат вырезки для коробчатого графика. Мы можем установить разные цвета для разных коробок. Он заполняет бокс-план цветами. Кроме того, атрибут создает горизонтальную прямоугольную диаграмму. Метки принимают те же размеры, что и количество наборов данных.
Boxplot С Легендой
Легенда очень полезна при описании элементов сюжетов. Используя matplotlib.pyplot.legend (), вы можете добавить в свой код пользовательские легенды, которые могут продемонстрировать детали графика. Ниже приведен пример этого –
Надо Читать
Вывод
В этой статье мы узнали о различных способах использования Matplotlib Boxplot в Python. Мы можем реализовать несколько бокс-графиков под одними и теми же осями, определив столько наборов данных, сколько требуется. Кроме того, Boxplot Matplotlib предоставляет бесконечные способы настройки boxplots. Также обсуждались различные атрибуты настройки. Обратитесь к этой статье в случае каких-либо запросов относительно функции Matplotlib boxplot ().
Однако, если у вас есть какие-либо сомнения или вопросы, дайте мне знать в разделе комментариев ниже. Я постараюсь помочь вам как можно скорее.
matplotlib.pyplot.boxplot¶
Draw a box and whisker plot.
The box extends from the first quartile (Q1) to the third quartile (Q3) of the data, with a line at the median. The whiskers extend from the box by 1.5x the inter-quartile range (IQR). Flier points are those past the end of the whiskers. See https://en.wikipedia.org/wiki/Box_plot for reference.
The input data. If a 2D array, a boxplot is drawn for each column in x. If a sequence of 1D arrays, a boxplot is drawn for each array in x.
notch bool, default: False
Whether to draw a notched boxplot ( True ), or a rectangular boxplot ( False ). The notches represent the confidence interval (CI) around the median. The documentation for bootstrap describes how the locations of the notches are computed by default, but their locations may also be overridden by setting the conf_intervals parameter.
In cases where the values of the CI are less than the lower quartile or greater than the upper quartile, the notches will extend beyond the box, giving it a distinctive «flipped» appearance. This is expected behavior and consistent with other statistical visualization packages.
vert bool, default: True
whis float or (float, float), default: 1.5
The position of the whiskers.
If a pair of floats, they indicate the percentiles at which to draw the whiskers (e.g., (5, 95)). In particular, setting this to (0, 100) results in whiskers covering the whole range of the data.
Beyond the whiskers, data are considered outliers and are plotted as individual points.
bootstrap int, optional
Specifies whether to bootstrap the confidence intervals around the median for notched boxplots. If bootstrap is None, no bootstrapping is performed, and notches are calculated using a Gaussian-based asymptotic approximation (see McGill, R., Tukey, J.W., and Larsen, W.A., 1978, and Kendall and Stuart, 1967). Otherwise, bootstrap specifies the number of times to bootstrap the median to determine its 95% confidence intervals. Values between 1000 and 10000 are recommended.
usermedians 1D array-like, optional
conf_intervals array-like, optional
positions array-like, optional
The positions of the boxes. The ticks and limits are automatically set to match the positions. Defaults to range(1, N+1) where N is the number of boxes to be drawn.
widths float or array-like
patch_artist bool, default: False
If False produces boxes with the Line2D artist. Otherwise, boxes are drawn with Patch artists.
labels sequence, optional
Labels for each dataset (one per dataset).
manage_ticks bool, default: True
If True, the tick locations and labels will be adjusted to match the boxplot positions.
autorange bool, default: False
When True and the data are distributed such that the 25th and 75th percentiles are equal, whis is set to (0, 100) such that the whisker ends are at the minimum and maximum of the data.
meanline bool, default: False
If True (and showmeans is True ), will try to render the mean as a line spanning the full width of the box according to meanprops (see below). Not recommended if shownotches is also True. Otherwise, means will be shown as points.
zorder float, default: Line2D.zorder = 2
The zorder of the boxplot.
A dictionary mapping each component of the boxplot to a list of the Line2D instances created. That dictionary has the following keys (assuming vertical boxplots):
boxes : the main body of the boxplot showing the quartiles and the median’s confidence intervals if enabled.
medians : horizontal lines at the median of each box.
whiskers : the vertical lines extending to the most extreme, non-outlier data points.
caps : the horizontal lines at the ends of the whiskers.
fliers : points representing data that extend beyond the whiskers (fliers).
means : points or lines representing the means.
Other Parameters showcaps bool, default: True
Show the caps on the ends of whiskers.
showbox bool, default: True
Show the central box.
showfliers bool, default: True
Show the outliers beyond the caps.
showmeans bool, default: False
Show the arithmetic means.
capprops dict, default: None
The style of the caps.
boxprops dict, default: None
The style of the box.
whiskerprops dict, default: None
The style of the whiskers.
flierprops dict, default: None
The style of the fliers.
medianprops dict, default: None
The style of the median.
meanprops dict, default: None
The style of the mean.
data indexable object, optional
Draw an estimate of the probability density function.