Python для анализа данных¶
Перед изучением убедитесь, что вы достаточно хорошо ознакомились с первой частью нашего материала про pandas.
Сгенерируем случайные числа и представим их в виде DataFrame .
A | B | C | D | |
---|---|---|---|---|
0 | -1.345702 | 1.583271 | 0.480914 | -0.053891 |
1 | -1.513222 | 0.389656 | 0.448918 | -0.265700 |
2 | 0.817235 | -1.573969 | -0.080860 | 2.160590 |
3 | -0.773110 | 0.569715 | 0.078057 | -0.215249 |
4 | -0.178111 | 0.286518 | 0.035825 | 0.805861 |
5 | 0.849732 | -0.182298 | -0.224015 | 0.208410 |
6 | -1.701552 | -0.586663 | -1.313644 | 0.470541 |
7 | -0.373508 | -0.813824 | -0.251265 | -0.834696 |
8 | -0.745802 | -0.160359 | -0.934386 | -0.358681 |
9 | -1.116177 | 0.229204 | -2.352976 | -0.348601 |
Выведем описательные статистики по столбцам — количество значений, среднее, стандартное отклонение (корень из дисперсии), минимум, квантили, максимум.
A | B | C | D | |
---|---|---|---|---|
count | 10.000000 | 10.000000 | 10.000000 | 10.000000 |
mean | -0.608022 | -0.025875 | -0.411343 | 0.156858 |
std | 0.898149 | 0.859838 | 0.882121 | 0.843477 |
min | -1.701552 | -1.573969 | -2.352976 | -0.834696 |
25% | -1.288321 | -0.485572 | -0.763606 | -0.327876 |
50% | -0.759456 | 0.034423 | -0.152438 | -0.134570 |
75% | -0.226960 | 0.363871 | 0.067499 | 0.405008 |
max | 0.849732 | 1.583271 | 0.480914 | 2.160590 |
Применение функции к данным. Для примера посчитаем разброс значений — разница максимума и минимума.
Почему не сортируется столбец в excel | Хитрости Жизни
- left и right — объединяемые таблицы.
- how — тип объединения:
- left — только по ключам из левой таблицы == SQL left outer join;
- right — только по ключам из правой таблицы == SQL right outer join;
- outer — по объединению ключей == SQL full outer join;
- inner — по пересечению ключей == SQL inner join.
Элементы поля сводной таблицы автоматически сортируются в возрастающем порядке, согласно их именам. Сортировка элементов по именам позволяет восстановить первоначальный порядок, если элементы были перемещены или отсортированы иначе.
A B C D 0 -1.345702 1.583271 0.480914 -0.053891 1 -1.513222 0.389656 0.448918 -0.265700 2 0.817235 -1.573969 -0.080860 2.160590 3 -0.773110 0.569715 0.078057 -0.215249 4 -0.178111 0.286518 0.035825 0.805861 5 0.849732 -0.182298 -0.224015 0.208410 6 -1.701552 -0.586663 -1.313644 0.470541 7 -0.373508 -0.813824 -0.251265 -0.834696 8 -0.745802 -0.160359 -0.934386 -0.358681 9 -1.116177 0.229204 -2.352976 -0.348601 Анализ данных сводной таблицы Excel 2007
Для этого необходимо кликнуть на любом заголовке строки сводной таблицы (в нашем примере — это поля Дата, Точка продажи и Марка телефона), и в открывшихся вкладках Работа со сводными таблицами перейти на вкладку Параметры. На ней необходимо нажать кнопку Параметры поля в группе Активное поле.
В открывшемся окне первой закладкой будет закладка Промежуточные итоги и фильтры.
Отсутствие такой закладки означает, что Вы не выбрали заголовок строки, то есть курсор установлен на ячейке с числовым значением.
На закладке Промежуточные итоги и фильтры Вы можете выбрать условие для выведения промежуточных итогов. Предлагаются следующие условия:
· автоматически — подсчитывает сумму для каждого условия таблицы;
· другие — позволяет самостоятельно выбрать действие для подведения промежуточных итогов.
Установив автоматическое подведение промежуточных итогов, мы получим следующую таблицу, которая содержит промежуточные итоги для каждого условия:
Если настройка промежуточных итогов с помощью команды Параметры поля, не даёт видимых результатов, проверьте настройки отображения промежуточных итогов с помощью команды Промежуточные итоги группы Макет вкладки Конструктор.
Допустим, нам необходимо вывести промежуточные итоги только для дат, скрыв промежуточные итоги для точек продаж. Для этого щелкните на любое поле таблицы с названием магазина и вызовите контекстное меню. В нём нужно убрать галочку с условия Промежуточный итог: точка продажи. Как мы видим, промежуточные итоги остались только для дат:
Часто бывает необходимо отсортировать данные сводной таблицы, для лучшего их восприятия. Для этого достаточно выбрать поле, по которому нужно провести сортировку, перейти на вкладку Общие, в группе Редактирование нажать на кнопку Сортировка и фильтр и установить нужные Вам условия сортировки.
Очень полезной функцией для анализа информации в сводной таблице является возможность группировки данных. Например, нам нужно сгруппировать наши продажи по неделям месяца. Для этого нужно выделить даты, которые входят в первую неделю (15.05-21.05):
Обратите внимание, что для удобства выделения мы свернули данные по отдельным магазинам, воспользовавшись кнопкой + в левой части ячейки с названием магазина.
Далее нужно выполнить команду Группировка по выделенному группы Группировать вкладки Параметры. В таблице появится новый столбец, в котором поле Группа1 будет объединять выбранные нами поля.
Останется только переименовать название группы путём простого редактирования ячейки:
Для отмены группировки достаточно воспользоваться командой Разгруппировать из этой же группы, предварительно выбрав поле, которое подлежит разгруппировке. Обратите внимание, что нельзя разгруппировать поле, которое мы включили в условие построения сводной таблицы — например поле Точка продажи или Дата.
Рассмотрим ещё один способ вывода данных, который поможет нам проанализировать информацию из нашей таблицы. Например, нам нужно узнать объемы выручки не в денежном выражении, а в виде процента от общего объема выручки за весь период продаж.
Для этого нужно выделить любую ячейку в столбце Выручка нашей сводной таблицы. После этого нужно выполнить команду Параметры поля в группе Активное поле вкладки Параметры.
В открывшемся диалоговом окне необходимо перейти на вкладку Дополнительные вычисления и из выпадающего меню выбрать пункт Доля от суммы по столбцу. После нажатия кнопки Ок, наша таблица будет иметь следующий вид:
Если данные в таблице будут выводиться не в виде процентов, проверьте настройки числового формата ячеек (это можно сделать сразу же в диалоговом окне Параметры поля, нажав на кнопку Числовой формат, или вызвав соответствующее окно из контекстного меню).
Задать вопрос экспертуМнение экспертаВитальева Анжела, консультант по работе с офисными программамиСо всеми вопросами обращайтесь ко мне!Представления позволяют запоминать внешний вид таблицы на заданном листе закрепление областей, скрытые и видимые строки и столбцы, условия фильтрации и т. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!Например, для колонки, содержащей наименование контрагента, можно вручную задать имя диапазона, например КонтрИмя . Оно компактное, но информативное, поэтому его удобно использовать в формулах.
Недостатки умных таблиц Excel
Преимущество срезов по сравнению с фильтрами в том, что можно видеть на экране, какие именно поля и как именно отфильтрованы. Ну и они очень симпатичны, это важно, когда мы хотим показать сводную диаграмму вместо таблицы и тут же хотим ее регулировать.