Чтение онлайн

на главную - закладки

Жанры

Python Библиотеки
Шрифт:

Индексация и выбор данных:

```python

# Выбор столбца по имени

age = df['Возраст']

# Выбор строки по индексу

row = df.loc[0]

```

Фильтрация данных:

```python

# Фильтрация по условию

filtered_df = df[df['Возраст'] > 25]

```

Добавление новых столбцов:

```python

# Добавление нового столбца

df['Зарплата'] = [50000, 60000, 45000]

```

Операции с группами:

```python

#

Группировка данных по столбцу 'Город' и вычисление среднего значения возраста в каждой группе

grouped_df = df.groupby('Город')['Возраст'].mean

```

4. Визуализация данных с Pandas

Pandas также предоставляет встроенные средства для визуализации данных. Например, гистограмму можно построить следующим образом:

Давайте разберем пошагово строки кода:

– Импорт библиотек:

```python

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

```

Здесь мы импортируем необходимые библиотеки. `pd` – это стандартное соглашение для обозначения библиотеки Pandas. `matplotlib.pyplot` используется для создания графиков, а `seaborn` – библиотека для стилизации графиков и добавления дополнительных функций визуализации.

– Создание данных:

```python

data = {'Имя': ['Анна', 'Борис', 'Виктория'],

'Возраст': [25, 30, 22],

'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

df = pd.DataFrame(data)

```

Мы создаем простой DataFrame с тремя колонками: 'Имя', 'Возраст' и 'Город'. Эти данные представляют собой три записи с именами, возрастами и городами.

Настраиваем стиль seaborn:

```python

sns.set(style="whitegrid")

```

Эта строка устанавливает стиль для графика с помощью библиотеки seaborn. Здесь мы выбрали стиль "whitegrid", который добавляет белую сетку на фоне графика.

– Создаем гистограмму:

```python

plt.figure(figsize=(8, 6))

sns.histplot(df['Возраст'], bins=20, kde=True, color='skyblue')

```

Здесь мы создаем гистограмму для столбца 'Возраст' из DataFrame. `figsize=(8, 6)` устанавливает размер графика. `bins=20` указывает количество столбцов в гистограмме. `kde=True` добавляет оценку плотности на гистограмму. `color='skyblue'` задает цвет графика.

– Добавляем подписи и заголовок:

```python

plt.xlabel('Возраст', fontsize=12)

plt.ylabel('Частота', fontsize=12)

plt.title('Гистограмма возрастов', fontsize=14)

```

Эти строки добавляют подписи к осям и заголовок для улучшения понимания графика

– Добавляем сетку:

```python

plt.grid(axis='y', linestyle='–', alpha=0.7)

```

Эта строка добавляет горизонтальную сетку для лучшей читаемости.

– Показываем график:

```python

plt.show

```

И наконец, эта строка отображает график.

Этот код создает красивую гистограмму с данными о возрасте и демонстрирует базовые шаги визуализации данных с использованием

библиотек Pandas, Matplotlib и Seaborn в Python.

Pandas предоставляет эффективные инструменты для работы с табличными данными, что делает его широко используемым в анализе данных, машинном обучении и других областях. DataFrame позволяет легко выполнять множество операций, от фильтрации и группировки данных до визуализации результатов. Это делает Pandas мощным инструментом для аналитики и обработки данных в Python.

Приведем примеры фильтрации, сортировки и агрегации данных с использованием библиотеки Pandas на основе предположимого DataFrame с информацией о людях:

В этом примере мы использовали фильтрацию для выбора только тех записей, где возраст больше 25 лет.

Здесь мы отсортировали DataFrame по столбцу 'Возраст' в порядке убывания.

В данном примере мы использовали агрегацию для расчета среднего возраста и суммы зарплаты для каждого города.

Эти примеры показывают базовые операции фильтрации, сортировки и агрегации данных с Pandas, которые могут быть полезны при работе с табличными данными.

2.3. Matplotlib

Matplotlib – это библиотека для визуализации данных в языке программирования Python. Она предоставляет множество инструментов для создания различных типов графиков и диаграмм. Давайте рассмотрим несколько основных видов графиков и диаграмм, которые можно создать с помощью Matplotlib.

1. Линейный график

Линейный график подходит для визуализации зависимости одной переменной от другой. Рассмотрим пример:

```python

import matplotlib.pyplot as plt

# Создаем данные для примера

x = [1, 2, 3, 4, 5]

y = [10, 15, 7, 12, 9]

# Строим линейный график

plt.plot(x, y, marker='o', linestyle='-', color='b', label='Линейный график')

# Добавляем подписи и заголовок

plt.xlabel('X-ось')

plt.ylabel('Y-ось')

plt.title('Пример линейного графика')

plt.legend # Добавляем легенду

# Показываем график

plt.show

```

2. Гистограмма

Поделиться:
Популярные книги

Отморозки

Земляной Андрей Борисович
Фантастика:
научная фантастика
7.00
рейтинг книги
Отморозки

Цеховик. Книга 2. Движение к цели

Ромов Дмитрий
2. Цеховик
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Цеховик. Книга 2. Движение к цели

Гримуар темного лорда V

Грехов Тимофей
5. Гримуар темного лорда
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Гримуар темного лорда V

Комендант некромантской общаги 2

Леденцовская Анна
2. Мир
Фантастика:
юмористическая фантастика
7.77
рейтинг книги
Комендант некромантской общаги 2

Попаданка в деле, или Ваш любимый доктор

Марей Соня
1. Попаданка в деле, или Ваш любимый доктор
Фантастика:
фэнтези
5.50
рейтинг книги
Попаданка в деле, или Ваш любимый доктор

Ведьмак. Назад в СССР

Подус Игорь
1. Ведьмак. Назад в СССР
Фантастика:
попаданцы
альтернативная история
6.60
рейтинг книги
Ведьмак. Назад в СССР

Здравствуй, 1984-й

Иванов Дмитрий
1. Девяностые
Фантастика:
альтернативная история
6.42
рейтинг книги
Здравствуй, 1984-й

Огромный. Злой. Зеленый

Новикова Татьяна О.
1. Большой. Зеленый... ОРК
Любовные романы:
любовно-фантастические романы
5.40
рейтинг книги
Огромный. Злой. Зеленый

Черный маг императора

Герда Александр
1. Черный маг императора
Фантастика:
юмористическая фантастика
попаданцы
аниме
5.00
рейтинг книги
Черный маг императора

Мое ускорение

Иванов Дмитрий
5. Девяностые
Фантастика:
попаданцы
альтернативная история
6.33
рейтинг книги
Мое ускорение

Вечный. Книга IV

Рокотов Алексей
4. Вечный
Фантастика:
боевая фантастика
попаданцы
рпг
5.00
рейтинг книги
Вечный. Книга IV

Я еще князь. Книга XX

Дрейк Сириус
20. Дорогой барон!
Фантастика:
юмористическое фэнтези
попаданцы
аниме
5.00
рейтинг книги
Я еще князь. Книга XX

Матабар IV

Клеванский Кирилл Сергеевич
4. Матабар
Фантастика:
фэнтези
5.00
рейтинг книги
Матабар IV

Лорд Системы

Токсик Саша
1. Лорд Системы
Фантастика:
фэнтези
попаданцы
рпг
4.00
рейтинг книги
Лорд Системы