Python и анализ данных

В наличии Цена за шт.

1650

Количество
Купить

Акции и скидки Поделиться


  • Артикул:00-01044878
  • Автор: Уэс Маккинли
  • ISBN: 978-5-97060-315-4
  • Обложка: Твердая обложка
  • Издательство: ДМК пресс (все книги издательства)
  • Город: Москва
  • Страниц: 482
  • Формат: 70x100 1/16
  • Год: 2015
  • Вес: 1355 г
  • Серия: Бестселлеры O’Reilly (все книги серии)
Развернуть ▼

Книгу можно рассматривать как современное практическое введение в разработку научных приложений на Python, ориентированных на обработку данных. Описаны те части языка Python и библиотеки для него, которые необходимы для эффективного решения широкого круга аналитических задач интерактивная оболочка IPython, библиотеки NumPy и pandas, библиотека для визуализации данных matplotlib и др.
Издание идеально подойдет как аналитикам, только начинающим осваивать обработку данных, так и опытным программистам на Python, еще не знакомым с научными приложениями.

Оглавление
Предисловие
Графические выделения
Глава 1. Предварительные сведения
О чем эта книга?
Почему именно Python?
Python как клей
Решение проблемы «двух языков»
Недостатки Python
Необходимые библиотеки для Python
NumPy
pandas
matplotlib
IPython
SciPy
Установка и настройка
Windows
Apple OS X
GNU/Linux
Python 2 и Python 3
Интегрированные среды разработки (IDE)
Сообщество и конференции
Структура книги
Примеры кода
Данные для примеров
Соглашения об импорте
Жаргон
Благодарности
Глава 2. Первые примеры
Набор данных 1.usa.gov с сайта bit.ly
Подсчет часовых поясов на чистом Python
Подсчет часовых поясов с помощью pandas
Набор данных MovieLens 1M
Измерение несогласия в оценках
Имена, которые давали детям в США за период с 1880 по 2010 год
Анализ тенденций в выборе имен
Выводы и перспективы
Глава 3. IPython: интерактивные вычисления и среда разработки
Основы IPython
Завершение по нажатию клавиши Tab
Интроспекция
Команда %run
Исполнение кода из буфера обмена
Комбинации клавиш
Исключения и обратная трассировка
Магические команды
Графическая консоль на базе Qt
Интеграция с matplotlib и режим pylab
История команд
Поиск в истории команд и повторное выполнение
Входные и выходные переменные
Протоколирование ввода-вывода
Взаимодействие с операционной системой
Команды оболочки и псевдонимы
Система закладок на каталоги
Средства разработки программ
Интерактивный отладчик
Хронометраж программы: %time и %timeit
Простейшее профилирование: %prun и %run -p
Построчное профилирование функции
HTML-блокнот в IPython
Советы по продуктивной разработке кода с использованием IPython
Перезагрузка зависимостей модуля
Советы по проектированию программ
Дополнительные возможности IPython
Делайте классы дружественными к IPython
Профили и конфигурирование
Благодарности
Глава 4. Основы NumPy: массивы и векторные вычисления
NumPyndarray: объект многомерного массива
Создание ndarray
Тип данных для ndarray
Операции между массивами и скалярами
Индексирование и вырезание
Булево индексирование
Прихотливое индексирование
Транспонирование массивов и перестановка осей
Универсальные функции: быстрые поэлементные операции над массивами
Обработка данных с применением массивов
Запись логических условий в виде операций с массивами
Математические и статистические операции
Методы булевых массивов
Сортировка
Устранение дубликатов и другие теоретико-множественные операции
Файловый ввод-вывод массивов
Хранение массивов на диске в двоичном формате
Сохранение и загрузка текстовых файлов
Линейная алгебра
Генерация случайных чисел
Пример: случайное блуждание
Моделирование сразу нескольких случайных блужданий
Глава 5. Первое знакомство с pandas
Введение в структуры данных pandas
Объект Series
Объект DataFrame
Индексные объекты
Базовая функциональность
Переиндексация
Удаление элементов из оси
Доступ по индексу, выборка и фильтрация
Арифметические операции и выравнивание данных
Применение функций и отображение
Сортировка и ранжирование
Индексы по осям с повторяющимися значениями
Редукция и вычисление описательных статистик
Корреляция и ковариация
Уникальные значения, счетчики значений и членство
Обработка отсутствующих данных
Фильтрация отсутствующих данных
Иерархическое индексирование
Уровни переупорядочения и сортировки
Сводная статистика по уровню
Работа со столбцами DataFrame
Другие возможности pandas
Доступ по целочисленному индексу
Структура данных Panel
Глава 6. Чтение и запись данных, форматы файлов
Чтение и запись данных в текстовом формате
Чтение текстовых файлов порциями
Вывод данных в текстовом формате
Ручная обработка данных в формате с разделителями
Данные в формате JSON
XML и HTML: разбор веб-страниц
Разбор XML с помощью lxml.objectify
Двоичные форматы данных
Взаимодействие с HTML и Web API
Взаимодействие с базами данных
Чтение и сохранение данных в MongoDB
Глава 7. Переформатирование данных: очистка,
преобразование, слияние, изменение формы
Комбинирование и слияние наборов данных
Слияние объектов DataFrame как в базах данных
Слияние по индексу
Конкатенация вдоль оси
Комбинирование перекрывающихся данных
Изменение формы и поворот
Изменение формы с помощью иерархического индексирования
Поворот из «длинного» в «широкий» формат
Преобразование данных
Устранение дубликатов
Преобразование данных с помощью функции или отображения
Замена значений
Переименование индексов осей
Дискретизация и раскладывание
Обнаружение и фильтрация выбросов
Перестановки и случайная выборка
Вычисление индикаторных переменных
Манипуляции со строками
Методы строковых объектов
Регулярные выражения
Векторные строковые функции в pandas
Пример: база данных о продуктах питания министерства сельского хозяйства США
Глава 8. Построение графиков и визуализация
Краткое введение в API библиотеки matplotlib
Рисунки и подграфики
Цвета, маркеры и стили линий
Риски, метки и надписи
Аннотации и рисование в подграфике
Сохранение графиков в файле
Конфигурирование matplotlib
Функции построения графиков в pandas
Линейные графики
Столбчатые диаграммы
Гистограммы и графики плотности
Диаграммы рассеяния
Нанесение данных на карту: визуализация данных о землетрясении на Гаити
Инструментальная экосистема визуализации для Python
Chaco
mayavi
Прочие пакеты
Будущее средств визуализации
Глава 9. Агрегирование данных и групповые операции
Механизм GroupBy
Обход групп
Выборка столбца или подмножества столбцов
Группировка с помощью словарей и объектов Series
Группировка с помощью функций
Группировка по уровням индекса
Агрегирование данных
Применение функций, зависящих от столбца, и нескольких функций
Возврат агрегированных данных в «неиндексированном» виде
Групповые операции и преобразования
Метод apply: часть общего принципа разделения–применения объединения
Квантильный и интервальный анализ
Пример: подстановка зависящих от группы значений вместо отсутствующих
Пример: случайная выборка и перестановка
Пример: групповое взвешенное среднее и корреляция
Пример: групповая линейная регрессия
Сводные таблицы и кросс-табуляция
Таблицы сопряженности
Пример: база данных федеральной избирательной комиссии за 2012 год
Статистика пожертвований по роду занятий и месту работы
Распределение суммы пожертвований по интервалам
Статистика пожертвований по штатам
Глава 10. Временные ряды
Типы данных и инструменты, относящиеся к дате и времени
Преобразование между строкой и datetime
Основы работы с временными рядами
Индексирование, выборка, подмножества
Временные ряды с неуникальными индексами
Диапазоны дат, частоты и сдвиг
Генерация диапазонов дат
Частоты и смещения дат
Сдвиг данных (с опережением и с запаздыванием)
Часовые пояса
Локализация и преобразование
Операции над объектами Timestamp с учетом часового пояса
Операции между датами из разных часовых поясов
Периоды и арифметика периодов
Преобразование частоты периода
Квартальная частота периода
Преобразование временных меток в периоды и обратно
Создание PeriodIndex из массивов
Передискретизация и преобразование частоты
Понижающая передискретизация
Повышающая передискретизация и интерполяция
Передискретизация периодов
Графики временных рядов
Скользящие оконные функции
Экспоненциально взвешенные функции
Бинарные скользящие оконные функции
Скользящие оконные функции, определенные пользователем
Замечания о быстродействии и потреблении памяти
Глава 11. Финансовые и экономические приложения
О переформатировании данных
Временные ряды и выравнивание срезов
Операции над временными рядами с различной частотой
Время суток и выборка данных «по состоянию на»
Сращивание источников данных
Индексы доходности и кумулятивная доходность
Групповые преобразования и анализ
Оценка воздействия групповых факторов
Децильный и квартильный анализ
Другие примеры приложений
Стохастический граничный анализ
Роллинг фьючерсных контрактов
Скользящая корреляция и линейная регрессия
Глава 12. Дополнительные сведения о библиотеке NumPy
Иерархия типов данных в NumPy
Дополнительные манипуляции с массивами
Изменение формы массива
Упорядочение элементов массива в C и в Fortran
Конкатенация и разбиение массива
Повторение элементов: функции tile и repeat
Эквиваленты прихотливого индексирования: функции take и put
Укладывание
Укладывание по другим осям
Установка элементов массива с помощью укладывания
Дополнительные способы использования универсальных функций
Методы экземпляра u-функций
Пользовательские u-функции
Структурные массивы
Вложенные типы данных и многомерные поля
Зачем нужны структурные массивы?
Манипуляции со структурными массивами: numpy.lib.recfunctions
Еще о сортировке
Косвенная сортировка: методы argsort и lexsort
Альтернативные алгоритмы сортировки
Метод numpy.searchsorted: поиск элементов в отсортированном массиве
Класс matrix в NumPy
Дополнительные сведения о вводе-выводе массивов
Файлы, спроецированные на память
HDF5 и другие варианты хранения массива
Замечание о производительности
Важность непрерывной памяти
Другие возможности ускорения: Cython, f2py, C
приложение. Основы языка Python
Интерпретатор Python
Основы
Семантика языка
Скалярные типы
Поток управления
Структуры данных и последовательности
Список
Встроенные функции последовательностей
Словарь
Множество
Списковое, словарное и множественное включение
Функции
Пространства имен, области видимости и локальные функции
Возврат нескольких значений
Функции являются объектами
Анонимные (лямбда) функции
Замыкания: функции, возвращающие функции
Расширенный синтаксис вызова с помощью *args и **kwargs
Каррирование: частичное фиксирование аргументов
Генераторы
Генераторные выражения
Модуль itertools
Файлы и операционная система
Предметный указатель


Оставьте отзыв о товаре
Рекомендуем
×

Диски

Журналы и бланки

Журналы для автодорог, дорожного хозяйстваЖурналы для АЗС и АЗГСЖурналы для аптекЖурналы для архивовЖурналы для аттракционовЖурналы для банковЖурналы для бассейновЖурналы для бухгалтерииЖурналы для газовых хозяйств, газораспределительных систем, ГАЗПРОМаЖурналы для гостиниц, общежитий, хостеловЖурналы для грузоподъемных механизмовЖурналы для делопроизводстваЖурналы для драгметалловЖурналы для ЖКХЖурналы для канатных дорог, фуникулеровЖурналы для кладбищЖурналы для конструкторских, научно-техническая документацияЖурналы для лесных хозяйствЖурналы для лифтовЖурналы для медицинских учрежденийЖурналы для МЧСЖурналы для нефтебазЖурналы для нефтепромысла, нефтепроводовЖурналы для образовательных учрежденийЖурналы для парикмахерских, салонов красоты, маникюрных, педикюрных кабинетовЖурналы для проверки и контроля госорганами, контролирующими организациямиЖурналы для промышленностиЖурналы для работ с повышенной опасностьюЖурналы для регулирования алкогольного рынкаЖурналы для сельских хозяйств, ветеринарииЖурналы для складовЖурналы для снегоплавильных пунктовЖурналы для стройки, строительстваЖурналы для тепловых энергоустановок, котельныхЖурналы для транспортаЖурналы для туризмаЖурналы для учреждений культуры, библиотек, музеевЖурналы для церкви, религиозных организацийЖурналы для шахт, рудников, метрополитенов, подземных сооруженийЖурналы для электроустановокЖурналы и бланки для армии, вооруженных силЖурналы и бланки для нотариусов, юристов, адвокатовЖурналы и бланки для организаций пищевого производства, общепита и пищевых блоковЖурналы и бланки для организаций, занимающихся охраной объектов и частных лицЖурналы и бланки для ФТС РФ (таможни)Журналы и бланки по экологииЖурналы и бланки, используемые в торговле, бытовом обслуживанииЖурналы и бланки, относящиеся к нескольким отраслямЖурналы по геодезии, геологииЖурналы по метрологииЖурналы по охране труда и технике безопасностиЖурналы по пожарной безопасностиЖурналы по психологииЖурналы по санитарии, проверкам СЭСЖурналы по связиЖурналы по эксплуатации зданий и сооруженийЖурналы по энергетикеЖурналы, бланки, формы для кадровых работЖурналы, бланки, формы документов для органов прокуратуры и суда, минюста, пенитенциарной системыЖурналы, бланки, формы документов МВД РФ, РосгвардииКомплекты документов и журналовОбложки для журналов и удостоверенийСамокопирующиеся бланки

Знаки безопасности, таблички, стенды

Вспомогательные знаки, таблички-наклейкиЗапрещающие знакиЗнаки для инвалидовЗнаки для уборки и сбора мусораЗнаки на автомобильЗнаки пожарной безопасностиЗнаки электробезопасностиИнформационные знаки для строительных площадокМедицинские и санитарные знакиНаклейкиПредписывающие знакиПредупреждающие знакиСтендыУказательные знакиЭвакуационные знакиЮмористические знаки

Календари

Книги

Букинистическая литератураГОСТы, ОСТыДетская литератураДомашний кругДругоеИскусство. Культура. ФилологияКниги в электронном видеКниги издательства "Комсомольская правда"Компьютеры и интернетКосмосНаука. Техника. МедицинаНормативные правовые актыОбщественные и гуманитарные наукиОхрана труда, обеспечение безопасностиПодарочные книгиПутешествия. Отдых. Хобби. СпортРелигия. Оккультизм. ЭзотерикаРостехнадзорСанПины, СП, МУ, МР, ГНСборники рецептур блюд для предприятий общественного питанияСНиП, СП, СО,СТО, РД, НП, ПБ, МДК, МДС, ВСНУчебный годХудожественная литератураЭкономическая литератураЭнциклопедии, справочники, словари

Курвиметры

Ленты с тиснением

Линейки

Авиационные и военные линейкиДетские линейкиМедицинские линейкиПортновские линейкиТехнические линейкиТрафареты с чертежными шрифтамиЧертежные линейки

Маркировочная продукция

Маркировка трубопровода "Вода"Маркировка трубопровода "Воздух"Маркировка трубопровода "Газ"Маркировка трубопровода "Жидкость"Маркировка трубопровода "Кислота"Маркировка трубопровода "Пар"Маркировка трубопровода "Прочие вещества"Маркировка трубопровода "Щелочь"

Материалы для типографии (мини-типографии)

Бумага для оргтехникиКлейПереплетные материалыПленка для печати и ламинацииФольга для тиснения

Металлические изделия (металлическая мебель, конструкции, навесы)

Металлическая мебельМеталлические изделия для дачи и дома

Носки и портянки

Одноразовая одежда

Охрана труда

Печати и штампы

Медицинские печати и штампыОснастки, самонаборные штампыПечати и штампы для бухгалтерии и делопроизводстваПечати и штампы для водителейПечать фирмы (организации, компании, подразделения, отдела)Штампы по техническому контролю, учету и хранению

Плакаты

Погоны министерств и ведомств

Подарки нашим покупателям

Полотенца

Портреты знаменитых людей

Сувениры

Бизнес сувениры, корпоративные подаркиБрелкиГимн России. Эксклюзивное графическое оформление в багетном обрамленииГудки и Рожки охотничьиЗажигалкиКружки для термопереносаКружки подарочныеПодарочные наборы игрПредметы интерьераСувениры, подарки для мужчин

Тир

Рогатки спортивные

Ткани

Товары "Юнармия"

Береты

Товары для дома и офиса

Грамоты и благодарностиИндикаторы стерилизацииКанцелярские товарыКаски, защитные очки, маскиКухонные принадлежностиОгнетушителиПланы эвакуацииСамоспасателиСредства дезинфекцииТовары для ремонтаФитолампы и прожекторыХозяйственные товарыЭлектроудлинители, тройники, катушкиЭлектроустановочные изделия

Товары для здоровья, БАДы

Аюрведические товарыСредства гигиены, косметика из минералов Мертвого моря

Товары для развития, игрушки

Бумажные модели

Товары для спорта, туризма и охоты

Походные сумки, рюкзаки и мешочки для храненияСигнальное снаряжениеТовары для фитнеса

Удостоверения, Свидетельства

Зачетные книжки, студенческие билетыУдостоверения для спортивных секцийУдостоверения рабочих различных специальностей

Упаковка, упаковочные материалы

Коробки картонные

Членские книжки

ГК, ГСК, членские книжки, пропуска и пр.Садоводческие книжки, членские книжки СНТ