- Артикул:00-01006573
- Автор: Паклин Н.Б., Орешков В.И.
- ISBN: 978-5-459-00717-6
- Тираж: 1500 экз.
- Обложка: Мягкая обложка
- Издательство: Питер (все книги издательства)
- Город: СПб
- Страниц: 704
- Формат: 70x100/16 (~168x240 мм)
- Год: 2013
- Вес: 1755 г
- Серия: Учебное пособие для ВУЗов (все книги серии)
Книга представляет собой руководство для профессиональных бизнес-аналитиков, занимающихся внедрением корпоративных аналитических систем. В теоретической части последовательно освещаются современные технологии сбора и анализа структурированной информации: хранилища данных, ETL, OLAP, Data Mining, Knowledge Discovery in Databases. В практической части приводятся примеры решения бизнес-задач на аналитической платформе Deductor Academic.
В данное, второе, издание включены разделы по последовательным шаблонам, байесовскому классификатору, обучению в условиях несбалансированности классов, расширена практическая часть.
Книга будет полезна всем интересующимся вопросами интеллектуального анализа данных и методами автоматического поиска закономерностей в массивах информации.
Для специалистов в области анализа данных, студентов и аспирантов.
Краткое содержание
Предисловие авторов
Об авторах
От издательства
Вступительное слово
Введение
ЧАСТЬ I. ТЕОРИЯ БИЗНЕС-АНАЛИЗА
Глава 1. Технологии анализа данных
Глава 2. Консолидация данных
Глава 3. Трансформация данных
Глава 4. Визуализация данных
Глава 5. Очистка и предобработка данных
Глава 6. Data Mining: задача ассоциации
Глава 7. Data Mining: кластеризация
Глава 8. Data Mining: классификация и регрессия. Статистические методы
Глава 9. Data Mining: классификация и регрессия. Машинное обучение
Глава 10. Анализ и прогнозирование временных рядов
Глава 11. Ансамбли моделей
Глава 12. Сравнение моделей
ЧАСТЬ II. БИЗНЕС-АНАЛИЗ В DEDUCTOR
Глава 13. Аналитическая платформа Deductor
Глава 14. Консолидация данных и аналитическая отчетность аптечной сети
Глава 15. Ассоциативные правила в стимулировании розничных продаж
Глава 16. Сегментация клиентов телекоммуникационной компании
Глава 17. Скоринговые модели для оценки кредитоспособности заемщиков
Глава 18. Прогнозирование продаж товаров в оптовой компании
Глава 19. Повышение эффективности массовой рассылки клиентам. .
Заключение
Литература
Алфавитный указатель
Оглавление
Предисловие авторов
Об авторах
От издательства
Вступительное слово
Введение
Современная бизнес-аналитика
ЧАСТЬ I. ТЕОРИЯ БИЗНЕС-АНАЛИЗА
Глава 1. Технологии анализа данных
1.1. Введение в анализ данных
1.2. Принципы анализа данных
1.3. Структурированные данные
1.4. Подготовка данных к анализу
1.5. Технологии KDD и Data Mining
1.6. Аналитические платформы
1.7. Введение в алгоритмы Data Mining
Глава 2. Консолидация данных
2.1. Задача консолидации
2.2. Введение в хранилища данных
2.3. Основные концепции хранилищ данных
2.4. Многомерные хранилища данных
2.5. Реляционные хранилища данных
2.6. Гибридные хранилища данных
2.7. Виртуальные хранилища данных
2.8. Нечеткие срезы
2.9. Введение в ETL
2.10. Извлечение данных в ETL
2.11. Очистка данных в ETL
2.12. Преобразование данных в ETL
2.13. Загрузка данных в хранилище
2.14. Загрузка данных из локальных источников
2.15. Обогащение данных
Глава 3. Трансформация данных
3.1. Введение в трансформацию данных
3.2. Трансформация упорядоченных данных
3.3. Группировка данных
3.4. Слияние данных
3.5. Квантование
3.6. Нормализация и кодирование данных
Глава 4. Визуализация данных
4.1. Введение в визуализацию
4.2. Визуализаторы общего назначения
4.3. OLAP-анализ
4.4. Визуализаторы для оценки качества моделей
4.5. Визуализаторы, применяемые для интерпретации результатов анализа
Глава 5. Очистка и предобработка данных
5.1. Оценка качества данных
5.2. Технологии и методы оценки качества данных
5.3. Очистка и предобработка
5.4. Фильтрация данных
5.5. Обработка дубликатов и противоречий
5.6. Выявление аномальных значений
5.7. Восстановление пропущенных значений
5.8. Введение в сокращение размерности
5.9. Сокращение числа признаков
5.10. Сокращение числа значений признаков и записей
5.11. Сэмплинг
Глава 6. Data Mining: задача ассоциации
6.1. Ассоциативные правила
6.2. Алгоритм Apriori
6.3. Иерархические ассоциативные правила
6.4. Последовательные шаблоны
Глава 7. Data Mining: кластеризация
7.1. Введение в кластеризацию
7.2. Алгоритм кластеризации k-means
7.3. Сети Кохонена
7.4. Карты Кохонена
7.5. Проблемы алгоритмов кластеризации
Глава 8. Data Mining: классификация и регрессия.
Статистические методы
8.1. Введение в классификацию и регрессию
8.2. Простая линейная регрессия
8.3. Оценка соответствия простой линейной регрессии реальным данным
8.4. Простая регрессионная модель
8.5. Множественная линейная регрессия
8.6. Модель множественной линейной регрессии
8.7. Регрессия с категориальными входными переменными
8.8. Методы отбора переменных в регрессионные модели
8.9. Ограничения применимости регрессионных моделей
8.10. Основы логистической регрессии
8.11. Интерпретация модели логистической регрессии
8.12. Множественная логистическая регрессия
8.13. Простой байесовский классификатор
Глава 9. Data Mining: классификация и регрессия. Машинное обучение
9.1. Введение в деревья решений
9.2. Алгоритмы построения деревьев решений
9.3. Алгоритмы ЮЗ и С4.5
9.4. Алгоритм CART
9.5. Упрощение деревьев решений
9.6. Введение в нейронные сети
9.7. Искусственный нейрон
9.8. Принципы построения нейронных сетей
9.9. Процесс обучения нейронной сети
9.10. Алгоритмы обучения нейронных сетей
9.11. Алгоритм обратного распространения ошибки
Глава 10. Анализ и прогнозирование временных рядов
10.1. Введение в прогнозирование
10.2. Временной ряд и его компоненты
10.3. Модели прогнозирования
10.4. Прогнозирование в торговле и логистике
Глава 11. Ансамбли моделей
11.1. Введение в ансамбли моделей
11.2. Бэггинг
11.3. Бустинг
11.4. Альтернативные методы построения ансамблей
Глава 12. Сравнение моделей
12.1. Оценка эффективности и сравнение моделей
12.2. Оценка ошибки модели
12.3. Издержки ошибочной классификации
12.4. Lift- и Profit-кривые
12.5. ROC-анализ
12.6. Обучение в условиях несбалансированности классов
ЧАСТЬ II. БИЗНЕС-АНАЛИЗ В DEDUCTOR Глава 13. Аналитическая платформа Deductor
Глава 14. Консолидация данных и аналитическая отчетность аптечной сети
Глава 15. Ассоциативные правила в стимулировании розничных продаж
Глава 16. Сегментация клиентов телекоммуникационной компании
Глава 17. Скоринговые модели для оценки кредитоспособности заемщиков
Глава 18. Прогнозирование продаж товаров в оптовой компании
Глава 19. Повышение эффективности массовой рассылки клиентам
Заключение
Литература
Алфавитный указатель