- Артикул:00-01044881
- Автор: Бенгфорт Бенджамин, Билбро Ребекка, Охеда Тони
- ISBN: 978-5-4461-1153-4
- Тираж: 1200 экз.
- Обложка: Мягкая обложка
- Издательство: Питер (все книги издательства)
- Город: СПб
- Страниц: 368
- Формат: 70x100/16
- Год: 2019
- Вес: 921 г
- Серия: Бестселлеры O’Reilly (все книги серии)
Технологии анализа текстовой информации стремительно меняются под влиянием машинного обучения. Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения. Нейронные сети способны решать самые сложные задачи обработки естественного языка, никого не удивляет машинный перевод, «беседа» с роботом в интернет-магазине, перефразирование, ответы на вопросы и поддержание диалога. Почему же Сири, Алекса и Алиса не хотят нас понимать, Google находит не то, что мы ищем, а машинные переводчики веселят нас примерами «трудностей перевода» с китайского на албанский? Ответ кроется в мелочах - в алгоритмах, которые правильно работают в теории, но сложно реализуются на практике. Научитесь применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных вы перейдете к приемам классификации и кластеризации текстов, затем приступите к визуальной интерпретации, анализу графов, а после знакомства с приемами масштабирования научитесь использовать глубокое обучение для анализа текста.
Cодержание
Вступление
Глава 1. Естественные языки и вычисления
Глава 2. Создание собственного корпуса
Глава 3. Предварительная обработка и преобразование корпуса
Глава 4. Конвейеры векторизации и преобразования
Глава 5. Классификация в текстовом анализе
Глава 6. Кластеризация для выявления сходств в тексте
Глава 7. Контекстно-зависимый анализ текста
Глава 8. Визуализация текста
Глава 9. Графовые методы анализа текста
Глава 10. Чат-боты
Глава 11. Масштабирование анализа текста
Глава 12. Глубокое обучение и не только
Глоссарий