0
В книге представлены основные концепции байесовской статистики и ее практическая реализация на языке Python с использованием современной библиотеки вероятностного программирования PyMC3 и новой библиотеки исследовательского анализа байесовских моделей ArviZ.
Полученные знания о вероятностном моделировании позволят вам самостоятельно проектировать и реализовать байесовские модели для собственных задач научной обработки данных.
Издание будет полезно всем специалистам по анализу данных, использующих в своей работе байесовское моделирование.
Вступительное слово
Об авторе
О рецензентах
Предисловие
Глава 1. Вероятностное мышление
Статистика, модели и подход, принятый в этой книге
Работа с данными
Байесовское моделирование
Теория вероятностей
Объяснение смысла вероятностей
Определение вероятности
Байесовский вывод с одним параметром
Задача о подбрасывании монеты
Взаимодействие с байесовским анализом
Нотация и визуализация модели
Обобщение апостериорного распределения
Проверки апостериорного прогнозируемого распределения
Резюме
Упражнения
Глава 2. Вероятностное программирование
Вероятностное программирование
Основы использования библиотеки PyMC3
Решение задачи о подбрасывании монет с использованием библиотеки PyMC3
Обобщение апостериорного распределения
Решения на основе апостериорного распределения
Гауссова модель в подробном изложении
Гауссовы статистические выводы
Надежные статистические выводы
Сравнение групп
d-мера Коэна
Вероятность превосходства
Набор данных tips
Иерархические модели
Редуцирование
Еще один пример
Резюме
Упражнения
Глава 3. Моделирование с использованием линейной регрессии
Простая линейная регрессия
Связь с машинным обучением
Сущность моделей линейной регрессии
Линейные модели и сильная автокорреляция
Интерпретация и визуальное представление апостериорного распределения
Коэффициент корреляции Пирсона
Робастная линейная регрессия
Иерархическая линейная регрессия
Корреляция, причинно-следственная связь и беспорядочность жизни
Полиномиальная регрессия
Интерпретация параметров полиномиальной регрессии
Является ли полиномиальная регрессия конечной моделью
Множественная линейная регрессия
Спутывающие переменные и избыточные переменные
Мультиколлинеарность или слишком сильная корреляция
Маскировочный эффект переменных
Добавление взаимодействий
Дисперсия переменной
Резюме
Упражнения
Глава 4. Обобщение линейных моделей
Обобщенные линейные модели
Логистическая регрессия
Логистическая модель
Набор данных iris
Множественная логистическая регрессия
Граница решения
Реализация модели
Интерпретация коэффициентов логистической регрессии
Обработка коррелирующих переменных
Работа с несбалансированными классами
Регрессия с использованием функции softmax
Дискриминативные и порождающие модели
Регрессия Пуассона
Распределение Пуассона
Модель Пуассона с дополнением нулевыми значениями
Регрессия Пуассона и модель Пуассона с дополнением нулевыми значениями
Робастная логистическая регрессия
Модуль GLM
Резюме
Упражнения
Глава 5. Сравнение моделей
Проверки прогнозируемого апостериорного распределения
Лезвие Оккама – простота и точность
Лишние параметры приводят к переподгонке
Недостаточное количество параметров приводит к недоподгонке
Баланс между простотой и точностью
Измерения прогнозируемой точности
Информационные критерии
Логарифмическая функция правдоподобия и отклонение
Информационный критерий Акаике
Часто применяемый информационный критерий
Парето-сглаженная выборка по значимости для перекрестной проверки LOOCV
Другие информационные критерии
Сравнение моделей с помощью библиотеки PyMC3
Усреднение моделей
Коэффициенты Байеса
Некоторые дополнительные замечания
Коэффициенты Байеса и информационные критерии
Регуляризация априорных распределений
Более подробно об информационном критерии WAIC
Энтропия
Расхождение Кульбака–Лейблера
Резюме
Упражнения
Глава 6. Смешанные модели
Смешанные модели
Конечные смешанные модели
Категориальное распределение
Распределение Дирихле
Неидентифицируемость смешанных моделей
Как правильно выбрать число K
Смешанные модели и кластеризация
Смешанные модели с бесконечной размерностью
Процесс Дирихле
Непрерывные смешанные модели
Биномиальное бета-распределение и отрицательное биномиальное распределение
t-распределение Стьюдента
Резюме
Упражнения
Глава 7. Гауссовы процессы
Линейные модели и нелинейные данные
Функции моделирования
Многомерные гауссовы распределения и функции
Ковариационные функции и ядра
Гауссовы процессы
Регрессия на основе гауссовых процессов
Регрессия с пространственной автокорреляцией
Классификация с использованием гауссова процесса
Процессы Кокса
Модель катастроф в угледобывающей промышленности
Набор данных redwood
Резюме
Упражнения
Глава 8. Механизмы статистического вывода
Механизмы статистического вывода
Немарковские методы
Грид-вычисления
Метод квадратической аппроксимации
Вариационные методы
Марковские методы
Метод Монте-Карло
Цепи Маркова
Алгоритм Метрополиса–Гастингса
Метод Монте-Карло с использованием механики Гамильтона
Последовательный метод Монте-Карло
Диагностирование выборок
Сходимость
Ошибка метода Монте-Карло
Автокорреляция
Эффективный размер выборки
Расхождения
Резюме
Упражнения
Глава 9. Что дальше?
Предметный указатель
Название: Байесовский анализ на Python
Автор: Освальдо Мартин
Год: 2020
Жанр: программирование, компьютерная
Издательство: М.: ДМК Пресс
Язык: Русский
Формат: pdf
Качество: eBook
Страниц: 340
Размер: 19 MB
Скачать Освальдо Мартин - Байесовский анализ на Python (2020)