(увеличить обложку)
|
В книге излагаются основы статистического обучения для решения практических задач, возникающих в медицине, биологии, финансах и многих других отраслях науки и промышленности. В частности, рассматриваются основные понятия и методы статистического обучения: линейная регрессия, нелинейная регрессия, линейные методы классификации, регуляризация, ядерное сглаживание, оценивание и выбор моделей, аддитивные модели, деревья классификации, нейронные сети, случайные леса и многое другое. Авторы приводят множество примеров и иллюстраций применения этих методов на практике. Авторы книги являются выдающимися авторитетами в математической статистике и машинном обучении: Тревор Хасти — обладатель звания ISI Highly Cited Author in Mathematics по версии ISI Web of Knowledge, Роберт Тибширани — изобретатель метода LASSO и обладатель Золотой медали Статистического общества Канады, Джером Фридман — широко известный специалист по машинному обучению и автор многочисленных монографий. Книга представляет огромный интерес для специалистов. В течение последнего десятилетия произошел взрыв в области вычислений и информационных технологий. Вместе с ним появились огромные объемы данных в различных областях, таких как медицина, биология, финансы и маркетинг. Проблема понимания этих данных привела к разработке новых статистических инструментов и породила новые научные дисциплины, такие как интеллектуальный анализ данных, машинное обучение и биоинформатика. Многие из этих инструментов имеют общие научные основания, но часто описываются с помощью другой терминологии. В настоящей книге описываются важные идеи в этих областях с единой теоретической точки зрения. Хотя этот подход является статистическим, упор делается на концепции, а не на математику. Приводится много примеров с широким использованием цветной графики. Книга представляет собой ценный источник информации для статистиков и всех, кто интересуется интеллектуальным анализом данных в науке или промышленности. Охват книги широк: от обучения с учителем (прогнозирования) до обучения без учителя. В ней описаны нейронные сети, метод опорных векторов, деревья классификации и бустинг, который впервые всесторонне рассмотрен в книге, а не в отдельных публикациях. В данном глубоко переработанном издании представлены многие темы, не охваченные в первом издании, включая графовые модели, случайные леса, ансамблевые методы, алгоритмы регрессии наименьших углов и алгоритмы построения траекторий для методов LASSO, неотрицательной факторизации матриц и спектральной кластеризации. В книге также есть глава о методах анализа "широких" данных (когда p больше, чем n), включая множественное тестирование и долю ложных отклонений гипотезы. Книга обсуждается в отдельном сообщении в блоге Виктора Штонда. Об авторахТревор Хасти, Роберт Тибширани и Джером Фридман — профессора статистики в Стэнфордском университете. Они являются выдающимися исследователями в этой области. В частности, Хасти и Тибширани разработали обобщенные аддитивные модели и написали популярную книгу с таким названием. Хасти в составе коллектива разработчиков разработал значительную часть программного обеспечения и среды для статистического моделирования на языках R и S-PLUS, а также изобрел метод главных кривых и поверхностей. Тибширани изобрел метод LASSO и является соавтором очень успешной книги An Introduction to the Bootstrap. Фридман является соавтором многих методов интеллектуального анализа данных, в том числе CART, MARS, поиска наилучшей проекции и градиентного бустинга. Все иллюстрации к книге в цветном варианте доступны на сайте издательства по адресу: http://go.dialektika.com/elements |
Оглавление
Предисловие ко второму изданию 18
Предисловие к первому изданию 21
Глава 1. Введение 23
Глава 2. Обзор методов обучения с учителем 31
Глава 3. Линейные методы регрессии 65
Глава 4. Линейные методы классификации 125
Глава 5. Разложение по базису и регуляризация 163
Глава 6. Ядерные методы сглаживания 213
Глава 7. Оценивание и выбор моделей 243
Глава 8. Вывод моделей и усреднение 285
Глава 9. Аддитивные модели, деревья и связанные с ними методы 319
Глава 10. Бустинг и аддитивные деревья 363
Глава 11. Нейронные сети 415
Глава 12. Метод опорных векторов и гибкие дискриминанты 445
Глава 13. Методы прототипов и ближайших соседей 487
Глава 14. Обучение без учителя 513
Глава 15. Случайные леса 617
Глава 16. Ансамблевые методы обучения 635
Глава 17. Неориентированные графовые модели 655
Глава 18. Задачи высокой размерности: p >> N 681
Библиография 733
Предметный указатель
|
Copyright © 1992-2020 Издательская группа "Диалектика-Вильямс"
|