Статистический анализ медицинских данных
Год выпуска: 2002 (I изд.), 2003 (II изд.), 2006 (III и IV изд.) Автор(ы): Реброва О.Ю. Число страниц: 312 Издатель: МедиаСфера |
Предлагаемая книга является руководством по применению статистики в медицинских - клинических и эпидемиологических - исследованиях. Описываемый подход основан на использовании пакета прикладных программ (ППП) STATISTICA фирмы StatSoft (США) для персонального компьютера, однако изложенные принципы применения статистики универсальны и могут применяться при использовании любых пакетов статистических программ.
Тем, кто знаком с основами статистики, книга поможет освоить технологию анализа данных с использованием ППП STATISTICA. Книга снабжена аннотированным списком дополнительной литературы, которой читатель может воспользоваться при желании глубже освоить те или иные методы статистики.
В первой главе излагаются основные понятия доказательной медицины и клинической эпидемиологии, использование принципов которых при проведении исследований приобретает в мировой медицинской науке и практике все более важное значение. Показана определяющая роль статистического анализа при планировании исследования и обработке его результатов.
В последующих главах изложены основные подходы к подготовке и статистическому анализу данных, а также преставлению результатов исследования. Подробно описаны методы анализа, которые наиболее часто рекомендуется применять в медицинских исследованиях, а также приводятся примеры для каждого метода. Даны пояснения по содержанию интерфейсных окон ППП STATISTICA.
Кратко описаны методы многофакторного статистического анализа, которые являются более сложными и должны, по мнению автора, использоваться только специалистами в области медицинской статистики. Однако знание возможностей многомерных методов необходимо каждому исследователю, работающему в медицинской науке.
Необходимо подчеркнуть, что целью создания книги было не освещение всего широкого спектра статистических методов, изложенных в ППП STATISTICA, а подробное описание лишь основных, наиболее важных способов анализа данных клинических исследований.
Выбор ППП STATISTICA для иллюстрации методов анализа данных обусловлен его широким распространением в России, достаточными возможностями для решения основных задач медицинских исследований, а также выпуском в 1999 г. русскоязычной версии пакета. Изложение рассчитано на читателя, обладающего навыками работы в среде Windows. В связи с тем, что в России также широко распространена оригинальная англоязычная версия ППП STATISTICA, в тексте приведены англоязычные аналоги большинства терминов и понятий.
Книга является обобщением опыта автора в области статистического анализа данных научных исследований, проводимых в клинической медицине.
СОДЕРЖАНИЕ
Предисловие автора
Глава 1. Доказательная медицина и планирование научных исследований
1.1. Основные понятия доказательной медицины
1.2. Источники научнообоснованной медицинской информации
1.3. Определение цели исследования
1.4. Планирование исследования
1.4.1. Типы исследований
1.4.2. Достоверность и обобщаемость результатов исследования
1.4.3. Систематические и случайные ошибки
1.5. Некоторые вопросы планирования клинических испытаний
1.5.1. Виды структуры клинических испытаний
1.5.2. Распределение участников по группам в рандомизированных клинических испытаниях
1.5.3. Маскирование вмешательства
Глава 2. Типы данных
Глава 3. Подготовка данных к статистическому анализу
3.1. Подготовка первичных данных
3.1.1. Оценка точности данных
3.1.2. Предварительные расчеты
3.1.3. Идентификация участников (объектов) исследования
3.1.4. Пропущенные (отсутствующие) значения данных
3.1.5. Данные динамических исследований
3.1.6. Данные для анализа времени до наступления исхода
3.1.7. Проверка данных
3.1.8. Перенос данных, подготовленных в других программах,
в таблицу данных пакета прикладных программ STATISTICA
3.2. Подготовка вторичных данных
Глава 4. Управление данными и сохранение результатов анализа в пакете прикладных программ STATISTICA
4.1. Отбор строк таблицы данных по условию
4.2. Формирование подгрупп (разделение файлов)
4.3. Объединение файлов
4.4. Операции со столбцами
4.5. Операции со строками
4.6. Сохранение результатов статистического анализа
Глава 5. Основные принципы и методы статистического анализа
5.1. Описательная статистика и статистическая оценка
5.2. Проверка статистических гипотез
5.3. Статистическое моделирование
5.4. Статистическая и клиническая значимость полученных результатов
5.5. Первичный и вторичный анализ данных
5.6. Классификация статистических методов
Глава 6. Методы статистического анализа, содержащиеся в пакете прикладных программ STATISTICA
Глава 7. Описание количественных признаков
7.1. Анализ соответствия вида распределения признака закону нормального распределения
7.2. Описание количественных данных в зависимости от вида их распределения
7.3. Некоторые частные аспекты представления количественных данных
7.3.1. Точность представления описательных статистик количественных данных
7.3.2. Данные связанных групп
7.3.3. Преобразование количественных данных
7.3.4. Описание данных, полученных в малых выборках
7.3.5. Анализ выпадающих данных
Глава 8. Сравнение групп по количественному признаку
8.1. Сравнение одной выборки с популяцией
8.1.1. Случай нормально распределенного признака
8.1.2. Случай любого распределения признака
8.2. Сравнение двух независимых (несвязанных) групп
8.2.1. Доверительный интервал для разности средних
8.2.2. Параметрический метод (t-критерий Стьюдента для независимых групп)
8.2.3. Непараметрические методы (критерии Манна—Уитни,
Вальда—Вольфовица, Колмогорова—Смирнова)
8.3. Сравнение двух зависимых (связанных) групп
8.3.1. Доверительный интервал для средней разности
8.3.2. Параметрический метод (t-критерий Стьюдента для зависимых групп)
8.3.3. Непараметрические методы (критерий знаков, критерий Вилкоксона)
8.4. Сравнение трех независимых (несвязанных) групп и более
8.4.1. Параметрический дисперсионный анализ
8.4.1.1. Проверка гипотез о равенстве дисперсий
8.4.1.2. Собственно дисперсионный анализ
8.4.1.3. Апостериорные сравнения групп
8.4.2. Непараметрические методы сравнения независимых групп
(метод Краскел—Уоллиса, медианный тест)
8.5. Сравнение трех связанных (зависимых) групп и более (непараметрический метод Фридмена)
Глава 9. Описание качественных признаков
9.1. Вычисление параметров распределения качественных признаков
9.2. Вычисление абсолютных и относительных частот (долей, процентов, вероятностей, шансов)
9.3. Описание относительной частоты бинарного признака с использованием доверительного интервала
Глава 10. Сравнение групп по качественному признаку
10.1. Сравнение наблюдаемых и ожидаемых частот (анализ одной группы)
10.2. Сравнение двух групп
Глава 11. Сравнение групп по качественному бинарному признаку
11.1. Сравнение выборочной относительной частоты с популяционной
11.1.1. Сравнение доверительного интервала для выборочной относительной частоты с популяционной
11.1.2. Проверка гипотез (z-критерий)
11.1.3. Проверка гипотез (критерий хи-квадрат)
11.2. Сравнение относительных частот внутри одной группы и в двух группах
11.3. Сравнение частот бинарного признака в двух несвязанных (независимых) группах (анализ таблиц 2х2)
11.3.1. Доверительный интервал для разности относительных частот
11.3.2. Доверительный интервал для относительного риска
11.3.3. Доверительный интервал для отношения шансов
11.3.4. Проверка гипотез (точный критерий Фишера, хи-квадрат с поправкой Йетса)
11.4. Сравнение частот бинарного признака в двух связанных (зависимых) группах
11.4.1. Доверительный интервал для разности относительных частот
11.4.2. Проверка гипотез (критерий МакНемара)
11.5. Сравнение трех групп и более по бинарному признаку
11.5.1. Случай неупорядоченных групп
11.5.2. Случай упорядоченных групп
Глава 12. Анализ связи (корреляции, ассоциации) двух признаков
12.1. Параметрический метод (метод Пирсона)
12.2. Непараметрические методы (методы Спирмена, Кендалла, гамма)
12.3. Доверительный интервал для коэффициента корреляции
12.4. Сравнение двух коэффициентов корреляции
Глава 13. Многофакторный анализ данных
13.1. Многофакторный параметрический дисперсионный анализ
13.2. Дискриминантный анализ
13.3. Кластерный анализ
13.4. Анализ главных компонент и факторный анализ
13.5. Многофакторный анализ наблюдений (объектов исследования) с пропущенными значениями
13.6. Проверка работоспособности многофакторных моделей
Глава 14. Анализ вида зависимости одного признака от одного или нескольких признаков (регрессионный анализ)
14.1. Линейный регрессионный анализ
14.2. Логистическая регрессия как один из методов нелинейного регрессионного анализа
Глава 15. Некоторые общие проблемы и частные задачи статистического анализа
15.1. Проблема множественных сравнений
15.2. Определение интервала нормы (референтного интервала) для количественного признака
15.3. Определение необходимых объемов выборок при планировании исследования. Статистическая мощность (чувствительность) исследования
15.4. Анализ времени до наступления исхода
15.4.1. Анализ вероятности наступления изучаемого исхода в определенный период времени
(выживания)
15.4.2. Исследование влияния одного фактора на время до наступления изучаемого исхода
15.4.3. Анализ влияния нескольких факторов на время до наступления изучаемого исхода
15.5. Анализ точности диагностического метода
15.5.1. Операционные характеристики диагностического метода
15.5.2. Анализ согласованности независимых диагностических заключений
Глава 16. Объединение результатов нескольких исследований (мета-анализ)
Глава 17. Современные требования к описанию в публикациях процедуры и результатов статистического анализа медико-биологических данных
17.1. Рекомендации по разделу «Введение»
17.2. Рекомендации по разделу «Материалы и методы»
17.3. Рекомендации по разделу «Результаты»
17.4. Рекомендации по разделу «Обсуждение»
17.5. Описание ограничений исследования
17.6. Рекомендации по разделу «Выводы»
Литература
Приложение 1. Аннотированный список рекомендуемой литературы на русском языке
Приложение 2. Список рекомендуемой литературы на английском языке
Приложение 3. Ранги, с помощью которых вычисляется доверительный интервал для медианы распределения
Приложение 4. Нижние и верхние границы 95% доверительных интервалов для относительных частот, представленных в виде простых дробей
Толковый словарь терминов
Тем, кто знаком с основами статистики, книга поможет освоить технологию анализа данных с использованием ППП STATISTICA. Книга снабжена аннотированным списком дополнительной литературы, которой читатель может воспользоваться при желании глубже освоить те или иные методы статистики.
В первой главе излагаются основные понятия доказательной медицины и клинической эпидемиологии, использование принципов которых при проведении исследований приобретает в мировой медицинской науке и практике все более важное значение. Показана определяющая роль статистического анализа при планировании исследования и обработке его результатов.
В последующих главах изложены основные подходы к подготовке и статистическому анализу данных, а также преставлению результатов исследования. Подробно описаны методы анализа, которые наиболее часто рекомендуется применять в медицинских исследованиях, а также приводятся примеры для каждого метода. Даны пояснения по содержанию интерфейсных окон ППП STATISTICA.
Кратко описаны методы многофакторного статистического анализа, которые являются более сложными и должны, по мнению автора, использоваться только специалистами в области медицинской статистики. Однако знание возможностей многомерных методов необходимо каждому исследователю, работающему в медицинской науке.
Необходимо подчеркнуть, что целью создания книги было не освещение всего широкого спектра статистических методов, изложенных в ППП STATISTICA, а подробное описание лишь основных, наиболее важных способов анализа данных клинических исследований.
Выбор ППП STATISTICA для иллюстрации методов анализа данных обусловлен его широким распространением в России, достаточными возможностями для решения основных задач медицинских исследований, а также выпуском в 1999 г. русскоязычной версии пакета. Изложение рассчитано на читателя, обладающего навыками работы в среде Windows. В связи с тем, что в России также широко распространена оригинальная англоязычная версия ППП STATISTICA, в тексте приведены англоязычные аналоги большинства терминов и понятий.
Книга является обобщением опыта автора в области статистического анализа данных научных исследований, проводимых в клинической медицине.
СОДЕРЖАНИЕ
Предисловие автора
Глава 1. Доказательная медицина и планирование научных исследований
1.1. Основные понятия доказательной медицины
1.2. Источники научнообоснованной медицинской информации
1.3. Определение цели исследования
1.4. Планирование исследования
1.4.1. Типы исследований
1.4.2. Достоверность и обобщаемость результатов исследования
1.4.3. Систематические и случайные ошибки
1.5. Некоторые вопросы планирования клинических испытаний
1.5.1. Виды структуры клинических испытаний
1.5.2. Распределение участников по группам в рандомизированных клинических испытаниях
1.5.3. Маскирование вмешательства
Глава 2. Типы данных
Глава 3. Подготовка данных к статистическому анализу
3.1. Подготовка первичных данных
3.1.1. Оценка точности данных
3.1.2. Предварительные расчеты
3.1.3. Идентификация участников (объектов) исследования
3.1.4. Пропущенные (отсутствующие) значения данных
3.1.5. Данные динамических исследований
3.1.6. Данные для анализа времени до наступления исхода
3.1.7. Проверка данных
3.1.8. Перенос данных, подготовленных в других программах,
в таблицу данных пакета прикладных программ STATISTICA
3.2. Подготовка вторичных данных
Глава 4. Управление данными и сохранение результатов анализа в пакете прикладных программ STATISTICA
4.1. Отбор строк таблицы данных по условию
4.2. Формирование подгрупп (разделение файлов)
4.3. Объединение файлов
4.4. Операции со столбцами
4.5. Операции со строками
4.6. Сохранение результатов статистического анализа
Глава 5. Основные принципы и методы статистического анализа
5.1. Описательная статистика и статистическая оценка
5.2. Проверка статистических гипотез
5.3. Статистическое моделирование
5.4. Статистическая и клиническая значимость полученных результатов
5.5. Первичный и вторичный анализ данных
5.6. Классификация статистических методов
Глава 6. Методы статистического анализа, содержащиеся в пакете прикладных программ STATISTICA
Глава 7. Описание количественных признаков
7.1. Анализ соответствия вида распределения признака закону нормального распределения
7.2. Описание количественных данных в зависимости от вида их распределения
7.3. Некоторые частные аспекты представления количественных данных
7.3.1. Точность представления описательных статистик количественных данных
7.3.2. Данные связанных групп
7.3.3. Преобразование количественных данных
7.3.4. Описание данных, полученных в малых выборках
7.3.5. Анализ выпадающих данных
Глава 8. Сравнение групп по количественному признаку
8.1. Сравнение одной выборки с популяцией
8.1.1. Случай нормально распределенного признака
8.1.2. Случай любого распределения признака
8.2. Сравнение двух независимых (несвязанных) групп
8.2.1. Доверительный интервал для разности средних
8.2.2. Параметрический метод (t-критерий Стьюдента для независимых групп)
8.2.3. Непараметрические методы (критерии Манна—Уитни,
Вальда—Вольфовица, Колмогорова—Смирнова)
8.3. Сравнение двух зависимых (связанных) групп
8.3.1. Доверительный интервал для средней разности
8.3.2. Параметрический метод (t-критерий Стьюдента для зависимых групп)
8.3.3. Непараметрические методы (критерий знаков, критерий Вилкоксона)
8.4. Сравнение трех независимых (несвязанных) групп и более
8.4.1. Параметрический дисперсионный анализ
8.4.1.1. Проверка гипотез о равенстве дисперсий
8.4.1.2. Собственно дисперсионный анализ
8.4.1.3. Апостериорные сравнения групп
8.4.2. Непараметрические методы сравнения независимых групп
(метод Краскел—Уоллиса, медианный тест)
8.5. Сравнение трех связанных (зависимых) групп и более (непараметрический метод Фридмена)
Глава 9. Описание качественных признаков
9.1. Вычисление параметров распределения качественных признаков
9.2. Вычисление абсолютных и относительных частот (долей, процентов, вероятностей, шансов)
9.3. Описание относительной частоты бинарного признака с использованием доверительного интервала
Глава 10. Сравнение групп по качественному признаку
10.1. Сравнение наблюдаемых и ожидаемых частот (анализ одной группы)
10.2. Сравнение двух групп
Глава 11. Сравнение групп по качественному бинарному признаку
11.1. Сравнение выборочной относительной частоты с популяционной
11.1.1. Сравнение доверительного интервала для выборочной относительной частоты с популяционной
11.1.2. Проверка гипотез (z-критерий)
11.1.3. Проверка гипотез (критерий хи-квадрат)
11.2. Сравнение относительных частот внутри одной группы и в двух группах
11.3. Сравнение частот бинарного признака в двух несвязанных (независимых) группах (анализ таблиц 2х2)
11.3.1. Доверительный интервал для разности относительных частот
11.3.2. Доверительный интервал для относительного риска
11.3.3. Доверительный интервал для отношения шансов
11.3.4. Проверка гипотез (точный критерий Фишера, хи-квадрат с поправкой Йетса)
11.4. Сравнение частот бинарного признака в двух связанных (зависимых) группах
11.4.1. Доверительный интервал для разности относительных частот
11.4.2. Проверка гипотез (критерий МакНемара)
11.5. Сравнение трех групп и более по бинарному признаку
11.5.1. Случай неупорядоченных групп
11.5.2. Случай упорядоченных групп
Глава 12. Анализ связи (корреляции, ассоциации) двух признаков
12.1. Параметрический метод (метод Пирсона)
12.2. Непараметрические методы (методы Спирмена, Кендалла, гамма)
12.3. Доверительный интервал для коэффициента корреляции
12.4. Сравнение двух коэффициентов корреляции
Глава 13. Многофакторный анализ данных
13.1. Многофакторный параметрический дисперсионный анализ
13.2. Дискриминантный анализ
13.3. Кластерный анализ
13.4. Анализ главных компонент и факторный анализ
13.5. Многофакторный анализ наблюдений (объектов исследования) с пропущенными значениями
13.6. Проверка работоспособности многофакторных моделей
Глава 14. Анализ вида зависимости одного признака от одного или нескольких признаков (регрессионный анализ)
14.1. Линейный регрессионный анализ
14.2. Логистическая регрессия как один из методов нелинейного регрессионного анализа
Глава 15. Некоторые общие проблемы и частные задачи статистического анализа
15.1. Проблема множественных сравнений
15.2. Определение интервала нормы (референтного интервала) для количественного признака
15.3. Определение необходимых объемов выборок при планировании исследования. Статистическая мощность (чувствительность) исследования
15.4. Анализ времени до наступления исхода
15.4.1. Анализ вероятности наступления изучаемого исхода в определенный период времени
(выживания)
15.4.2. Исследование влияния одного фактора на время до наступления изучаемого исхода
15.4.3. Анализ влияния нескольких факторов на время до наступления изучаемого исхода
15.5. Анализ точности диагностического метода
15.5.1. Операционные характеристики диагностического метода
15.5.2. Анализ согласованности независимых диагностических заключений
Глава 16. Объединение результатов нескольких исследований (мета-анализ)
Глава 17. Современные требования к описанию в публикациях процедуры и результатов статистического анализа медико-биологических данных
17.1. Рекомендации по разделу «Введение»
17.2. Рекомендации по разделу «Материалы и методы»
17.3. Рекомендации по разделу «Результаты»
17.4. Рекомендации по разделу «Обсуждение»
17.5. Описание ограничений исследования
17.6. Рекомендации по разделу «Выводы»
Литература
Приложение 1. Аннотированный список рекомендуемой литературы на русском языке
Приложение 2. Список рекомендуемой литературы на английском языке
Приложение 3. Ранги, с помощью которых вычисляется доверительный интервал для медианы распределения
Приложение 4. Нижние и верхние границы 95% доверительных интервалов для относительных частот, представленных в виде простых дробей
Толковый словарь терминов
Назад в раздел