28.09.2025
statisticheskij-analiz-na-yazyke-r

Статистический анализ на языке R

R предоставляет широкий набор функций для статистического анализа — от простых статистических данных до сложных. В R и пакеты R встроено несколько статистических функций. Статистические функции R делятся на несколько категорий, включая центральную тенденцию и изменчивость, относительное положение, t-критерии, дисперсионный анализ и регрессионный анализ.

Базовые статистические функции R для центральной тенденции и изменчивости

Вот подборка статистических функций, связанных со средней тенденцией и изменчивостью, которые входят в стандартную установку R. Многие другие функции вы найдёте в пакетах R.

Каждая из этих статистических функций состоит из имени функции, за которым сразу следуют скобки, например mean(), , и var(). Внутри скобок находятся аргументы. В данном контексте «аргумент» не означает «несогласие», «конфронтацию» или что-то подобное. Это просто математический термин для обозначения того, с чем работает функция.

ФункцияЧто он вычисляет
mean(x)Среднее значение чисел в векторе x .
median(x)Медиана чисел в векторе x
var(x)Оценочная дисперсия генеральной совокупности, из которой выбираются числа в векторе x
sd(x)Оценочное стандартное отклонение генеральной совокупности, из которой выбираются числа в векторе x
scale(x)Стандартные оценки (z-оценки) для чисел в векторе x

Базовые статистические функции R для относительного положения

Ниже представлен выбор статистических функций R, связанных с относительным положением.

ФункцияЧто он вычисляет
sort(x)Числа в векторе x в порядке возрастания
sort(x)[n]N-ное наименьшее число в векторе x
rank(x)Ранги чисел (в порядке возрастания) в векторе x
rank(-x)Ранги чисел (в порядке убывания) в векторе x
rank(x, ties.method= “average”)Ранги чисел (в порядке возрастания) в векторе x , причем для равных чисел задано среднее арифметическое рангов, которых могли бы достичь равные числа.
rank(x, ties.method=  “min”)Ранги чисел (в порядке возрастания) в векторе x , причем для равных чисел задан минимальный из рангов, которых могли бы достичь равные числа.
rank(x, ties.method = “max”)Ранги чисел (в порядке возрастания) в векторе x , причем для равных чисел задан максимальный из рангов, которых могли бы достичь равные числа.
quantile(x)0- й , 25- й , 50- й , 75- й и 100  процентили (т. е. квартили ) чисел в векторе x . (Это не опечатка: quantile(x) возвращает квартили x .)

Функции t-теста для статистического анализа с помощью R

Ниже представлен выбор статистических функций R, связанных с t-тестами.

ФункцияЧто он вычисляет
t.test(x,mu=n, alternative = “two.sided”)Двусторонний t-тест того, что среднее значение чисел в векторе x отличается от n .
t.test(x,mu=n, alternative = “greater”)Односторонний t-тест того, что среднее значение чисел в векторе x больше n .
t.test(x,mu=n, alternative = “less”)Односторонний t-тест того, что среднее значение чисел в векторе x меньше n .
t.test(x,y,mu=0, var.equal  = TRUE, alternative = “two.sided”)Двусторонний t-критерий Стьюдента для проверки того, что среднее значение чисел в векторе x отличается от среднего значения чисел в векторе y . Дисперсии в двух векторах предполагаются равными.
t.test(x,y,mu=0, alternative = “two.sided”, paired  = TRUE)Двусторонний t-критерий Стьюдента показывает, что среднее значение чисел в векторе x отличается от среднего значения чисел в векторе y . Векторы представляют собой согласованные выборки.

Функции ANOVA и регрессионного анализа для статистического анализа с R

Ниже представлен набор статистических функций R, имеющих отношение к дисперсионному анализу (ANOVA), а также корреляции и регрессии.

При проведении дисперсионного анализа (ANOVA) или регрессионного анализа сохраняйте результаты анализа в списке. Например,

a <- lm(y~x, data = d)

Затем, чтобы просмотреть табличные результаты, используйте функцию summary():

summary(a)

Дисперсионный анализ (ANOVA)

ФункцияЧто он вычисляет
aov(y~x, data = d)Однофакторный дисперсионный анализ (ANOVA), где числа в векторе y служат зависимой переменной, а элементы вектора x — уровнями независимой переменной. Данные представлены в таблице данных d .
aov(y~x + Error(w/x), data = d)Дисперсионный анализ с повторными измерениями, где числа в векторе y выступают в качестве зависимой переменной, а элементы в векторе x — в качестве уровней независимой переменной. Ошибка (w/x) означает, что каждый элемент вектора w испытывает все уровни x (т.е. x — это повторное измерение). Данные находятся в таблице данных d.
aov(y~x*z, data = d)Двухфакторный дисперсионный анализ (ANOVA), где числа в векторе y служат зависимой переменной, а элементы векторов x и z — уровнями двух независимых переменных. Данные представлены в таблице данных d .
aov(y~x*z + Error(w/z), data = d)Смешанный дисперсионный анализ (ANOVA), где числа в векторе z являются зависимой переменной, а элементы векторов x и y — уровнями двух независимых переменных. Ошибка (w/z) указывает на то, что каждый элемент вектора w испытывает все уровни z (т.е. z — это повторяющееся измерение). Данные находятся в таблице данных d .

Корреляция и регрессия

ФункцияЧто он вычисляет
cor(x,y)Коэффициент корреляции между числами в векторе x и числами в векторе y
cor.test(x,y)Коэффициент корреляции между числами в векторе x и числами в векторе y , а также t-тест значимости коэффициента корреляции.
lm(y~x, data = d)Линейный регрессионный анализ с числами в векторе y в качестве зависимой переменной и числами в векторе x в качестве независимой переменной. Данные находятся в таблице данных d .
coefficients(a)Наклон и пересечение линейной регрессионной модели а .
confint(a)Доверительные интервалы наклона и пересечения линейной регрессионной модели а
lm(y~x+z, data = d)Множественный регрессионный анализ с числами в векторе y в качестве зависимой переменной и числами в векторах x и z в качестве независимых переменных. Данные представлены в таблице данных d .