R предоставляет широкий набор функций для статистического анализа — от простых статистических данных до сложных. В R и пакеты R встроено несколько статистических функций. Статистические функции R делятся на несколько категорий, включая центральную тенденцию и изменчивость, относительное положение, t-критерии, дисперсионный анализ и регрессионный анализ.
Базовые статистические функции R для центральной тенденции и изменчивости
Вот подборка статистических функций, связанных со средней тенденцией и изменчивостью, которые входят в стандартную установку R. Многие другие функции вы найдёте в пакетах R.
Каждая из этих статистических функций состоит из имени функции, за которым сразу следуют скобки, например mean()
, , и var()
. Внутри скобок находятся аргументы. В данном контексте «аргумент» не означает «несогласие», «конфронтацию» или что-то подобное. Это просто математический термин для обозначения того, с чем работает функция.
Функция | Что он вычисляет | |
mean(x) | Среднее значение чисел в векторе x . | |
median(x) | Медиана чисел в векторе x | |
var(x) | Оценочная дисперсия генеральной совокупности, из которой выбираются числа в векторе x | |
sd(x) | Оценочное стандартное отклонение генеральной совокупности, из которой выбираются числа в векторе x | |
scale(x) | Стандартные оценки (z-оценки) для чисел в векторе x |
Базовые статистические функции R для относительного положения
Ниже представлен выбор статистических функций R, связанных с относительным положением.
Функция | Что он вычисляет |
sort(x) | Числа в векторе x в порядке возрастания |
sort(x)[n] | N-ное наименьшее число в векторе x |
rank(x) | Ранги чисел (в порядке возрастания) в векторе x |
rank(-x) | Ранги чисел (в порядке убывания) в векторе x |
rank(x, ties.method= “average”) | Ранги чисел (в порядке возрастания) в векторе x , причем для равных чисел задано среднее арифметическое рангов, которых могли бы достичь равные числа. |
rank(x, ties.method= “min”) | Ранги чисел (в порядке возрастания) в векторе x , причем для равных чисел задан минимальный из рангов, которых могли бы достичь равные числа. |
rank(x, ties.method = “max”) | Ранги чисел (в порядке возрастания) в векторе x , причем для равных чисел задан максимальный из рангов, которых могли бы достичь равные числа. |
quantile(x) | 0- й , 25- й , 50- й , 75- й и 100 -й процентили (т. е. квартили ) чисел в векторе x . (Это не опечатка: quantile(x) возвращает квартили x .) |
Функции t-теста для статистического анализа с помощью R
Ниже представлен выбор статистических функций R, связанных с t-тестами.
Функция | Что он вычисляет |
t.test(x,mu=n, alternative = “two.sided”) | Двусторонний t-тест того, что среднее значение чисел в векторе x отличается от n . |
t.test(x,mu=n, alternative = “greater”) | Односторонний t-тест того, что среднее значение чисел в векторе x больше n . |
t.test(x,mu=n, alternative = “less”) | Односторонний t-тест того, что среднее значение чисел в векторе x меньше n . |
t.test(x,y,mu=0, var.equal = TRUE, alternative = “two.sided”) | Двусторонний t-критерий Стьюдента для проверки того, что среднее значение чисел в векторе x отличается от среднего значения чисел в векторе y . Дисперсии в двух векторах предполагаются равными. |
t.test(x,y,mu=0, alternative = “two.sided”, paired = TRUE) | Двусторонний t-критерий Стьюдента показывает, что среднее значение чисел в векторе x отличается от среднего значения чисел в векторе y . Векторы представляют собой согласованные выборки. |
Функции ANOVA и регрессионного анализа для статистического анализа с R
Ниже представлен набор статистических функций R, имеющих отношение к дисперсионному анализу (ANOVA), а также корреляции и регрессии.
При проведении дисперсионного анализа (ANOVA) или регрессионного анализа сохраняйте результаты анализа в списке. Например,
a <- lm(y~x, data = d)
Затем, чтобы просмотреть табличные результаты, используйте функцию summary():
summary(a)
Дисперсионный анализ (ANOVA)
Функция | Что он вычисляет |
aov(y~x, data = d) | Однофакторный дисперсионный анализ (ANOVA), где числа в векторе y служат зависимой переменной, а элементы вектора x — уровнями независимой переменной. Данные представлены в таблице данных d . |
aov(y~x + Error(w/x), data = d) | Дисперсионный анализ с повторными измерениями, где числа в векторе y выступают в качестве зависимой переменной, а элементы в векторе x — в качестве уровней независимой переменной. Ошибка (w/x) означает, что каждый элемент вектора w испытывает все уровни x (т.е. x — это повторное измерение). Данные находятся в таблице данных d. |
aov(y~x*z, data = d) | Двухфакторный дисперсионный анализ (ANOVA), где числа в векторе y служат зависимой переменной, а элементы векторов x и z — уровнями двух независимых переменных. Данные представлены в таблице данных d . |
aov(y~x*z + Error(w/z), data = d) | Смешанный дисперсионный анализ (ANOVA), где числа в векторе z являются зависимой переменной, а элементы векторов x и y — уровнями двух независимых переменных. Ошибка (w/z) указывает на то, что каждый элемент вектора w испытывает все уровни z (т.е. z — это повторяющееся измерение). Данные находятся в таблице данных d . |
Корреляция и регрессия
Функция | Что он вычисляет |
cor(x,y) | Коэффициент корреляции между числами в векторе x и числами в векторе y |
cor.test(x,y) | Коэффициент корреляции между числами в векторе x и числами в векторе y , а также t-тест значимости коэффициента корреляции. |
lm(y~x, data = d) | Линейный регрессионный анализ с числами в векторе y в качестве зависимой переменной и числами в векторе x в качестве независимой переменной. Данные находятся в таблице данных d . |
coefficients(a) | Наклон и пересечение линейной регрессионной модели а . |
confint(a) | Доверительные интервалы наклона и пересечения линейной регрессионной модели а |
lm(y~x+z, data = d) | Множественный регрессионный анализ с числами в векторе y в качестве зависимой переменной и числами в векторах x и z в качестве независимых переменных. Данные представлены в таблице данных d . |