О корреляции

Автор: | 01.09.2019

Вы хотите получить более полную информацию о том, что такое корреляция между двумя выборками значений, то Вам лучше перейти сюда http://statanaliz.info/, а более точно, то сюда https://statanaliz.info/category/statistica/korrelyaciya-i-regressiya/

К предлагаемой статье есть и понятное видео.

Моя цель совершенно другая. Я предпочитаю использовать предлагаемую теорию на практике. Т.к. я программирую на VBA в Excel, то я просто проверяю полученные знания на конкретных выборках и значениях.

Если говорить о корреляции, то лучше ставить вопрос о нахождении зависимости между двумя выборками значений X и Y.

Что гласит методика, теория нахождения корреляции?

  • Сначала строим график зависимости каждого значения Y от X. Если зависимость прослеживается, то она видна на графике.
  • Если корреляция видна, то сначала находим коэффициент корреляции между X и Y и лучше по формуле Пирсона.
  • Вычисляем число записей в выборке
  • Если бы число значений в выборке было бы бесконечным, то разброс значений (дисперсия) от среднего подчинялся бы стандартному закону распределения вероятности. Т.к. число значений в выборке мало, то график справа будет урезан. Для перехода к стандартному распределению проводим преобразование Фишера.
  • Ищем стандартную ошибку
  • 95% всех отклонений попадает в ширину около 2
  • Ищем верхнюю и нижнюю границы отклонений по Фишеру
  • Ищем верхнюю и нижнюю границы отклонения корреляции, используя обратное преобразование Фишера.

 

Моя цель состоит в том, чтобы программно рассчитать коэффициент корреляции и одновременно показать, как создаются формулы листа. Кратко о последнем можно сказать так. Создаваемые формулы, их константная часть являются символьными переменными, а изменяемые переменные, содержащие подготовленные значения для формулы присоединять в формулу лучше через символ &.

Для грубого нахождения корреляции  достаточно одной формулы Пирсона.

Оценки по предмету в школе и в ВПР или диагностических работах однозначно коррелируют. Весь вопрос лишь в том, как и почему? Чем больше выборка, тем корреляция рассчитывается точней. По одному или нескольким конкретным ученикам лучше провести не расчет корреляции математически, а просто сделать качественный анализ сравнения успехов обучения до и после.

Последнее. В советское время, по-моему, в Оренбургской области, возможно, что это был и Мальцев, один человек мог рассчитывать погоду на полгода вперёд. Он делал это лучше любого Гидрометцентра и намного точнее. Очевидно, что он нашёл из своих или чужих наблюдений какие-то параметры, связанные между собой. Найти эти  параметры, да не один – это настоящее искусство. А расчёт корреляции – это лишь один из механизмов. А выборка нужна всегда, вопрос лишь в том, – какая? Математика здесь лишь выступает помощником.

Информация для скачивания