Вы хотите получить более полную информацию о том, что такое корреляция между двумя выборками значений, то Вам лучше перейти сюда http://statanaliz.info/, а более точно, то сюда https://statanaliz.info/category/statistica/korrelyaciya-i-regressiya/
К предлагаемой статье есть и понятное видео.
Моя цель совершенно другая. Я предпочитаю использовать предлагаемую теорию на практике. Т.к. я программирую на VBA в Excel, то я просто проверяю полученные знания на конкретных выборках и значениях.
Если говорить о корреляции, то лучше ставить вопрос о нахождении зависимости между двумя выборками значений X и Y.
Что гласит методика, теория нахождения корреляции?
- Сначала строим график зависимости каждого значения Y от X. Если зависимость прослеживается, то она видна на графике.
- Если корреляция видна, то сначала находим коэффициент корреляции между X и Y и лучше по формуле Пирсона.
- Вычисляем число записей в выборке
- Если бы число значений в выборке было бы бесконечным, то разброс значений (дисперсия) от среднего подчинялся бы стандартному закону распределения вероятности. Т.к. число значений в выборке мало, то график справа будет урезан. Для перехода к стандартному распределению проводим преобразование Фишера.
- Ищем стандартную ошибку
- 95% всех отклонений попадает в ширину около 2
- Ищем верхнюю и нижнюю границы отклонений по Фишеру
- Ищем верхнюю и нижнюю границы отклонения корреляции, используя обратное преобразование Фишера.
Моя цель состоит в том, чтобы программно рассчитать коэффициент корреляции и одновременно показать, как создаются формулы листа. Кратко о последнем можно сказать так. Создаваемые формулы, их константная часть являются символьными переменными, а изменяемые переменные, содержащие подготовленные значения для формулы присоединять в формулу лучше через символ &.
Для грубого нахождения корреляции достаточно одной формулы Пирсона.
Оценки по предмету в школе и в ВПР или диагностических работах однозначно коррелируют. Весь вопрос лишь в том, как и почему? Чем больше выборка, тем корреляция рассчитывается точней. По одному или нескольким конкретным ученикам лучше провести не расчет корреляции математически, а просто сделать качественный анализ сравнения успехов обучения до и после.
Последнее. В советское время, по-моему, в Оренбургской области, возможно, что это был и Мальцев, один человек мог рассчитывать погоду на полгода вперёд. Он делал это лучше любого Гидрометцентра и намного точнее. Очевидно, что он нашёл из своих или чужих наблюдений какие-то параметры, связанные между собой. Найти эти параметры, да не один – это настоящее искусство. А расчёт корреляции – это лишь один из механизмов. А выборка нужна всегда, вопрос лишь в том, – какая? Математика здесь лишь выступает помощником.