Середовище для обробки даних R являє собою довершений інструмент не тільки аналізу, але підготовки та числених перевірок даних перед проведенням аналізу. І користувачам, яким приходиться працювати зі "справжніми" даними, а не учбовими масивами - добре відомі проблеми з дописками, помилками і відвертими фальсифікаціями даних.
субота, 9 листопада 2013 р.
середа, 18 вересня 2013 р.
Кореляційний аналіз в середовищі R (візуалізація кореляційних співвідношень)
Кореляційний аналіз широко застосовується в дослідженнях геологічних даних. У цьому циклі статей ми розглянемо найбільш відомі методики розрахунку кореляційних залежностей: коефіцієнт кореляції r Пірсона, ранговий коефіцієнт кореляції p Спірмена і ранговий коефіцієнт кореляції τ Кендалла. Але почнемо з візуального контролю.
субота, 7 вересня 2013 р.
Тести для перевiрки нормальностi розподiлу
Перевірка даних на відповідність нормальному закону розподілу є дуже важливою процедурою. Це пов’язано із тим, що багато "класичних" методик статистичної обробки даних базуються на припущенні того, що дані підпорядковуються нормальному закону розподілу. Із найбільш відомих статистичних показників можна навести критерій Стьюдента та коефіцієнт кореляції Пірсона.
Підписатися на:
Коментарі (Atom)