Аналіз даних — розділ математики та інформатики, що займається розробкою методів опрацювання даних незалежно від їх природи.
Для аналізу даних потрібні знання предметної області та знання математики й статистики.
Статистика (від лат. status — стан) — це наука про отримання, опрацювання й аналіз кількісних даних, які характеризують масові явища.
Розрізняють чотири етапи аналізу даних:
1. Отримання даних;
2. Опрацювання даних;
3. Аналіз результатів опрацювання даних;
4. Інтерпретація результатів.
Багаторазове вимірювання та збереження при цьому відповідних результатів приводить до накопичення даних, які опрацьовують спеціальними методами, які вивчаються у статистиці. Такі дані називаються статистичними даними.
Статистичні дані — сукупність упорядкованих, класифікованих  даних про деяке масове явище або процес.
Статистичні дані дають змогу не тільки охопити картину певного питання на даний час, а й планувати необхідні дії на майбутнє.
Велику множину об’єктів, що є предметом статистичного дослідження, називають генеральною„ сукупністю.
Дослідник, як правило, не має змоги оперувати всією генеральною сукупністю. Наприклад, опитати кожного громадянина країни нереально. Натомість досліджують вибірку — деяку множину об’єктів, вибраних з генеральної сукупності, і, проаналізувавши її, роблять висновки щодо властивостей генеральної сукупності загалом.
Маючи в розпорядженні дані статистичного спостереження, що характеризують те чи інше явище, перш за все необхідно їх упорядкувати, тобто надати характер системності.
Статистичний ряд розподілу — це впорядковані статистичні дані.
Ряди розподілу одиниць сукупності за ознаками, що мають кількісний вираз, називаються варіаційними рядами. У таких рядах значення ознаки (варіанти) розташовані в порядку зростання або спадання.
Варіанта — це окреме значення групувальної ознаки; частота — число, яке показує, скільки разів трапляється кожна варіанта
Дискретні варіаційні ряди — це такі ряди розподілу, в яких варіанта як величина кількісної ознаки може набувати тільки певного значення.
Інтервальні варіаційні ряди — такі ряди розподілу, в яких значення варіанти дано у вигляді інтервалів, тобто значення ознак можуть відрізнятися одне від одного на як завгодно малу величину.
Основними статистичними характеристиками вибірки є середнє, мода та медіана, які ще називають мірами центральної тенденції.
Медіану можна визначити як точку на ряді розподілу (впорядкований набір значень змінної для різних спостережень).
Мода — це значення, яке найчастіше трапляється.
У табличному процесорі центральна тенденція представлена функціями з категорії Статистичні, та майже всі вони призначені для обчислення узагальнювальних статистичних характеристик вибірки.
Найважливішими функціями категорії Статистичні є:
  • AVERAGE (число1; число2;…) — обчислює середнє значення;
  • МАХ (число1; число2;…) — обчислює максимальне значення;
  • МІN (число1; число2;…)  — обчислює мінімальне значення;
  • МЕDІАN (число1; число2;…) — повертає медіану;
  • МОDЕ (число1; число2;…) — повертає моду;
  • RANK (число; посилання; порядок) — повертає ранг числа у списку чисел, тобто його номер у впорядкованій послідовності чисел із вказаного діапазону.
Джерела:
Морзе Н. В. Інформатика (рівень стандарту): підруч. для 10 (11) кл. закладів загальної середньої освіти / Н. В. Морзе,  О. В. Барна. — К.: УОВЦ «Оріон», 2018. — 240 с.: іл.
http://it-science.com.ua/article.php?id=12&table=school9_11