Skopiowano ze stron roboczych projektu Wolne Podręczniki
Liczby, liczby, liczby. Coraz więcej liczb. Żyjemy w czasach, kiedy dostępne nam są najróżniejsze rezultaty pomiarów. Mamy dostęp do najprzeróżniejszych danych, a także sami coraz częściej prowadzimy swoje badania, aby dowiedzieć się czegoś o otaczającym nas świecie.
Chcielibyśmy w gąszczu liczb dostrzec jakieś regularności, zobaczyć coś istotnego.
Parę prostych sytuacji. Dostałam/łem z testu 75 punktów na sto możliwych. Czy to dobrze, czy źle? Jak to wygląda na tle całej klasy? Czy ważniejsze jest, aby być powyżej średniej, czy lepiej być wśród górnej połowy wyników? A jak porównać wyniki dwóch klas z tego samego testu?
Jakiej muzyki najchętniej słuchamy? Czy mój gust muzyczny jest powszechny? Jak powszechny?
Te pytania są trochę szkolne, ale gdy nauczycie się odpowiadać na nie teraz, to później będziecie mogli sensownie odpowiadać na różne pytania czy to z ekonomii, czy biologii, czy z wielu innych dziedzin życia. Będziecie mogli stać się badaczami otaczającej Was rzeczywistości.
Zacznijmy od pierwszego badania.
Spis treści |
Czy dziewczęta mają lepszy refleks, czy chłopcy?
Pracujcie w parach. Każda para musi mieć linijkę przynajmniej 20 centymetrową, zeszyt do zapisywania wyników i papier milimetrowy lub kartkę w kratkę formatu A4. Dobrze mieć kredki w przynajmniej dwóch kolorach.
Waszym zadaniem jest sprawdzenie refleksu partnera.
Część pierwsza
Najpierw pierwsza osoba w parze 20 razy puszcza linijkę drugiej osobie i 20 razy odczytuje oraz zapisuje długość przepuszczonej linijki, a następnie druga osoba sprawdza w ten sam sposób refleks pierwszej.
Część druga
Zadaniem każdej pary jest sporządzenie wykresu, który przedstawia zebrane wyniki i z którego można odczytać, która osoba ma lepszy refleks. Wyniki dwóch osób należy przedstawić na jednym wykresie dwoma kolorami. Zanim zaczniecie robić wykresy bardzo starannie zaplanujcie, jak będą one wyglądać. Wykresy mają wizualnie przedstawić Wasz "pojedynek". Zaplanujcie Wasz wykres tak, aby zajął odpowiednią część kartki. Dobierzcie wyraźne kolory, aby Wasz wykres można było pokazać całej klasie.
Część trzecia
Prezentacja. Pokażcie swoje wykresy, powiedzcie, kto wygrał i uzasadnijcie, dlaczego.
Część czwarta
Wybierzcie najbardziej charakterystyczne wykresy. Postarajcie się wybrać przynajmniej po jednym z każdego rodzaju.
Patrząc po kolei na każdy z tych wybranych wykresów, odpowiedzcie na poniższe pytania:
1. Kto w tej parze będzie w przyszłości lepszym kierowcą?
2. Kto w tej parze lepiej się uczył łapać linijkę?
3. Kto w tej parze lepiej reagował na błędy?
4. Gdyby istniały mistrzostwa świata na refleks, to której osobie dałbyś/łabyś większe szanse na złoty medal?
5. Na kogo w tej parze sukces działał dekoncentrująco, a kogo sukces raczej motywował do uwagi?
6. Kto był lepszy, jeśli o zwycięstwie decydowałaby wartość średnia?
7. Kto byłby lepszy, gdyby o zwycięstwie decydowałyby trzy najlepsze wyniki?
8. Gdyby odrzucić 5 najlepszych wyników i 5 najgorszych wyników, to kto wypadł lepiej z pozostałą dziesiątką wyników?
9. Kto się łatwiej męczył?
10. Czy każdy wykres pozwalał odpowiedzieć na wszystkie powyższe pytania? Zadaj swoje pytania.
A więc, kto ma lepszy refleks? Czy teraz już wiadomo na pewno?
Podsumowanie
- Badania zawsze zaczynają się od pytań, na które mają odpowiedzieć.
- Prezentacja wyników wyjaśniająca jedną kwestię, może być kompletnie nieprzydatna dla innych kwestii. (Jeśli ktoś zgrupował wyniki z linijką w tabelce od najmniejszych do największych, nie odpowie na pytania, jak wyglądał pojedynek w czasie.)
- Rzeczywistość często jest bardziej złożona niż to się wydaje przed przystąpieniem do badań. Często przygotowanie badań powinno zająć więcej czasu niż same badania. Jednym ze sposobów na dobre przygotowanie badań jest zrobienie badań wstępnych, pilotażowych, które pozwolą na lepsze przygotowanie tych dużych badań właściwych (na ogól kosztownych).
- Badania statystyczne najczęściej dają nam pewniejszą wiedzę niż czyjeś opinie. Jednocześnie jest tak, że badania statystyczne - i jest to regułą - nie wyjaśniają zjawisk. Jeśli Zosia w jakiś sposób miała lepszy refleks niż Rafał, to eksperyment z linijką nie odpowiada na pytanie, jaka mogła by być tego przyczyna. Odpowiedź na to pytanie nie należy już do tego eksperymentu.
Dane
Podczas badania zbieramy informacje. Te informacje mogą być liczbami albo nimi nie być. Na przykład w badaniu koloru włosów w naszej klasie, w badaniu, jakiej muzyki słuchamy najczęściej, jak lubimy spędzać wolny czas, wyniki nie są liczbami.
Dane nieliczbowe
W mojej 20 osobowej klasie jest troje brunetów i brunetek, sześcioro uczniów to blondyni i blondynki, dziesięcioro szatynów i szatynek, a jedna osoba jest ruda. Jak przedstawić te dane?
Zdjęcie? Proszę bardzo.
Tu będzie zdjęcie.
Wykres kołowy
Wykres słupkowy
Wykres na prostokącie.
Najczęściej przedstawia się tego rodzaju dane na wykresie kołowym, na którym przy każdym wycinku koła podaje się odsetek (procent), jaki stanowi dana kategoria (na przykład blondyni).
Zaproponuj swoje badanie w klasie, w którym wyniki będą nieliczbowe i przedstaw je graficznie.
Dane liczbowe
Najczęściej badania statystyczne dostarczają nam liczb. O każdej takiej liczbie mówimy jako o wyniku. Zbiór wszystkich wyników to są właśnie dane.
Statystycy używają w tym kontekście słowa zbiór inaczej niż matematycy.
Przykład 2
Przy dziesięciu rzutach kostką otrzymano kolejno 1, 5, 5, 1, 5, 2, 2, 6, 3, 2. Matematycznie używając słowa "zbiór" rozumielibyśmy zbiór złożony z 5 elementów: 1, 5, 2, 6, 3. Statystycznie jest to jednak zbiór 10 wyników! To na przykład, że dwójka powtórzyła się 3 razy jest dla statystyka ważne.
Mediana i kwartyle
Ostatni test pisało 20 uczniów. W takiej kolejności, w jakiej są zapisani w dzienniku, otrzymali następujące liczby punktów na 100 możliwych:
90, 90, 32, 32, 44, 74, 77, 61, 89, 27, 36, 42, 81, 42, 69, 30, 48, 52, 37, 92.
Tak przedstawione dane nazywają się danymi surowymi. One najwierniej przedstawiają badaną rzeczywistość, ale najczęściej są mało czytelne. Oczywiście, ktoś, kto jest 17 na liście w dzienniku, natychmiast patrzy na 17 miejsce i widzi 52 punkty, które co prawda bardzo słabo, ale zaliczają test. Ktoś, kto chciałby mieć ogląd wyników całej klasy, nie może przy takiej prezentacji wyników wiele zobaczyć. Uporządkujmy wyniki od najmniejszego do największego:
27, 30, 32, 32, 36, 37, 42, 42, 44, 48, 52, 61, 69, 74, 77, 81, 89, 90, 90, 92.
Wyniki zostały uporządkowane. Zgubiliśmy informację, kto dostał ile punktów, ale trochę łatwiej będzie można coś powiedzieć o całej klasie. Dane podległy pewnej obróbce. Już nie są surowe, jak były na początku.
Co powie teraz osoba, która uzyskała 52 punkty? Pewnie będzie się chwaliła, ze znalazła się w górnej połowie wyników i że następna za nią osoba miała aż cztery punkty mniej. Na pewno nie powie, że aż 9 uczniów było przed nią, a do osoby bezpośrednio przed nią brakowało aż 9 punktów.
Dwie liczby z tych danych rzucają się w oczy. Ta najmniejsza 27 i ta największa 92. Wszystkie wyniki są w przedziale [27, 92].
Rozstęp lub zakres danych to jest różnica pomiędzy największym a najmniejszym wynikiem.
W naszym przypadku rozstęp (zakres) danych, to 92-27=65.
Dla tak uporządkowanych danych tradycyjnie wyróżnia się trzy liczby:
mediana (wartość środkowa), dolny kwartyl, górny kwartyl.
Mediana (wartość środkowa) danych, oznaczana Med, to jest liczba, od której przynajmniej połowa wyników jest mniejsza lub równa i przynajmniej połowa wyników jest większa lub równa.
W naszym przypadku taką liczbą może być każda liczba pomiędzy 48 a 52. I 48, i 49, i 50, i 51, i 52 ma tę własność. Ale również na przykład 51,75. Dla każdej z nich przynajmniej 10 wyników jest od niej mniejszych lub równych i dziesięć jest większych lub równych. Jest umowa, że w takim przypadku za wartość środkową przyjmuje się środek przedziału liczb spełniających formalnie tę definicję, a więc Med = (48 + 52):2 = 50.
Uwaga. Mediana nie musi być wynikiem. Nikt nie dostał 50 punktów!
Dolny kwartyl Q1 to liczba od której przynajmniej jedna czwarta wyników jest mniejsza lub równa, a przynajmniej trzy czwarte jest większe lub równe.
W naszym przypadku 5 wyników powinno być od tego kwartyla mniejsze bądź równe, a 15 większe bądź równe. Każda liczba pomiędzy 36 a 37 ma tę własność. Za dolny kwartyl przyjmujemy środek tego odcinka, czyli Q1=36,5.
Górny kwartyl Q3 to liczba, od której przynajmniej trzy czwarte wyników jest mniejsze lub równe, a przynajmniej 1/4 jest większa lub równa.
W naszym przypadku 15 wyników powinno być od tego kwartyla mniejsze bądź równe, a 5 większe bądź równe. Każda liczba pomiędzy 77 a 81 ma tę własność. Za górny kwartyl przyjmujemy środek tego przedziału, czyli Q3=79.
Minimum, dolny kwartyl, medianę, górny kwartyl i maksimum obrazuje się wykresem pudełkowym.
Ma on wiele zalet. Jednym rzutem oka widać, że aż połowa uczniów zdobyła mniej niż 50 punktów. Nie było uczniów, którzy dostali mniej niż 27 punktów, ale jedna czwarta uczniów dostała poniżej 37 punktów. Nikt nie zdobył więcej niż 92 punkty. Środkowa połowa klasy miała pomiędzy 36,5 a 79 punktów. Uczeń z 52 punktami może czuć się dobrze na tle klasy, ale wyraźnie widać, że albo klasa nie była do testu dobrze przygotowana, albo test był za trudny.
Po pewnym czasie klasa pisała jeszcze raz test na ten sam temat. Oto wyniki opisane wykresem pudełkowym. Czy nastąpiła poprawa?
Na poniższych rysunkach widzicie wyniki zapisane za pomocą czerwonych kropek nad osią liczbową. Jeśli nad jedną liczbą na osi są na przykład trzy kropki, to znaczy, że ta liczba trzy razy wystąpiła w zebranych danych.
Do każdego zbioru danych dorysujcie wykres pudełkowy.
a)
b)
c)
d)
e)
Czy widzicie regułę? Czy w każdym z punktów b-d otrzymaliście dwa takie same wykresy pudełkowe?
Sprawdźcie w każdym z przypadków a-e działanie niżej podanych reguł.
Przypuśćmy, że dane mają n elementów i że są uporządkowane rosnąco.
Mediana (wartość środkowa):
Jeśli n jest liczbą parzystą, to mediana jest wartością średnią wyników stojących na miejscach
i
.
Jeśli n jest liczbą nieparzystą i n = 2k + 1, to mediana jest równa wynikowi stojącemu na k+1 miejscu.
Dolny kwartyl:
Jeśli iloczyn
jest liczbą całkowitą, to dolnym kwartylem jest wartość średnia wyników stojących na miejscach
i
.
Jeśli iloczyn
nie jest liczbą całkowitą, czyli składa się z pewnej liczby całkowitej m i ułamka właściwego, to dolnym kwartylem jest wynik stojący na m+1 miejscu.
Górny kwartyl:
Jeśli iloczyn
jest liczbą całkowitą, to górnym kwartylem jest średnia wyników stojących na miejscach
i
.
Jeśli iloczyn
nie jest liczbą całkowitą, czyli składa się z części całkowitej m i ułamka właściwego, to górnym kwartylem jest wynik stojący na miejscu m+1.
Wartość średnia
Wartością średnią liczb 5 i 7 jest
Nieco ogólniej: wartością średnią dwóch liczb x1 i x2 jest
Jeszcze ogólniej:
Wartością średnią n liczb x1, x2...xn jest

Przykład 3
Znajdź wartość średnią
a) 1, 2
b) 1, 2, 3
c) 1, 2, 3, ... , 9, 10
d)1, 2, 3, ... , 9, 10, 11
e) 1, 2, 3, ... , n
Punkt a.
Zauważcie, że zastępując ten dwuwyrazowy ciąg ciągiem:
otrzymamy tę samą srednią!
Punkt b.
Punkty c-e można ze wzoru, ale można i inaczej.
Punkt c. Ten ciąg liczb ma tę samą średnią, co ciąg
bo ma tę samą sumę wyrazów i tę samą liczbę wyrazów. A jest to ciąg
którego wartością średnią jest oczywiście 5,5.
Punkt d. Ten ciąg liczb ma tę samą średnią, co ciąg
A jest to ciąg
6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6
którego średnią jest oczywiście 6.
Punkt e. Zastąpmy ten ciąg ciągiem
czyli ciągiem
Oba ciągi maję tę samą wartość średnią, bo suma wyrazów i ich liczba jest taka sama. No a wartością średnią tego drugiego ciągu jest oczywiście
Wartością średnią ciągu 1, 2, 3, ... ,n jest
.
Sumą n kolejnych liczb naturalnych 1, 2, 3, ... ,n jest
.
[Ćwiczenie 1]
Na rysunku widzisz 10 kwadratów.
a) Policz średni bok kwadratów.
b) Policz średnie pole kwadratów.
c) Czy kwadrat średniego boku jest średnim polem?

