Ta strona wykorzystuje ciasteczka ("cookies") w celu zapewnienia maksymalnej wygody w korzystaniu z naszego serwisu. Czy wyrażasz na to zgodę?

Czytaj więcej
< All Topics
Print

Excel

Excel

Tabele w excelu o formacie bazodanowym

Excel jest arkuszem kalkulacyjnym, co oznacza, że dane umieszcza się w nim w dowolny sposób, zazwyczaj w tak skonstruowanych tabelach, by były przejrzyste dla czytelnika i nie zawierały powtórzeń. Dla dowolnie skonstruowanych tabel pisanie programów umożliwiających ich analizę, na przykład statystyczną, nie byłoby opłacalne. Aby skorzystać z wielu gotowych funkcji przekształcających dane, powinny one zostać zapisane w formacie bazodanowym.

Programy obsługujące bazy danych są całkowicie inaczej programowane niż arkusze kalkulacyjne. Tylko jeden ze sposobów pokazywania bazy danych w postaci tabeli złożonej z kolumn, z których każda ma swoją nazwę pokazywaną na górze i szereg wartości wpisanych jedna pod drugą, przypomina z grubsza arkusz kalkulacyjny. Okazuje się jednak, że przesuwać tych wartości nie można, kopiowanie wymaga osobnego programu i coś takiego jak przeciąganie związane z powielaniem wartości, nie jest możliwe.

Biolodzy zatem tworzą swoje bazy danych w arkuszach kalkulacyjnych, a potem eksportują je do programów zarządzających bazami danych. Jest to możliwe tylko wtedy, gdy utworzona tabela ma format bazodanowy. Na przykładzie badań, których opracowanie będzie zadaniem studentów, pokażemy jak to się robi.

Wyobraźmy sobie, że zgłaszając się do pewnego profesora, by wykonać pracę licencjacką, słyszycie:

– Proszę pana. Parę lat temu nasz student wyjechał do Stanów Zjednoczonych i wziął udział w badaniach terenowych polegających na łapaniu skunksów na prerii, pobieraniu od nich wydzieliny ich gruczołów odbytowych i wypuszczaniu ich na wolność. Przywiózł nam próbki tych wydzielin wraz z opisem osobników, od których pochodziły. Ponumerowaliśmy je i wysłali do laboratorium chemicznego, aby oznaczono tam szereg związków i pierwiastków. Gdy już wszystko zostało wykonane, student dostał propozycję kontynuowania studiów na uniwersytecie w Austin i zostawił nam swoje badania. Kiedy zgłasza się do mnie student, że chce zrobić licencjat, daję mu do opracowania kolejny pierwiastek oznaczony w tych substancjach. Dla pana byłby to fluor.

– Co byłoby celem tej analizy? – spytalibyście.

– Skunksy były łowione w trzech różnych sezonach i określano ich płeć. Należałoby sprawdzić, czy istnieją powtarzające się zmiany stężenia fluoru u samic i samców, oraz w kolejnych sezonach. Ponadto były one ważone i ich ciężar może mieć także znaczenie.Tu ma pan dane o skunksach, a z drugiej strony oznaczenie stężenia fluoru. Proszę to opracować. Do widzenia.

Przekazany wam arkusz papieru nie wygląda zachęcająco:

Dopiero po dłuższej chwili rozszyfrowalibyście, że w tabeli na pierwsze stronie po lewej są samice, po prawej samce, wewnątrz tabeli są ciężary osobników i informacje o sezonie, w których został złowiony. Numery z lewej strony to numery próbki wydzielin gruczołów odbytowych pobranych od tego osobnika, a na drugiej stronie stężenie fluoru w próbce o tym numerze. Materiał składa się zatem z pięciu zmiennych:

  1. Numer próbki,
  2. Płeć osobnika,
  3. Sezon, w którym został złowiony,
  4. Ciężar osobnika,
  5. Stężenie fluoru w gruczołach odbytowych tego osobnika.

Należałoby te dane wpisać do arkusza kalkulacyjnego w następujący sposób:

Należałoby te dane wpisać do arkusza kalkulacyjnego w następujący sposób:

  1. Przygotowujemy plan bazy danych:
  2. Przepisujemy kolumny z pierwszej strony, z lewej części tabeli w tej kolejności numerów próbek, jaka tam występuje. Kolumnę płeć uzupełniamy przez przeciągnięcie słowa “samica”:
  3. Pod spodem przepisujemy kolumny z pierwszej strony, z prawej części tabeli, w tej kolejności numerów próbek, jaka tam występuje. Kolumne płeć uzupełniamy słowem “samiec” przez przeciągnięcie.
  4. Sortujemy cała tabela według kolumny Nr:
  5. Dopisujemy stężenie fluoru z drugiej strony kartki.

Uwaga. Jeżeli w komputerze na którym pracujecie system ustawiony jest na przecinki, jako separatory liczb dziesiętnych, a wy przepisaliście z kartki kropki, to musicie:

  1. Zaznaczyć obszar z błędnie wpisanymi liczbami.
  2. W narzędziach głównych kliknąć na ikonkę “Znajdź i zamień”.
  3. W miejsce znajdź wpisać kropkę.
  4. W miejsce zamień wpisać przecinek.
  5. Kliknąć na zamień wszystko.

Otrzymana w ten sposób tabela ma format bazodanowy. Można ją transportować do programów statystycznych. Wiele jednak rzeczy można wykonać w samym Excelu, gdzie format bazodanowy także jest używany do pewnych przekształceń.

Baza danych powinna być zapamiętana i zabezpieczona. Ze względu na jej późniejszy transport do pakietów statystycznych, czy też programów, w których można wykonać dobre wykresy, nie powinny obok niej pojawiać się inne treści, tabelki związane z opracowaniem danych oraz wykresy. Zazwyczaj arkuszowi z baza danych daje się charakterystyczną nazwę np. BAZA, a wszystkie opracowania wykonuje się na jej zlinkowanej kopii w innych arkuszach. Zlinkowanie powoduje, że gdy wykonujemy jakąś poprawkę w obrębie danych, wykonana praca spowodowana jej opracowaniem ulega automatycznemu poprawieniu.

Kopiowanie, przenoszenie i przeciąganie, wyliczenia, czyli do czego służą funkcje i dolary

Po zaznaczeniu kilku komórek w Excelu można:
1. przenieść ich zawartość w inne miejsce (po nakierowaniu kursora myszy na brzeg zaznaczonego obszaru tak, by uzyskać strzałkę),


2. przekopiować je (po nakierowaniu kursora myszy na brzeg zaznaczonego obszaru, tak, by uzyskać strzałkę i przytrzymaniu przyciśniętego klawisza Ctrl), 0
– przeciągnąć je w dół lub bok (po nakierowaniu kursora myszy na prawy dolny róg, tak by kursor zmienił się na krzyżyk).

3. przeciągnąć je w dół lub bok (po nakierowaniu kursora myszy na prawy dolny róg, tak by kursor zmienił się na krzyżyk).

Przenoszenie i kopiowanie można także wykonać za pomocą wprowadzania do pamięci chwilowej zawartość zaznaczonych komórek (Ctrl+X, Ctrl+C) i wydobywania ich w innym miejscu (Ctrl+V). Można przy tym użyć prawego klawisza myszy.

Za pomocą szeregu funkcji zaimplementowanych do Excela możemy wyliczyć sobie, na przykład sumę wartości liczbowych zapisanych w tabeli. Przykładowo wyliczenie sumy liczb 1,2,3,4,5 i 6 wygląda następująco:

Funkcję wpisujemy po znaku =.

Wewnątrz nawiasu należy wpisać adresy komórek których zawartość jest przekształcana przez funkcję. Gdy wartości te umieszczone są w rzędzie, kolumnie lub prostokącie wpisuje się adres pierwszej komórki (górny lewy róg prostokąta), dwukropek i adres ostatniej komórki (dolny prawy róg prostokąta). Adresy te można wygenerować zaznaczając obszar, w jakim znajdują się wartości, które chcemy przetwarzać. Jest to możliwe po wpisaniu nawiasu otwierającego.

Każda funkcja Excela ma określoną nazwę i składnię. Wykaz różnych funkcji, które przetwarzają wartości w Excelu znajduje się w menu Formuły. By użyć jakiejś funkcji należy kliknąć na wstaw funkcję.

Funkcji tych jest bardzo dużo i większość ich nazw została spolszczona. Można się na ogół domyślić co one robią. Ponadto każda z nich ma krótki opis widoczny na powyższym rysunku. W poszukiwaniu właściwej funkcji pomaga ich podział na kategorie, który filtruje funkcje przetwarzające określony rodzaj danych.

Jeżeli wyliczoną przez jakąś funkcję wartość przesuniemy w inne miejsce, nie ulegnie ona zmianie i nadal będzie wyliczana z zawartości komórek o pierwotnie podanych adresach.

Jeżeli wyliczoną przez jakąś funkcję wartość skopiujemy lub przeciągniemy w inne miejsce na ogół jej wartość się zmienia, gdyż zmieniają się adresy komórek, których zawartość jest przetwarzana przez funkcję.

Często chcemy skopiować całe zestawy skomplikowanych obliczeń i tylko podmienić na przykład nazwę funkcji na inną. Wtedy takie zamiany adresów komórek są niewygodne. Aby skopiowanie i przeciągniecie funkcji nie powodowało zmiany adresów komórek trzeba je wydolorawać. Należy wtedy zapisać znak dolara przed literą w adresie oznaczającą kolumnę oraz przed liczbą oznaczająca numer wiersza. Wygląda to następująco:

Dolarowanie adresów wydaje się żmudne, ale pomaga w tym klawisz F4. Umieszczenie kursora w obrębie adresu i klikniecie na F4 automatycznie dolaruje cały adres, albo tylko wiersz (dwa kliknięcia F4), albo tylko kolumnę (trzy kliknięcia F4). Można też zaznaczyć adresy początku i końca zakresu przetwarzanych komórek, kliknąć na F4 i uzyskać prawidłowe wstawienie 4 dolarów.

Po wydolarowaniu adresów komórek skopiowana w inne miejsce wartość funkcji nadal sięga do tych samych adresów.

Jeżeli wyliczoną przez jakąś funkcję wartość skopiujemy lub przeciągniemy w inne miejsce na ogół jej wartość nie ulega zmianie, gdyż wydolarowane adresy nie zmieniają się.

Znajomość zasad zmian adresów w Excelu i sposób na ich uniknięcie pozwala na szereg iteracyjnych obliczeń zdarzających się w pracy biologa. Pozwala też na szybkie utworzenie tabelek w Excelu, w których stosujemy te same funkcje, tylko dla kilku-kilkudziesięciu kolumn, co nie jest w biologii rzadkie.

Standardowe opracowanie wyników badań w postaci tabel

Przygotowana w rozdziale pierwszym baza danych nie nadaje się do pokazania w żadnym omówieniu wyników badań. Nie łatwo z niej wywnioskować czy większe jest stężenie fluoru w wydzielinie gruczołów odbytowych u samic, czy u samców, czy wpływa na nie ciężar osobników lub sezon. Jednak mając dane zapamiętane w formie bazodanowej, można przygotować sobie stosunkowo szybko standardowe tabele, które zazwyczaj umieszcza się w pracy dyplomowej, a często także w prezentacji lub na posterze.

Standardowe tabele przygotujemy sobie w osobnym arkuszu, który najlepiej nazwać jest “TABELE”. Na początku wykonamy w nim zlinkowaną kopię bazy danych. W tym celu w pierwszym rzędzie w kolumnie A piszemy =BAZA!A1. Można też napisać tylko =, przejść do arkusza BAZA i kliknąć na pole A1 po czym nacisnąć Enter.

Następnie należy chwycić kursorem myszy za prawy dolny róg pola A1 i przeciągnąć formułę do kolumny E i do 51 wiersza w dół. Uzyskamy w ten sposób zlinkowaną kopię bazy danych.

W celu wykonania obok standardowych tabelek sortujemy te kopię według kolumn PLEC i SEZON. Sortowanie najlepiej jest wykonać w menu Dane wybierając ikonkę sortowanie. Należy zwrócić przy tym uwagę, czy cała tabela została zaznaczona. W arkuszach kalkulacyjnych można bowiem posortować tylko część tabeli (tej która zostanie zaznaczona), co zepsuje dopasowane danych do siebie.

Mamy tak ułożone dane, że można będzie porównać ciężary samców i samic w różnych sezonach oraz stężenia fluoru w różnych sezonach. Najlepsze i powszechnie stosowane charakterystyki zbiorów liczbowych są to średnie wartości danych oraz odchylenia standardowe będące miarą ich zróżnicowania. Ważne jest także dla jak dużej próby zostały one wyliczone. Oznacza to utworzenie kilku tabel według jednego schematu:

Tabele z wielkościami prób zawsze umieszcza się gdzieś w pracy licencjackiej i najczęściej powołujemy się już na nią pisząc o metodach prowadzonych badań, mimo, ze często są to liczby nieprzewidywalne i mogłyby być uznawane za wynik. Do ich wygenerowania można użyć zapisanego schematu oraz funkcji liczącej niepuste pola. Ma ona składnię ILE.NIEPUSTYCH(). Można ją wybrać ze zbioru funkcji statystycznych, można zacząć ją pisać w określonej komórce tabelki (samice wiosną) po znaku =. W pewnym momencie pojawi się kilka podpowiedzi i można wybrać właściwą. Po otworzeniu nawiasu można wskazać zakres komórek odpowiadających samicom wiosną.

Następnie, by ciągle nie wpisywać nazwy funkcji, można to pole przeciągnąć dwie kolumny w bok i jeden wiersz w dół. Następnie w każdej komórce poprawić adresy początku i końca zakresów na właściwe dla tej komórki.

Poprawne określenie zakresów jest na tyle pracochłonne, że nie chcemy tego ponownie wykonywać w innych tabelach. Oznacza to konieczność skopiowania tej tabeli w inne miejsce. Aby przy kopiowaniu adresy nie uległy zmianie należy je wydolarować (patrz rozdział 2). Najlepiej to zrobić zaznaczając w każdym polu adresy (tak by uchwycić początek i koniec) i klikając na F4. Po wydolarowaniu wszystkich adresów można tabelę skopiować.

Następnie zmieniamy nadpis nad tabelą na taki, który pokaże nam co w niej zostanie wyliczone. Zaznaczamy zawartość całej tabeli. W menu Narzędzia główne klikamy na ikonkę Znajdź i zaznacz. Wybieramy zamień i zmieniamy nazwę funkcji ILE.NIEPUSTYCH na ŚREDNIA. Tu możemy pisać zarówno duże jak i małe litery. Klikamy na Zamień wszystko.

Pojawią nam się symbole błędu, gdyż średnia z pól nieliczbowych nie może zostać wyliczona. Należy zatem zaznaczyć ponownie wnętrze tabelki i dokonać zamiany C na D. Uzyskamy tabelę z wyliczonymi średnimi we właściwych zakresach. Średnie te pokazujemy zazwyczaj z taką samą dokładnością, z jaką zostały zmierzone analizowane dane. Robimy to klikając kilka razy na odpowiednią ikonkę w menu Narzędzia Główne.

Ponieważ w biologii średnie podaje się zawsze z odchyleniami standardowymi, można te tabelkę skopiować obok i zamienić nazwę Średnia na coś co liczy odchylenia standardowe. Tu pojawia się problem z wyborem takiej funkcji, bo Excel proponuje nam cztery do wyboru i bynajmniej nie dają one takich samych wyników. Ich nazwy są w różnych wersjach trochę inaczej przetłumaczone, ale zawsze jest ich cztery.

Po przeczytaniu wyjaśnień te, które mają na końcu .A odpadają. Zostają do wyboru te kończące się słowami POPUL i PRÓBKI dające różne wyniki. Nie wchodząc w różnice we wzorach, którymi się je liczy (w jednym sumę kwadratów odchyleń dzieli się przez n w drugim przez n-1, gdzie n to wielkość próbki), przyjmijmy do wiadomości, że w biologii zawsze stosuje się wzór odpowiadający wyliczaniu ODCH.STANDARD.PRÓBKI(). Ponadto we wszystkich znanych mi wersjach excela można napisać ODCH.STANDARDOWE().

Robienie osobnych tabelek ze średnimi i odchyleniami standardowymi nie jest eleganckie. Prawie zawsze podaje się średnią, potem znak ± potem odchylenie standardowe. Wymaga to zrobienia trzeciej tabeli, w której będą wyniki obliczeń obu poprzednich tabel. Do jej wykonania użyjemy funkcji ZŁĄCZ.TEKSTY() gdzie wewnątrz umieścimy adres pierwszej komórki tabeli ze średnią, tekst “+/-” oraz adres pierwszej komórki tabeli z odchyleniami standardowymi. Funkcja ta najpierw przetwarza liczby na teksy, a potem je łączy. Jest to funkcja wieloargumentowa, a w takich funkcjach w excelu poszczególne argumenty rozdziela się średnikiem.

Wynik nie jest zadowalający, ponieważ funkcja ta przekształciła na liczby na tekst nie uwzględniając zaokrąglenia zastosowanego w tabelach. Trzeba je wykonać za pomocą funkcji ZAOKR(x;n), gdzie n jest liczbą cyfr po przecinku, które chcemy pokazać.

Teraz należy przeciągnąć tę komórkę dwie kolumny w prawo o jeden wiersz w dół. Uzyskujemy tabelę, która nadaje się do wykorzystania w pracy dyplomowej. 

Wystarczy w niej zamienić frazę “+/-” na ±. Znak ten istnieje w excelu. Trzeba kliknąć na ikonkę Symbol z menu Wstawianie i znaleźć tam odpowiedni znak. Nie mniej nie radzę tego robić. Jeżeli będziecie kopiować tę tabele do innego programu, to najczęściej excelowy symbol ± zostanie zamieniony na coś innego, często pusty kwadracik, który bardzo trudno zamienić automatycznie na coś innego. Zamiany “+/-” na właściwy symbol dokonujemy w programie docelowym.

Należałoby wszystkie te czynności wykonać dla stężenia fluoru. Teraz jednak pomagamy sobie kopiując wszystkie trzy tabele dotyczące ciężaru skunksów nieco niżej. Zmieniamy tylko nazwę kolumny w dwóch pierwszych tabelach na właściwą. Nie możemy jednak zamienić D na E gdyż zamiana dokonana zostałaby także w słowach “ŚREDNIA” i “ODCH.STANDARDOWE”. Należy ograniczyć zamiany do adresów, czyli zamienić $D na $E.

Na koniec trzeba poprawić dokładność pokazywania i wyliczanie średniej i odchylenia standardowego, gdyż w przypadku stężenia fluoru są to dwa miejsca po przecinku.

Gdybyśmy poza fluorem dostali, na przykład, wszystkie oznaczone pierwiastki grupy siódmej Mendelejewa, w pokazany sposób moglibyśmy bardzo szybko uzyskać tabele możliwe do pokazania w pracy dyplomowej. Takie zresztą bazy danych opracowuje się przy wykonywaniu prawdziwych, eksperymentalnych prac licencjackich i magisterskich.

Szybkie wyliczanie średnich i odchyleń standardowych, sumy częściowe

Gdy dane są zapisane w formie bazodanowej, można wykorzystać pewne funkcje excela, które umożliwiają szybkie wyliczenia średnich i odchyleń standardowych (a także kilku innych funkcji zdefiniowanych dla zbiorów liczbowych dowolnej wielkości). Najpopularniejszą są sumy częściowe noszące w starszych spolszczonych wersjach excela nazwę sumy pośrednie.

Najpierw należy do nowego arkusza skopiować zlinkowaną bazę danych (tak jak to zrobiono w poprzednim rozdziale). Należy ją posortować względem obu zmiennych dyskretnych, w przypadku badań skunksa PLEC i SEZON. Potem należy w menu Dane kliknać na ikonkę Sumy częściowe.

W tabeli, która się pojawiła, w miejscu opisanym jako Dla każdej zmiany w: należy wybrać tę zmienną dyskretną, która częściej się zmienia. W sortowaniu użyto ją jako zmienną drugiego poziomu. W miejscu opisanym jako Użyj funkcji: należy wybrać Średnia. Potem należy zaznaczyć te zmienne liczbowe, dla których średnia ma być wyliczana.

Po kliknięciu OK średnie zostały wyliczone. Klikając na szare 2 w lewym górnym rogu możemy ukryć wszystkie nieuśrednione dane.

Możemy dodać do tych średnich odchylenia standardowe. Trzeba umieścić kursor w obrębie rozwiniętej tabeli (kliknąć na szare 3 w lewym górnym rogu) i ponownie kliknąć na Sumy częściowe. Zlikwidować zaznaczenie w polu Zamień bieżące sumy częściowe i zamienić funkcję Średnia na OdchStd. Funkcji OdchStdc nie używać.

Kliknąć OK. Odchylenia standardowe pojawią się ponad średnimi.

Sposób ten wydaje się dużo szybszy od pokazanego w poprzednim rozdziale. Ale by zrobić z tego tabele, które można umieścić w pracy dyplomowej, trzeba się trochę jeszcze napracować.

Szybkie tworzenie tabel ze średnimi i odchyleniami standardowymi, tabela przestawna.

Tabele, w której dane podzielone są względem wartości dwóch zmiennych dyskretnych (np. płci i sezonu) i której umieszczane są średnie wartości zmiennej ciągłej wraz z odchyleniami standardowymi można utworzyć za pomocą tabeli przestawnej. Wykonuje ją pierwsza ikonka w menu Wstawianie Nie wymaga ona wstępnego przygotowania arkusza, gdyż sama tworzy nowy arkusz. Innymi słowy wystarczy przejść na arkusz BAZA, kliknąć na dowolne niepuste pole, otworzyć menu Wstawianie i kliknąć na ikonkę Tabela przestawna.

Wystarczy zgodzić się na zaproponowane opcje. Po utworzeniu nowego arkusza pojawia się następujący projekt.

Z prawej strony znajdują się pola pozwalające na zorganizowanie tabeli. Trzeba chwycić za pole PLEC i przesunąć je w miejsce WIERSZE. Następnie trzeba chwycić za pole SEZON i przesunąć je do miejsca na KOLUMNY. Z kolei chwytamy za CIEZAR i przesuwamy je do pola WARTOŚCI. Pojawia się tabela z sumowanymi ciężarami w każdej grupie danych.

Dopiero po wykonaniu tej tabeli możemy zmienić funkcję wyliczającą charakterystykę danych w każdej grupie. Trzeba aktywować poje liczbowe w tabeli i kliknąć na ikonkę Aktywne Pole oraz wybrać Ustawienia Pola. Można też aktywować prawy klawisz myszy i wybrać Ustawienia pola

Z ukazującego się okna wyboru należy wybrać Średnia

Powstała tabela ze średnimi, w której jednak nadal figurują nazwy Suma końcowa, choć jest w nich ewidentnie wyliczona średnia ze zgrupowanych danych.

W tabeli tej można umieścić także odchylenia standardowe. W polu organizacyjnym tabeli trzeba ponownie chwycić za CIEZAR i przenieść go do pola wartości pod istniejący tam już CIEZAR. Tabela zostanie uzupełniona do dodatkowe kolumny (czasem wiersze) z sumą ciężarów w każdej grupie danych.

Trzeba zmienić funkcję Suma na OdchStd. Wymaga to umieszczenia kursora na dowolnym polu z sumowanym ciężarem i aktywowanie Ustawienia Pola. Poprzez wybór funkcji OdchStd uzyskamy właściwe wyniki.

Można też przekonać się, że możliwość edycji tej tabeli jest ograniczona. Nie można wyrzucić średnich dla zgrupowanych samców i samic oraz osobników z różnych sezonów. Ich obecność wydaje się zaciemniać obraz, który powinien służyć do porównania ciężarów wyróżnionych grup osobników. Nie można ustawić kolejności kolumn w porządku chronologicznym (wiosna, jesień, zima), a nie alfabetycznym (jesień, wiosna, zima). Można jednak pokazać średnie i odchylenia z określoną dokładnością, zwęzić kolumny i spowodować zawijanie się tekstu w długich nazwach kolumn. Te nazwy można zresztą edytować.

By uzyskać tabelę przestawną dla stężenia fluoru nie trzeba ponownie wykonywać wszystkich opisanych czynności. Trzeba skopiować całą tabele niżej. Aktywować ją klikając na dowolne jej pole. Pojawi się wtedy część organizacyjna nowej tabeli. W tej części kasujemy CIEZAR z pola wartości i przenosimy tam FLUOR. Potem zmieniamy mu funkcję Suma na Średnia i Suma na OdchStd. Uzyskujemy dwie tabele:

Często tego typu tabele nadają się już do skopiowania do pracy dyplomowej, zwłaszcza, że kopiowanie tylko części tej tabeli jest możliwe. Robimy to jednak wtedy, gdy już pewni jesteśmy, że nasza baza nie ma błędów, bo w kopiach części tabeli poprawki w bazie danych nie są uwzględniane, a w tabelach przestawnych tak, choć nie od razu. Wymagają odświeżenia lub aktualizowania (nazwa tej czynności zależy od wersji excela).

Wykresy średnich z odchyleniami standardowymi

Tabele są dobrym sposobem pokazania wyników swojej pracy, gdy porównujemy je z analogicznymi opublikowanymi już w literaturze. Jednak na posterze i w prezentacji zazwyczaj pokazujemy wykresy, które wizualnie najlepiej obrazują uzyskane różnice między średnimi.

Średnie zazwyczaj pokazuje się na wykresach pudełkowych. Takiej możliwości w Excelu nie ma, choć wykresy giełdowe trochę je przypominają. Zazwyczaj zatem wykonujemy je za pomocą wykresów kolumnowych. Używamy przy tym tabel ze średnimi i odchyleniami standardowymi. Należy zaznaczyć cała tabelę ze średnimi, przejść w menu na Wstawianie i kliknąć na ikonkę Kolumnowy-2W. Należy wybrać pierwszy z pokazanych typów wykresu.

Pole na tytuł zazwyczaj usuwamy, gdyż w biologii wykresy się podpisuje, nie tytułuje i robi to w programie docelowym (pracy dyplomowej, prezentacji). Pole to byłoby przydatne, gdy wykonuje się wiele analogicznych wykresów dla danych z różnych terenów, lat itp. Gdybyście, na przykład, robili wykresy dla stężenia różnych pierwiastków w wydzielinie gruczołów odbytowych skunksa, byłoby to dobre miejsce by wpisać tam nazwę pierwiastka. W podpisie osi mógłby być już tylko skrót chemiczny.

Po utworzeniu wykresu należy podpisać mu osie. W Biologii za umieszczenie w pracy dyplomowej wykresu z nie podpisanymi osiami na wykresie, można zostać ocenionym na 2. W tym celu aktywujemy wykres, przechodzimy na Projektowanie i aktywujemy z lewej strony Dodaj elementy wykresu, wybieramy Tytuły osi.

W podpisie osi pionowej nie stosujemy słów średnie stężenie. Podpis osi ma wyjaśniać czym są liczby lub nazwy pokazane na osi. Do opisu wartości zmiennych skalarnych zawsze dodajemy jednostkę ich pomiaru w systemie SI. Czym innym jest 3 liczone w gramach, czym innym w kilogramach.

Ponieważ średnie w biologii zawsze istnieją wraz z odchyleniami standardowymi, należy je obowiązkowo dodać do wykresów w postaci słupków błędów skierowanymi w dół i w górę od górnej powierzchni słupka obrazującego średnią. Wykonuje się to poprzez wybór z Dodaj elementy wykresu opcji Słupki błędów. Najpierw należy aktywować na wykresie słupki zrobione dla samic.

Z ukazującego się okna należy wybrać Więcej opcji słupków błędów.

W menu, które pojawi się z prawej strony, albo w osobnej tabelce, należy wybrać Niestandardowe i Określ wartość. Pojawi się okienko, w którym można zapisać adresy odchyleń w górę i odchyleń w dół. W naszym przypadku są one takie same. Trzeba zaznaczyć odpowiednie trzy pola w tabeli z odchyleniami standardowymi. W przypadku wstawiania odchyleń w dół, trzeba w okienku zaznaczyć tylko (1) bez znaku równości i ponownie przejechać po tabelce z odchyleniami standardowymi dla samic.

Uzyskany wykres nadaje się już do publikacji naukowej, ale nie jest ładny. Wymaga na przykład powiększenia czcionki do 12p. Robi się to w menu Narzędzia główne poprzez aktywowanie wykresu i kliknięciu na duże A z trójkącikiem skierowanym do góry. Zazwyczaj zmniejsza się mu szerokość przerwy do co najwyżej 100%, gdyż zbyt wiele pustego miejsca na wykresie, nie jest dobrze odbierane przez czytelników. Często też zmienia się kolorystykę stosując pewne naturalne skojarzenia. Przywykło sie wiązać z niemowlętami płci żeńskiej kolor różowy, a męskiej niebieski. Dlatego też warto te naturalne skojarzenia wykorzystywać w sytuacji porównywania płci.

Teraz należałoby te same czynności wykonać dla stężenia fluoru. Jednak, aby zachować to samo formatowanie wystarczy wykres dla ciężaru skopiować, aktywować kopię, przejść do Projektowanie kliknąć na Zaznacz dane i zaznaczyć myszą tabelę ze średnimi stężeniami fluoru. Niestety odchylenia standardowe zostaną dla ciężaru. Trzeba je skasować, a potem wprowadzić na nowo słupki błędów dla samic i samców wykorzystując odpowiednią tabelą z odchyleniami standardowymi. Na końcu trzeba zmienić podpis osi pionowej i jednostkę pomiaru stężenia zapisać w systemie SI.

Zaznaczam, że ppm (partial per milion) i ppb (partial per bilion, czyli miliard wg długiej skali liczbowej) nie są jednostkami w systemie SI. W biologii nigdy ich się nie stosuje. Należy zamiast ppm napisać μg⋅g-1 albo μg/g. Natomiast zamiast ppb napisać ng⋅g-1 albi ng/g. Innych możliwości nie ma. W excelu w miejsce ppm należy wpisać g.g-1, a potem na początku wprowadzić symbol μ, który znajdziemy dla czcionek rozszerzonych o litery greckie, albo w czcionkach Symbol, potem kropkę i -1 wprowadzić jako indeks górny. W miejsce ppb należy wpisać ng.g-1, a potem podwyższyć kropkę oraz -1.

Wykonane wykresy można przenieść do osobnego arkusza nazwanego Wykresy. Ułatwia to korzystanie z wykonanego opracowania podczas pisania pracy dyplomowej.

Wykresy zależności stężenia fluoru od ciężaru osobników.

Standardem pokazywania zależności zmiennych ciągłych od siebie są wykresy punktowe (inaczej rozrzutu danych) i zaznaczania na nich linii trendu. W excelu służy do tego wykres punktowy (X,Y). Należy zaznaczyć kolumny, które będą porównywane i kliknąć na tę ikonkę.

Po utworzeniu takiego wykresu na osi poziomej znajdują się wartości zmiennej napisanej z lewej strony, na osi pionowej wartości zmiennej z prawej. Jednocześnie, jak nas uczono w szkole na osi poziomej zaznacza się zmienne niezależne, czyli takie od których mogą (choć nie muszą) zależeć zmienne na osi pionowej. Biolodzy na ogół łatwo orientują się, które zmienne zależą od których. Dodam, że gdy analizujemy stężenie czegoś co już jest w osobniku (a nie w środowisku) to zazwyczaj zależy to od cech osobnika związanych z jego kondycją, a więc np. ciężarem. Przed analizą zależności dwóch zmiennych ciągłych należy ten problem przemyśleć.

Aby uzyskać linię trendu aktywujemy punkty na wykresie i albo menu Dodaj elementy wykresu klikamy na linia trendu, albo klikamy na prawy klawisz myszy i wybieramy Dodaj linię trendu.

Powstaje następujący wykres:

Uzyskany wykres wymagałby podpisów osi, powiększenia czcionki, zmian zakresów liczb na osiach by wyeliminować puste miejsca itp, gdyby był prawidłowy. Ale prawidłowy nie jest. Pomieszano w nim dane dla samców i samic oraz dane ze wszystkich sezonów. A w każdym sezonie taka zależność mogłaby być inna. Prawidłowy wykres powinien różnymi kolorami i znacznikami pokazywać jak zależy stężenie fluoru od ciężaru osobnika.

W wykresie punktowym różne znaczniki uzyskamy, gdy dane znajdują się w różnych kolumnach. Trzeba więc przygotować sobie dane do wykonania takiego wykresu. W tym celu do arkusza “Wykresy” gdzieś pod wykresami średnich, kopiujemy zlinkowaną bazę danych.

Sortujemy ją względem płci i wieku.

Fragmenty związane z tą samą płcią i sezonem przesuwamy (nie kopiujemy, by nie zmienić adresów komórek) w prawo do pustych kolumn.

Nazywamy kolumny w taki sposób, jak powinny być pokazane na legendzie. Następnie zaznaczamy kolumnę z ciężarem i sześć kolumn ze stężeniami fluoru. Klikamy na wykres punktowy w menu Wstawianie.

Teraz można podpisać osie, powiększyć czcionkę do 12p, zmienić zakresy na osiach by zlikwidować puste miejsca.

Mało kto wie, ale w excelu można zmienić kolejność wpisów w legendzie. Trzeba ustalić ich właściwą kolejność (samice-wiosna → 1, samice-jesień → 2, samice-zima → 3, samce-wiosna → 4, samce jesień → 5, samce-zima → 6). Potem trzeba klikać na odpowiednia serię danych, tak by pojawił się adres kolumny w pasku adresowym. Kończy się on pojedynczą liczbą po średniku. Ta właśnie liczba określa kolejność pojawiania się wpisu w legendzie. Te liczby trzeba pozmieniać zgodnie z przyjętą kolejnością.

Ponieważ na niektóre serie trudno trafić, to aby nie powiększać wykresu można powiększyć Widok, na przykład do 200%.

Po dodaniu linii trendu dla każdej grupy danych uzyskalibyśmy pod względem formalnym wykres prawidłowy. Jednak zobaczenie różnic między samcami i samicami oraz sezonami wymaga dłuższego ślęczenia nad wykresem. Należy zmienić kolorystykę niektórych serii danych lub kształty znaczników, by były bardziej kontrastowe.

Najlepiej przyjąć krzyżowy sposób oznaczeń płci i sezonów. Przykładowo: samice zaznaczyć kółeczkami a samce trójkącikami. Dla sezonu wiosna przyjąć kolor zielony, dla jesieni – brązowy, a dla zimy niebieski. Linie trendów zaznaczyć kolorami właściwymi dla sezonu, ale samce będą ją miały przerywaną, a samice ciągłą. Wymaga to edycji znaczników, która wykonuje się po aktywowaniu właściwej serii danych.

Teraz trzeba dodać linie trendu dla każdej grupy danych. Trzeba wybraną grupę aktywować, potem kliknąć na prawy klawisz myszy, wybrać Dodaj linie trendu i zmienić jej kolor i kształt na właściwy dla danej grupy danych. Jest to szybsza metoda niż korzystanie z opcji Linia trendu w polu Dodaj elementy wykresu. Dodanie jej powoduje rozszerzenie legendy o nowy wpis. Trzeba go usunąć. W biologii przyjęto przekreślać właściwy znacznik poziomą kreską mającą kolor i kształt linii trendu. To zrobimy na końcu.

Dodawanie poziomych odcinków do legendy robimy wtedy, gdy już nie będzie wprowadzanych żadnych poprawek do wykresu i nie zmienimy jego rozmiaru. Aktywujemy wykres. Przechodzimy do menu Formatowanie. W grupie opcji Wstawianie kształtu klikamy na odcinek. Przekreślamy znacznik w legendzie i powstałemu odcinkowi dajemy taki kolor i kształt jaki ma linia trendu dla danej grupy danych. Powstaje wykres postaci:

Ostatecznie w pracy o skunksie można pokazać trzy wykresy. W pracy dyplomowej ważne jest, aby miały one ten sam rozmiar, a na pewno tę samą szerokość.

Powrót

Spis treści