Instalacja i pierwsze uruchomienie programu

Byrmeronka

Instalacja R (2023 rok)

CRAN to sieć serwerów ftp i internetowych na całym świecie, które przechowują identyczne wersje kodu i dokumentacji dla R. Instalator podstawowej wersji pobieramy z serwera znajdującego się najbliżej. Będzie ona identyczna z programami znajdującymi się na innych serwerach, tylko szybciej trafi na nasz komputer. Wersję 3.0.3 programu R najlepiej pobrać ze strony https://cran.r-project.org/bin/windows/base/.

Wymagania programu R są niewielkie – co najmniej 91 MB wolnej przestrzeni na dysku (ewentualnie 76 MB gdy ograniczymy się do standardowej wersji). Instalacja jest bardzo prosta. Na wstępie proponuje przeczytać zasady licencji umożliwiającej z darmowego korzystania z programu. Instalator proponuje wersję językową programu, zainstalowanie wersji standardowej lub rozszerzonej, zmiany nazw katalogów, gdzie będzie instalowany program. Po instalacji standardowej na dysku zostaje umieszczony folder C:\Program Files\R, a na pulpicie pojawi się ikonki będąca skrótem do programu R.exe:

W starszych wersjach R pojawią się dwie ikonki. Zazwyczaj każda z nich uruchamia taki sam program. Różnią się one tylko organizacją pamięci. Czasami, zwłaszcza na starszych komputerach, jeden z tych programów nie dogaduje się z systemem i po prostu nie warto go uruchamiać.

Pierwsze uruchomienie programu R

Po uruchomieniu R pojawi się jedno okno nazwane konsolą:

i = “test”;

Jest ono podobne do okien tekstowych większości programów pisanych dla systemu Windows. Jednak jest to system wysyłania poleceń do interpretera. Po napisaniu w linijce zaczynającej się od > i naciśnięciu ENTER pojawia się wygenerowany przez program komunikat: wynik działań lub informacja o błędzie. Osoby nie pracujące wcześniej z takimi oknami niech zwrócą uwagę na sposób poruszania kursorem za pomocą strzałek i myszki. Zaobserwowane ograniczenia tylko pozornie wskazują na słabe możliwości programu. Wbrew pozorom ułatwiają pracę w R, a nie utrudniają.

Jeżeli komuś przeszkadzają informacje startowe pojawiające się w konsoli po uruchomieniu, może je skasować naciskając Ctrl+L na klawiaturze. Przycisk ten kasuje wcześniej wykonywane polecenia czyszcząc konsolę i umożliwia pracę od jej górnego wiersza.

ne jest zwrócenie uwagi na pracę klawisza “strzałka w górę”. Przywołuje ona poprzednio wpisane komendy, nawet te z błędami i skasowane klawiszem Ctrl+L. Można wtedy te błędy poprawić. Przykładowo można wypróbować działanie matematyczne:

> 1+1+1a
BŁĄD: nieoczekiwano: symbol in "1+1+1a"; 
> 1+1+1
[1] 3

Żeby ponownie wywołać wpisane wcześniej 1+1+1a wystarczyło nacisnąć klawisz strzałki w górę. Wtedy można wymazać i ponownie nacisnąć enter.

Czasami wygodnie jest wykonywać jedno działania lub jedna funkcje w kilku linijkach. Można to zrobić patrząc na następujący przykład:

> (1+1+1)*
+ (2+2+2)
[1] 18

Taki podział jednego polecenia na dwie linijki możliwy jest tylko wtedy, gdy pierwsza linijka zostanie zakończona znakiem wskazującym na niedokończone działanie. Często też zapomnienie o końcowym nawiasie powoduje wyświetlenie się czerwonego +, co oznacza, że R oczekuje na zakończenie instrukcji.

Przy pisaniu wszystkich komend tekstowych, na przykład nazw funkcji, należy pamiętać, że w R rozróżnialne są małe i duże litery.

> SIN(30)
Błąd w poleceniu 'SIN(30)':nie udało się znaleźć funkcji 'SIN'
> sin(30)
[1] -0.9880316

Funkcja sin() działa na kątach wyrażonych w radianach, nie stopniach.

Korzystanie z pomocy

R w wersji podstawowej, bez dodanych pakietów z nowymi funkcjami, ma ponad 3000 różnych funkcji wykonujących bardzo różne czynności. Wykaz tych funkcji można zobaczyć w formacie PDF na stronie http://cran.r-project.org/doc/manuals/r-release/fullrefman.pdf. Już ładowanie się tego pliku pokazuje jak jest on obszerny (3424 strony, mniej więcej około strony na omówienie każdej funkcji), a korzystanie z niego jest możliwe tylko dla osób o żelaznych nerwach. Do pokazanych w tym podręczniku funkcji z ich jednostronicowym opisem można dojść wpisując:

> help(nazwa funkcji) #albo:
> help("nazwa funkcji") #albo:
> ?nazwa funkcji

Tyle tylko, że nazwę potrzebnej funkcji trzeba znać. Bardzo często korzysta się z tej formy pomocy gdy chcemy sprawdzić jakie związane są ze znaną nam funkcją opcje, jakie są jej możliwości, jak została ona wykorzystana w podanych na końcu wyświetlanej strony przykładach.

Gdy szukamy funkcji, w których podejrzewamy, że może występować jakiś popularny człon (np. test lub plot) możemy posłużyć się funkcją apropos() albo ??. Zwraca ona wykaz wszystkich funkcji, w których nazwie jest człon “test”. Przykładowo gdy szukamy nazw funkcji, za pomocą których można wykonać testy statystyczne, możemy wpisać do konsoli apropos(“test”).

> apropos("test")
 [1] ".valueClassTest"         "ansari.test"
[3] "bartlett.test"           "binom.test"
[5] "Box.test"                "chisq.test"
[7] "cor.test"                "file_test"
[9] "fisher.test"             "fligner.test"
[11] "friedman.test"           "kruskal.test"
[13] "ks.test"                 "mantelhaen.test"
[15] "mauchly.test"            "mcnemar.test"
[17] "mood.test"               "oneway.test"
[19] "pairwise.prop.test"      "pairwise.t.test"
[21] "pairwise.wilcox.test"    "poisson.test"
[23] "power.anova.test"        "power.prop.test"
[25] "power.t.test"            "PP.test"
[27] "prop.test"               "prop.trend.test"
[29] "quade.test"              "shapiro.test"
[31] "t.test"                  "testInheritedMethods"
[33] "testPlatformEquivalence" "testVirtual"
[35] "var.test"                "wilcox.test"

Przeważnie znając nazwę testu, który chcemy wykonać możemy domyślić się nazwy odpowiedniej do tego celu funkcji. Jeżeli to nie wystarcza, można napisać help.search(“test”) i uzyskać stronę internetową z wykazem wszystkich funkcji, w której opisie występuje słowo test. Nie zawsze jest to test statystyczny.

W okresie nauki, albo gdy chcemy rozwiązać jakiś problem związany z językiem R, bardzo pomocne mogą się okazać funkcje example() i demo(). Z moich doświadczeń wynika, że uruchomienie tych funkcji dla funkcji graficznych trwa długo. Funkcja example() pokazuje to, co znajduje się na końcach stron pomocy jako przykłady. Funkcja demo() jest zaprogramowana tylko dla niektórych funkcji. Dla wielu funkcji pokazują się komunikaty pokazane poniżej.

> example(anova)
Komunikat ostrzegawczy:
In example(anova) : anova posiada plik pomocy, ale nie ma przykładów
> demo(anova)
Błąd w demo(anova) : Nie znaleziono dema dla tematu anova

Wszyscy użytkownicy R szybko odkrywają, że najlepszym źródłem pomocy jest Internet. Wpisanie odpowiedniego zapytania w wyszukiwarce skutkuje wykazem wielu stron, w których albo pojawia się rozwiązanie, albo można przesłać swój problem na wybrane forum dyskusyjne i poczekać na odpowiedź kogoś, kto dłużej ma do czynienia z R.

Foldery robocze

R standardowo zapamiętuje historię wszystkich działań w katalogu Dokumenty w pliku bez nazwy o rozszerzeniu Rhistory. Ponadto w tym samym katalogu tworzy dodatkowe wejście (skrót) do R bez nazwy, ale o rozszerzeniu RData. Uruchomianie R poprzez takie skróty powoduje automatyczne włączenie do nich wartości wszystkich nowych obiektów jakie zostały zdefiniowane podczas pracy z R. W pliku tekstowym .Rhistory zapisywane są wszystkie kolejne polecenia, także te niepoprawne. Po ponownym uruchomieniu R można je wywołać klikając strzałką do góry.

Pliki bez nazwy są nadpisane nowymi takimi plikami przy ponownej pracy w R i zgodzeniu się na zapisanie obszaru roboczego i historii. Czasem tego nie chcemy. Możemy wtedy tym plikom nadać nazwy wskazujące na rodzaj wykonywanych tam operacji. Nadanie nazwy tym plikom wygląda następująco:

> savehistory("hist.Rhistory")
> save.image("moje.RData"")

Wykonuje się je przed zamknięciem R. Wtedy obok plików bez nazw pojawiają się odpowiednie pliki z wprowadzoną nazwą i rozszerzeniami .Rdata i .Rhistory. Aby dalej z tymi danymi pracować trzeba uruchomić R poprzez plik z właściwą nazwą i rozszerzeniem .RData. Plik z rozszerzeniem .Rhistory najlepiej otworzyć przez notatnik i skopiować do konsoli R. W notatniku można usunąć z niego błędne polecenia.

Przy pracy z danymi istnieje często potrzeba zapisywania plików .RData i Rhistory w folderze, gdzie mamy własne dane wprowadzone w opracowywane w innych programach. Gdy taki folder o nazwie “MojFolder” jest umieszczony na pulpicie użytkownika “uzytkownik”, to można napisać:

> savehistory("C:/Users/uzytkownik/Desktop/MojFolder/hist.Rhistory")
> save.image("C:/Users/uzytkownik/Desktop/MojFolder/moje.Rdata")

Najlepiej jednak by MojFolder był folderem roboczym, gdyż wtedy do tego folderu wysyłane będą pliki tekstowe z wynikami, wykonywane wykresy itp. Istnieje zatem potrzeba zmiany folderu roboczego. Wygląda to następująco:

> setwd("C:/Users/uzytkownik/Desktop/MojFolder")

Istnieje czasem konieczność sprawdzenia aktualnego, roboczego katalogu. Wykonuje się to poprzez wywołanie ścieżki dostępu do tego katalogu:

> getwd("C:/Users/uzytkownik/Desktop")
[1] "C:/Users/uzytkownik/Documents"

Zmiany katalogu roboczego można dokonywać także znaną wszystkim metodą wędrowania po ścieżkach po wyborze w menu Plik opcji Zmień katalog.

Często ważne jest sprawdzenie jakie foldery i pliki znajdują się w roboczym katalogu. W tym celu wystarczy użyć funkcji list.files().

> list.files()
[1] "desktop.ini"
[2] "Moja muzyka"
[3] "Moje obrazy"
[4] "Moje wideo"
[5] "R"

Zamykanie programu R

Czasem trzeba zamknąć program R przed zakończeniem pracy z danymi. Wtedy najlepiej zapamiętać dotychczasowo wykonane obiekty używając funkcji save.image() oraz historie poleceń używając funkcji savehistory() funkcji. Wygląda to następująco:

> savehistory("mojepolecenia.Rhistory")
> save.image("mojeobiekty.Rdata")

Można wymusić zamknięcie R przez kliknięcie na × w prawym górnym rogu okna R. Można w R kliknąć na “plik” i “Wyjście”. W obu przypadkach pojawi się pytanie czy zapisać obszar roboczy. Gdy wprowadzone zostały do R obiekty, za którymi kryją się dane potrzebne do dalszej pracy – to zgadzamy się. Gdy pracujemy w R robiąc różne przykładowe rzeczy w ramach nauki – to lepiej nie.

Jak twierdzą informatycy, bardziej eleganckim sposobem zamykania R jest napisanie funkcji quit() lub krótko q(). Są to inne zapisy tej samej funkcji. Użycie jej z pustymi nawiasami powoduje zamknięcie R w trybie domyślnym, więc pojawi się zapytanie o zapisanie obszaru roboczego. Można napisać q(save=”yes”) lub q(save=”no”) lub q(“yes”) lub q(“no”), co spowoduje odpowiednio zapisanie lub brak zapisu obszaru roboczego. Zamykanie komendami q(“ask”), q(“default”) spowoduje powstanie zapytania o zapamiętanie obszaru roboczego.

Zamykanie R za pomocą funkcji q() może być częścią jakiegoś długo trwającego programu. Wtedy potrzebna jest opcja warunkowo zamykająca R (gdy program nie wygenerował błędów) lub pozostająca w R (gdy są błędy które musi poprawić programista). Służy do tego opcja status=n, gdzie n jest liczbą całkowitą oznaczającą typy błędów. n=0 oznacza bez żadnych błędów.

Podczas pracy z R wszystkie wykonywane po kolei komendy można zapisać klikając na Plik (ang. File) i Zapisz historię (ang. save history). Spowoduje to powstanie pliku tekstowego, w którym zanotowane będą wszystkie komendy wykonane podczas pracy z R w czasie wszystkich zapamiętanych sesji. Można je w notatniku oczyścić z błędnych koment a potem załadować w R.

Pakiety

Podstawowa wersja R posiada ogromne możliwości obliczeniowe, ma wbudowane szereg funkcji matematycznych, procedur graficznych i statystycznych. Dla większości zastosowań związanych z opracowaniem danych jest całkowicie wystarczająca. Dodatkowo można w R zaprogramować bardzo złożone sposoby opracowania danych, choć niekiedy wymaga to pomysłowości i pracy. Co więcej, wiele osób mogło rozpracować ten problem już przed nami i serie instrukcji zapamiętane w postaci jednej funkcji mogą być już dostępne w bibliotekach, zwanych pakietami, oferowanych oficjalnie na serwerach sieci CRAN.

Sieć pakietów działających pod R już jest bardzo bogata i bardzo dynamicznie się rozwija. Pakiety pisane są przez różne osoby na całym świecie, stosujące różne nazewnictwo i nie mające obowiązku dodawania jasnych i czytelnych “helpów”. Powodują lawinę obliczeń i wygenerowanie wyników końcowych, z których tylko część może być potrzebna użytkownikowi. Wiele pakietów różni się tylko tym, że generują nieco inne lub inaczej opracowane wyniki końcowe. Pakietów takich jest zatem bardzo dużo, aktualnie ponad 19000 i nie w sposób nauczyć się wszystkich ich na pamięć. Praca w R polega zatem na poszukiwaniu w Internecie opisu różnych pakietów do R, wybraniu najbardziej odpowiedniego i zainstalowaniu go na swoim komputerze. Forów dyskusyjnych związanych z R jest mnóstwo i łatwo o różne wskazówki i komentarze dotyczące różnych dodatków.

Pakiety instaluje się z poziomu programu R. Należy wybrać z menu polecenie “Pakiety” (“Packages”) i wybrać “Zainstaluj Pakiety” (“Instal Packages”). Pojawi się lista krajów, w których znajdują się serwery sieci CRAN. Niezależnie od wyboru kraju trafimy na taki sam zestaw takich samych pakietów. Z listy ponad 5500 pakietów należy wybrać te, które chcemy zainstalować. Trzymając przycisk Ctrl można podświetlić interesujące pakiety nie koniecznie znajdujące się jeden pod drugim. Po kliknieciu “OK” poszczególne pakiety będą dołączane do R i umieszczane w stosownych bibliotekach. Procedura wygląda następująco:

Z głównego menu programu R wybieramy “Pakiety” a następnie “Zainstaluj pakiet(y)”.

Pojawi się wykaz serwerów “Cran”, przy czym mozna zgodzić się na automatyczne znajdywanie najblizszego (pod wzgledem szybkości połączenia, nie geograficznym) servera z pakietami. W kolejnym oknie pojawi się wykaz pakietów. Jak widać są one nazwane kilkuliterowym skrótem i z ich nazwy nie można niczego wywnioskować.

Z listy nazw pakietów należy wybrać ten poszukiwany i poczekać na jego instalację.

Posługiwanie się nimi wymaga załadowania biblioteki po uruchomieniu programu, co wykonuje się komendą:

> library(nazwa_biblioteki)

Biblioteki, o ile chce się z nich korzystać, należy załadować po każdym uruchomieniu programu R. Wtedy funkcje w nich zawarte dostępne są do końca sesji.

Często różne załadowane pakiety operują tymi samymi nazwami obiektów lub funkcji. Podczas sesji aktywna jest nazwa z ostatnio załadowanego pakietu.

Byrmeronka

Tags:

R dla biologów

Podstawowe operacje

Programowanie

Operacje graficzne

Python dla biologów

Podstawowe operacje

Modelowanie

Różne programy dla biologów

Office

Statystyka

Grafika