Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Biotechnologii i Hodowli Zwierząt - Biologia (S2)
specjalność: Biologia molekularna i podstawy analityki

Sylabus przedmiotu Eksploracja danych biologicznych:

Informacje podstawowe

Kierunek studiów Biologia
Forma studiów studia stacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister
Obszary studiów nauk przyrodniczych
Profil ogólnoakademicki
Moduł
Przedmiot Eksploracja danych biologicznych
Specjalność Biologia zwierząt
Jednostka prowadząca Katedra Nauk o Zwierzętach Przeżuwających
Nauczyciel odpowiedzialny Wilhelm Grzesiak <Wilhelm.Grzesiak@zut.edu.pl>
Inni nauczyciele Daniel Zaborski <Daniel.Zaborski@zut.edu.pl>
ECTS (planowane) 2,0 ECTS (formy) 2,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 5 Grupa obieralna 3

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
ćwiczenia audytoryjneA2 15 1,00,41zaliczenie
wykładyW2 25 1,00,59zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawy statystyki i metod stosowanych w statystyce

Cele przedmiotu

KODCel modułu/przedmiotu
C-1zapoznanie studentów z różnorodnymi metodami eksploracji danych

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przykłady wstępnej obróbki dużych zbiorów danych biologicznych. Metody redukcji wymiaru3
T-A-2Analiza dyskryminacji w zagadnieniach klasyfikacyjnych4
T-A-3Ogólne modele CHAID, drzewa klasyfikacyjne i regresyjne ze wzmacnianiem4
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu2
T-A-5Zaliczenie pisemne2
15
wykłady
T-W-1Wprowadzenie w zagadnienia związane z eksploracją danych, wstępne przetwarzanie danych2
T-W-2Metody redukcji wymiaru danych, poznawanie zbioru danych, badanie relacji2
T-W-3Kierunki eksploracji - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł3
T-W-4Zastosowanie regresji w eksploracji danych. Regresja logistyczna i log-liniowa2
T-W-5Metoda MARS2
T-W-6Drzewa klasyfikacyjne i regresyjne. Losowy las. Rózne modele i ich zastosowanie3
T-W-7Metoda wektorów nośnych. Naiwny klasyfikator Bayesa. Metoda k-najbliższych sąsiadów4
T-W-8Grupowanie hierarchiczne i metodą k-średnich2
T-W-9Sztuczne sieci neuronowe, rodzaje i zastosowanie, budowa, algorytmy uczące. Algorytmy genetyczne3
T-W-10Zaliczenie pisemne wykładów2
25

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Przygotowanie do ćwiczeń audytoryjnych15
A-A-2Samodzielne studiowanie poruszanych zagadnień6
A-A-3przygotowanie do zaliczenia9
30
wykłady
A-W-1udzial studentów w wykładach25
A-W-2Przygotowanie do zaliczenia6
31

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
M-3pokaz i teoretyczny opis różnych metod eksploracyjnych

Sposoby oceny

KODSposób oceny
S-1Ocena podsumowująca: zaliczenie pisemne z prezentowanego materiału na wykładach i ćwiczeniach

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLZ-S-O.4_W01
definiuje pojęcie eksploracji danych, charakteryzuje genezę, cel, zastosowania metod eksploracji danych w naukach biologicznych, opisuje cel i etapy wstępnej obróbki danych, charakteryzuje metody redukcji wymiaru oraz główne kierunki eksploracji danych
BL_2A_W05, BL_2A_W01P2A_W01, P2A_W03, P2A_W04, P2A_W05, P2A_W06C-1T-W-1, T-W-2, T-W-3M-1, M-2, M-3S-1
BL_2A_BLZ-S-O.4_W02
opisuje zastosowanie metod regresyjnych w eksploracji danych biologicznych, wskazuje na założenia stosowalności modeli, metody ich ewaluacji oraz wykorzystanie w predykcji
BL_2A_W05P2A_W01, P2A_W03, P2A_W06C-1T-W-4M-1, M-2S-1
BL_2A_BLZ-S-O.4_W03
opisuje pozostałe metody eksploracji danych biologicznych oraz ich przykładowe zastosowania, dostrzegając wady i zalety każdej z metod
BL_2A_W05P2A_W01, P2A_W03, P2A_W06C-1T-W-6, T-W-7, T-W-5, T-W-8, T-W-9M-1, M-2S-1

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLZ-S-O.4_U01
wykorzystuje zaawansowane metody statystyczne w eksploracji złożonych danych biologicznych
BL_2A_U07P2A_U03, P2A_U05C-1T-A-1, T-A-2, T-A-4, T-A-3M-1, M-2, M-3S-1

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLZ-S-O.4_K01
jest zdolny do efektywnej pracy indywidualnej
BL_2A_K05P2A_K01, P2A_K02, P2A_K03, P2A_K08C-1T-A-1, T-A-2, T-A-4, T-A-3M-1, M-2, M-3
BL_2A_BLZ-S-O.4_K02
wykorzystuje metody statystyczne w interpretowaniu zjawisk i procesów biologicznych, dając tym samym wyraz swojego przekonania o ich poznawalności
BL_2A_K01P2A_K04, P2A_K07C-1T-W-6, T-W-7, T-W-1, T-W-2, T-W-3, T-W-4, T-W-5, T-W-8, T-W-9, T-A-1, T-A-2, T-A-4, T-A-3M-1, M-2, M-3

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLZ-S-O.4_W01
definiuje pojęcie eksploracji danych, charakteryzuje genezę, cel, zastosowania metod eksploracji danych w naukach biologicznych, opisuje cel i etapy wstępnej obróbki danych, charakteryzuje metody redukcji wymiaru oraz główne kierunki eksploracji danych
2,0
3,0Student definiuje podstawowe pojęcia z dziedziny eksploracji danych oraz krótko charakteryzuje podstawowe etapy wstępnej obróbki danych
3,5
4,0
4,5
5,0
BL_2A_BLZ-S-O.4_W02
opisuje zastosowanie metod regresyjnych w eksploracji danych biologicznych, wskazuje na założenia stosowalności modeli, metody ich ewaluacji oraz wykorzystanie w predykcji
2,0
3,0Student krótko charakteryzuje poznane modele regresyjne
3,5
4,0
4,5
5,0
BL_2A_BLZ-S-O.4_W03
opisuje pozostałe metody eksploracji danych biologicznych oraz ich przykładowe zastosowania, dostrzegając wady i zalety każdej z metod
2,0
3,0Student krótko opisuje pozostałe metody eksploracji danych i możliwości ich zastosowania w zagadnieniach biologicznych
3,5
4,0
4,5
5,0

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLZ-S-O.4_U01
wykorzystuje zaawansowane metody statystyczne w eksploracji złożonych danych biologicznych
2,0
3,0Student wykazuje podstawowe umiejętności posługiwania się poznanymi na zajęciach programami przy tworzeniu, weryfikacji i eksploatacji modeli z dziedziny eksploracji danych do analizy zagadnień biologicznych
3,5
4,0
4,5
5,0

Literatura podstawowa

  1. Larose D.T., Metody i modele eksploracji danych, PWN, Warszawa, 2008
  2. Larose D.T., Odkrywanie wiedzy z danych, PWN, Warszawa, 2006

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przykłady wstępnej obróbki dużych zbiorów danych biologicznych. Metody redukcji wymiaru3
T-A-2Analiza dyskryminacji w zagadnieniach klasyfikacyjnych4
T-A-3Ogólne modele CHAID, drzewa klasyfikacyjne i regresyjne ze wzmacnianiem4
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu2
T-A-5Zaliczenie pisemne2
15

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Wprowadzenie w zagadnienia związane z eksploracją danych, wstępne przetwarzanie danych2
T-W-2Metody redukcji wymiaru danych, poznawanie zbioru danych, badanie relacji2
T-W-3Kierunki eksploracji - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł3
T-W-4Zastosowanie regresji w eksploracji danych. Regresja logistyczna i log-liniowa2
T-W-5Metoda MARS2
T-W-6Drzewa klasyfikacyjne i regresyjne. Losowy las. Rózne modele i ich zastosowanie3
T-W-7Metoda wektorów nośnych. Naiwny klasyfikator Bayesa. Metoda k-najbliższych sąsiadów4
T-W-8Grupowanie hierarchiczne i metodą k-średnich2
T-W-9Sztuczne sieci neuronowe, rodzaje i zastosowanie, budowa, algorytmy uczące. Algorytmy genetyczne3
T-W-10Zaliczenie pisemne wykładów2
25

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Przygotowanie do ćwiczeń audytoryjnych15
A-A-2Samodzielne studiowanie poruszanych zagadnień6
A-A-3przygotowanie do zaliczenia9
30
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1udzial studentów w wykładach25
A-W-2Przygotowanie do zaliczenia6
31
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLZ-S-O.4_W01definiuje pojęcie eksploracji danych, charakteryzuje genezę, cel, zastosowania metod eksploracji danych w naukach biologicznych, opisuje cel i etapy wstępnej obróbki danych, charakteryzuje metody redukcji wymiaru oraz główne kierunki eksploracji danych
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_W05posiada zaawansowaną wiedzę na temat możliwości wykorzystania metod obliczeniowych i informatycznych do modelowania zjawisk i procesów zachodzących na wszystkich poziomach hierarchicznej organizacji biologicznej
BL_2A_W01ma pogłębioną wiedzę o biologii, systematyce, funkcjonowaniu i rozmieszczeniu oraz ewolucji organizmów żywych oraz zna ich predyspozycje ekologiczne
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_W01rozumie złożone zjawiska i procesy przyrodnicze
P2A_W03ma pogłębioną wiedzę z zakresu tych nauk ścisłych, z którymi związany jest studiowany kierunek studiów (w szczególności biofizyka, biochemia, biomatematyka, geochemia, biogeochemia, geofizyka)
P2A_W04ma pogłębioną wiedzę z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów umożliwiającą dostrzeganie związków i zależności w przyrodzie
P2A_W05ma wiedzę w zakresie aktualnie dyskutowanych w literaturze kierunkowej problemów z wybranej dziedziny nauki i dyscypliny naukowej
P2A_W06ma wiedzę w zakresie statystyki na poziomie prognozowania (modelowania) przebiegu zjawisk i procesów przyrodniczych oraz ma znajomość specjalistycznych narzędzi informatycznych
Cel przedmiotuC-1zapoznanie studentów z różnorodnymi metodami eksploracji danych
Treści programoweT-W-1Wprowadzenie w zagadnienia związane z eksploracją danych, wstępne przetwarzanie danych
T-W-2Metody redukcji wymiaru danych, poznawanie zbioru danych, badanie relacji
T-W-3Kierunki eksploracji - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł
Metody nauczaniaM-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
M-3pokaz i teoretyczny opis różnych metod eksploracyjnych
Sposób ocenyS-1Ocena podsumowująca: zaliczenie pisemne z prezentowanego materiału na wykładach i ćwiczeniach
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student definiuje podstawowe pojęcia z dziedziny eksploracji danych oraz krótko charakteryzuje podstawowe etapy wstępnej obróbki danych
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLZ-S-O.4_W02opisuje zastosowanie metod regresyjnych w eksploracji danych biologicznych, wskazuje na założenia stosowalności modeli, metody ich ewaluacji oraz wykorzystanie w predykcji
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_W05posiada zaawansowaną wiedzę na temat możliwości wykorzystania metod obliczeniowych i informatycznych do modelowania zjawisk i procesów zachodzących na wszystkich poziomach hierarchicznej organizacji biologicznej
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_W01rozumie złożone zjawiska i procesy przyrodnicze
P2A_W03ma pogłębioną wiedzę z zakresu tych nauk ścisłych, z którymi związany jest studiowany kierunek studiów (w szczególności biofizyka, biochemia, biomatematyka, geochemia, biogeochemia, geofizyka)
P2A_W06ma wiedzę w zakresie statystyki na poziomie prognozowania (modelowania) przebiegu zjawisk i procesów przyrodniczych oraz ma znajomość specjalistycznych narzędzi informatycznych
Cel przedmiotuC-1zapoznanie studentów z różnorodnymi metodami eksploracji danych
Treści programoweT-W-4Zastosowanie regresji w eksploracji danych. Regresja logistyczna i log-liniowa
Metody nauczaniaM-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
Sposób ocenyS-1Ocena podsumowująca: zaliczenie pisemne z prezentowanego materiału na wykładach i ćwiczeniach
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student krótko charakteryzuje poznane modele regresyjne
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLZ-S-O.4_W03opisuje pozostałe metody eksploracji danych biologicznych oraz ich przykładowe zastosowania, dostrzegając wady i zalety każdej z metod
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_W05posiada zaawansowaną wiedzę na temat możliwości wykorzystania metod obliczeniowych i informatycznych do modelowania zjawisk i procesów zachodzących na wszystkich poziomach hierarchicznej organizacji biologicznej
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_W01rozumie złożone zjawiska i procesy przyrodnicze
P2A_W03ma pogłębioną wiedzę z zakresu tych nauk ścisłych, z którymi związany jest studiowany kierunek studiów (w szczególności biofizyka, biochemia, biomatematyka, geochemia, biogeochemia, geofizyka)
P2A_W06ma wiedzę w zakresie statystyki na poziomie prognozowania (modelowania) przebiegu zjawisk i procesów przyrodniczych oraz ma znajomość specjalistycznych narzędzi informatycznych
Cel przedmiotuC-1zapoznanie studentów z różnorodnymi metodami eksploracji danych
Treści programoweT-W-6Drzewa klasyfikacyjne i regresyjne. Losowy las. Rózne modele i ich zastosowanie
T-W-7Metoda wektorów nośnych. Naiwny klasyfikator Bayesa. Metoda k-najbliższych sąsiadów
T-W-5Metoda MARS
T-W-8Grupowanie hierarchiczne i metodą k-średnich
T-W-9Sztuczne sieci neuronowe, rodzaje i zastosowanie, budowa, algorytmy uczące. Algorytmy genetyczne
Metody nauczaniaM-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
Sposób ocenyS-1Ocena podsumowująca: zaliczenie pisemne z prezentowanego materiału na wykładach i ćwiczeniach
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student krótko opisuje pozostałe metody eksploracji danych i możliwości ich zastosowania w zagadnieniach biologicznych
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLZ-S-O.4_U01wykorzystuje zaawansowane metody statystyczne w eksploracji złożonych danych biologicznych
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_U07ma pogłębioną wiedzę bioinformatyczną i posiada umiejętność jej stosowania w pracy biologa, posługuje się metodami statystyki matematycznej w analizie danych doświadczalnych i obserwacji biologicznych;
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_U03wykazuje umiejętność krytycznej analizy i selekcji informacji, zwłaszcza ze źródeł elektronicznych
P2A_U05stosuje metody statystyczne oraz techniki i narzędzia informatyczne do opisu zjawisk i analizy danych o charakterze specjalistycznym
Cel przedmiotuC-1zapoznanie studentów z różnorodnymi metodami eksploracji danych
Treści programoweT-A-1Przykłady wstępnej obróbki dużych zbiorów danych biologicznych. Metody redukcji wymiaru
T-A-2Analiza dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-3Ogólne modele CHAID, drzewa klasyfikacyjne i regresyjne ze wzmacnianiem
Metody nauczaniaM-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
M-3pokaz i teoretyczny opis różnych metod eksploracyjnych
Sposób ocenyS-1Ocena podsumowująca: zaliczenie pisemne z prezentowanego materiału na wykładach i ćwiczeniach
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student wykazuje podstawowe umiejętności posługiwania się poznanymi na zajęciach programami przy tworzeniu, weryfikacji i eksploatacji modeli z dziedziny eksploracji danych do analizy zagadnień biologicznych
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLZ-S-O.4_K01jest zdolny do efektywnej pracy indywidualnej
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_K05wykazuje zdyscyplinowanie w pracy indywidualnej oraz aktywnie uczestniczy w pracy grupowej; samodzielnie i kreatywnie potrafi planować, organizować i realizować działania własne oraz zespołowe
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_K01rozumie potrzebę uczenia się przez całe życie, potrafi inspirować i organizować proces uczenia się innych osób
P2A_K02potrafi współdziałać i pracować w grupie, przyjmując w niej różne role
P2A_K03potrafi odpowiednio określić priorytety służące realizacji określonego przez siebie lub innych zadania
P2A_K08potrafi myśleć i działać w sposób przedsiębiorczy
Cel przedmiotuC-1zapoznanie studentów z różnorodnymi metodami eksploracji danych
Treści programoweT-A-1Przykłady wstępnej obróbki dużych zbiorów danych biologicznych. Metody redukcji wymiaru
T-A-2Analiza dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-3Ogólne modele CHAID, drzewa klasyfikacyjne i regresyjne ze wzmacnianiem
Metody nauczaniaM-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
M-3pokaz i teoretyczny opis różnych metod eksploracyjnych
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLZ-S-O.4_K02wykorzystuje metody statystyczne w interpretowaniu zjawisk i procesów biologicznych, dając tym samym wyraz swojego przekonania o ich poznawalności
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_K01wykazuje zrozumienie i przekonanie o poznawalności procesów i zjawisk biologicznych zachodzących w świecie żywych organizmów; w interpretowaniu procesów i zjawisk biologicznych wykorzystuje podejście naukowe
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_K04prawidłowo identyfikuje i rozstrzyga dylematy związane z wykonywaniem zawodu
P2A_K07systematycznie aktualizuje wiedzę przyrodniczą i zna jej praktyczne zastosowania
Cel przedmiotuC-1zapoznanie studentów z różnorodnymi metodami eksploracji danych
Treści programoweT-W-6Drzewa klasyfikacyjne i regresyjne. Losowy las. Rózne modele i ich zastosowanie
T-W-7Metoda wektorów nośnych. Naiwny klasyfikator Bayesa. Metoda k-najbliższych sąsiadów
T-W-1Wprowadzenie w zagadnienia związane z eksploracją danych, wstępne przetwarzanie danych
T-W-2Metody redukcji wymiaru danych, poznawanie zbioru danych, badanie relacji
T-W-3Kierunki eksploracji - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł
T-W-4Zastosowanie regresji w eksploracji danych. Regresja logistyczna i log-liniowa
T-W-5Metoda MARS
T-W-8Grupowanie hierarchiczne i metodą k-średnich
T-W-9Sztuczne sieci neuronowe, rodzaje i zastosowanie, budowa, algorytmy uczące. Algorytmy genetyczne
T-A-1Przykłady wstępnej obróbki dużych zbiorów danych biologicznych. Metody redukcji wymiaru
T-A-2Analiza dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-3Ogólne modele CHAID, drzewa klasyfikacyjne i regresyjne ze wzmacnianiem
Metody nauczaniaM-1wykład informacyjny prezentujący omawiane zagadnienia
M-2prezentacje multimedialne z pomoca komputera i projektora
M-3pokaz i teoretyczny opis różnych metod eksploracyjnych