Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Biotechnologii i Hodowli Zwierząt - Biologia (S2)
specjalność: Biologia molekularna i podstawy analityki

Sylabus przedmiotu Metody data mining w badaniach biologicznych:

Informacje podstawowe

Kierunek studiów Biologia
Forma studiów studia stacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister
Obszary studiów nauk przyrodniczych
Profil ogólnoakademicki
Moduł
Przedmiot Metody data mining w badaniach biologicznych
Specjalność Biologia molekularna i podstawy analityki
Jednostka prowadząca Katedra Nauk o Zwierzętach Przeżuwających
Nauczyciel odpowiedzialny Wilhelm Grzesiak <Wilhelm.Grzesiak@zut.edu.pl>
Inni nauczyciele Daniel Zaborski <Daniel.Zaborski@zut.edu.pl>
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 6 Grupa obieralna 4

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
ćwiczenia audytoryjneA3 15 1,50,41zaliczenie
wykładyW3 15 1,50,59zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawy statystyki i metod stosowanych w statystyce

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych3
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych4
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji4
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu2
T-A-5Zaliczenie pisemne2
15
wykłady
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych2
T-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji2
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul1
T-W-4Modele regresji wielorakiej i regresji logistycznej,4
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące4
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS2
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Przygotowanie do zajęć15
A-A-2Samodzielne studiowanie tematyki ćwiczeń audytoryjnych15
A-A-3Przygotowanie do zaliczenia15
45
wykłady
A-W-1udzial studentów w wykładach15
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia15
A-W-3Przygotowanie do pisemnego zaliczenia15
45

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody

Sposoby oceny

KODSposób oceny
S-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_W01
umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
BL_2A_W05P2A_W01, P2A_W03, P2A_W06C-1T-W-5, T-W-3, T-W-2, T-W-6, T-W-4, T-W-1M-2, M-1, M-3S-1

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_U01
Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
BL_2A_U07, BL_2A_U15P2A_U02, P2A_U03, P2A_U05, P2A_U06, P2A_U07, P2A_U09, P2A_U10C-1T-A-4, T-A-2, T-A-3, T-A-5, T-A-1M-2, M-1, M-3S-1

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_K01
jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukoego
BL_2A_K01P2A_K04, P2A_K07C-1T-W-2, T-W-5, T-W-4, T-A-2, T-W-6, T-A-5, T-A-3, T-A-1, T-W-3, T-A-4, T-W-1M-2, M-1, M-3S-1

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLM-S-O4.4_W01
umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
2,0
3,0Student potrafi opisać stosowane na zajęciach metody data mining
3,5
4,0
4,5
5,0

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLM-S-O4.4_U01
Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
2,0
3,0Student potrafi w oparciu o program komputerowy przeprowadzić analizę danych za pomoca wybranej metody data mining
3,5
4,0
4,5
5,0

Literatura podstawowa

  1. Stanisz A., Przystępny kurs statystyki. t III Analizy wielowymiarowe., StatSoft, Kraków, 2005
  2. Gatnar E., Podejście wielomodelowe w zagadnieniach dyskryminacji i regresji, PWN, Warszawa, 2008

Literatura dodatkowa

  1. Hastie T., Tibshirani R., Friedman J., The elements of Statistical Learning, Data mining Inference and Prediction, Springer, 2001

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych3
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych4
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji4
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu2
T-A-5Zaliczenie pisemne2
15

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych2
T-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji2
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul1
T-W-4Modele regresji wielorakiej i regresji logistycznej,4
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące4
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS2
15

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Przygotowanie do zajęć15
A-A-2Samodzielne studiowanie tematyki ćwiczeń audytoryjnych15
A-A-3Przygotowanie do zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1udzial studentów w wykładach15
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia15
A-W-3Przygotowanie do pisemnego zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_W01umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_W05posiada zaawansowaną wiedzę na temat możliwości wykorzystania metod obliczeniowych i informatycznych do modelowania zjawisk i procesów zachodzących na wszystkich poziomach hierarchicznej organizacji biologicznej
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_W01rozumie złożone zjawiska i procesy przyrodnicze
P2A_W03ma pogłębioną wiedzę z zakresu tych nauk ścisłych, z którymi związany jest studiowany kierunek studiów (w szczególności biofizyka, biochemia, biomatematyka, geochemia, biogeochemia, geofizyka)
P2A_W06ma wiedzę w zakresie statystyki na poziomie prognozowania (modelowania) przebiegu zjawisk i procesów przyrodniczych oraz ma znajomość specjalistycznych narzędzi informatycznych
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul
T-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS
T-W-4Modele regresji wielorakiej i regresji logistycznej,
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student potrafi opisać stosowane na zajęciach metody data mining
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_U01Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_U07ma pogłębioną wiedzę bioinformatyczną i posiada umiejętność jej stosowania w pracy biologa, posługuje się metodami statystyki matematycznej w analizie danych doświadczalnych i obserwacji biologicznych;
BL_2A_U15student posiada umiejętność prawidłowego zastosowania specjalistycznej terminologii, a w pracy badawczej zastosować poznane metody, potrafi także przygotować projekt własnych badań naukowych prawidłowo dobierając piśmiennictwo;
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_U02biegle wykorzystuje literaturę naukową z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów, w języku polskim; czyta ze zrozumieniem skomplikowane teksty naukowe w języku angielskim
P2A_U03wykazuje umiejętność krytycznej analizy i selekcji informacji, zwłaszcza ze źródeł elektronicznych
P2A_U05stosuje metody statystyczne oraz techniki i narzędzia informatyczne do opisu zjawisk i analizy danych o charakterze specjalistycznym
P2A_U06zbiera i interpretuje dane empiryczne oraz na tej podstawie formułuje odpowiednie wnioski
P2A_U07wykazuje umiejętność formułowania uzasadnionych sądów na podstawie danych pochodzących z różnych źródeł
P2A_U09wykazuje umiejętność napisania pracy badawczej w języku polskim oraz krótkiego doniesienia naukowego w języku obcym na podstawie własnych badań naukowych
P2A_U10posiada umiejętność wystąpień ustnych w języku polskim i języku obcym dotyczących, zagadnień szczegółowych z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji
T-A-5Zaliczenie pisemne
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student potrafi w oparciu o program komputerowy przeprowadzić analizę danych za pomoca wybranej metody data mining
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_K01jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukoego
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_K01wykazuje zrozumienie i przekonanie o poznawalności procesów i zjawisk biologicznych zachodzących w świecie żywych organizmów; w interpretowaniu procesów i zjawisk biologicznych wykorzystuje podejście naukowe
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_K04prawidłowo identyfikuje i rozstrzyga dylematy związane z wykonywaniem zawodu
P2A_K07systematycznie aktualizuje wiedzę przyrodniczą i zna jej praktyczne zastosowania
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-W-4Modele regresji wielorakiej i regresji logistycznej,
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS
T-A-5Zaliczenie pisemne
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń