Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Biotechnologii i Hodowli Zwierząt - Biologia (S2)
specjalność: Biologia molekularna i podstawy analityki

Sylabus przedmiotu Metody data mining w badaniach biologicznych:

Informacje podstawowe

Kierunek studiów Biologia
Forma studiów studia stacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister
Obszary studiów nauki przyrodnicze
Profil ogólnoakademicki
Moduł
Przedmiot Metody data mining w badaniach biologicznych
Specjalność Biologia molekularna i podstawy analityki
Jednostka prowadząca Katedra Nauk o Zwierzętach Przeżuwających
Nauczyciel odpowiedzialny Wilhelm Grzesiak <Wilhelm.Grzesiak@zut.edu.pl>
Inni nauczyciele Daniel Zaborski <Daniel.Zaborski@zut.edu.pl>
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 7 Grupa obieralna 4

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
wykładyW3 15 1,50,59zaliczenie
ćwiczenia audytoryjneA3 15 1,50,41zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawy statystyki i metod stosowanych w statystyce

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych3
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych4
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji4
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu2
T-A-5Zaliczenie pisemne2
15
wykłady
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych2
T-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji2
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul1
T-W-4Modele regresji wielorakiej i regresji logistycznej,4
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące4
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS2
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Uczestnictwo w zajęciach15
A-A-2Przygotowanie do zajęć7
A-A-3Samodzielne studiowanie tematyki ćwiczeń audytoryjnych8
A-A-4Przygotowanie do zaliczenia15
45
wykłady
A-W-1udzial studentów w wykładach15
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia15
A-W-3Przygotowanie do pisemnego zaliczenia15
45

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody

Sposoby oceny

KODSposób oceny
S-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_W01
umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
BL_2A_W05C-1T-W-2, T-W-4, T-W-6, T-W-3, T-W-5, T-W-1M-2, M-1, M-3S-1

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_U01
Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
BL_2A_U07, BL_2A_U15C-1T-A-2, T-A-1, T-A-3, T-A-4, T-A-5M-2, M-1, M-3S-1

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_K01
jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukoego
BL_2A_K01C-1T-A-2, T-A-1, T-A-3, T-A-4, T-A-5, T-W-2, T-W-4, T-W-6, T-W-3, T-W-5, T-W-1M-2, M-1, M-3S-1

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLM-S-O4.4_W01
umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
2,0
3,0Student potrafi opisać stosowane na zajęciach metody data mining
3,5
4,0
4,5
5,0

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLM-S-O4.4_U01
Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
2,0
3,0Student potrafi w oparciu o program komputerowy przeprowadzić analizę danych za pomoca wybranej metody data mining
3,5
4,0
4,5
5,0

Literatura podstawowa

  1. Stanisz A., Przystępny kurs statystyki. t III Analizy wielowymiarowe., StatSoft, Kraków, 2005
  2. Gatnar E., Podejście wielomodelowe w zagadnieniach dyskryminacji i regresji, PWN, Warszawa, 2008

Literatura dodatkowa

  1. Hastie T., Tibshirani R., Friedman J., The elements of Statistical Learning, Data mining Inference and Prediction, Springer, 2001

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych3
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych4
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji4
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu2
T-A-5Zaliczenie pisemne2
15

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych2
T-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji2
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul1
T-W-4Modele regresji wielorakiej i regresji logistycznej,4
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące4
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS2
15

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Uczestnictwo w zajęciach15
A-A-2Przygotowanie do zajęć7
A-A-3Samodzielne studiowanie tematyki ćwiczeń audytoryjnych8
A-A-4Przygotowanie do zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1udzial studentów w wykładach15
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia15
A-W-3Przygotowanie do pisemnego zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_W01umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_W05posiada zaawansowaną wiedzę na temat możliwości wykorzystania metod obliczeniowych i informatycznych do modelowania zjawisk i procesów zachodzących na wszystkich poziomach hierarchicznej organizacji biologicznej
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji
T-W-4Modele regresji wielorakiej i regresji logistycznej,
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student potrafi opisać stosowane na zajęciach metody data mining
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_U01Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_U07ma pogłębioną wiedzę bioinformatyczną i posiada umiejętność jej stosowania w pracy biologa, posługuje się metodami statystyki matematycznej w analizie danych doświadczalnych i obserwacji biologicznych;
BL_2A_U15student posiada umiejętność prawidłowego zastosowania specjalistycznej terminologii, a w pracy badawczej zastosować poznane metody, potrafi także przygotować projekt własnych badań naukowych prawidłowo dobierając piśmiennictwo;
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-5Zaliczenie pisemne
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student potrafi w oparciu o program komputerowy przeprowadzić analizę danych za pomoca wybranej metody data mining
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_K01jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukoego
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_K01wykazuje zrozumienie i przekonanie o poznawalności procesów i zjawisk biologicznych zachodzących w świecie żywych organizmów; w interpretowaniu procesów i zjawisk biologicznych wykorzystuje podejście naukowe
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-5Zaliczenie pisemne
T-W-2Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji
T-W-4Modele regresji wielorakiej i regresji logistycznej,
T-W-6Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń