Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Biotechnologii i Hodowli Zwierząt - Bioinformatyka (S1)

Sylabus przedmiotu Eksploracja danych w genotypowych bazach danych:

Informacje podstawowe

Kierunek studiów Bioinformatyka
Forma studiów studia stacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów nauk przyrodniczych, nauk technicznych, studiów inżynierskich
Profil ogólnoakademicki
Moduł
Przedmiot Eksploracja danych w genotypowych bazach danych
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Przemysław Klęsk <pklesk@wi.zut.edu.pl>
Inni nauczyciele
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 15 Grupa obieralna 1

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
laboratoriaL7 15 1,50,41zaliczenie
wykładyW7 15 1,50,59zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1matematyka
W-2algorytmy i struktury danych
W-3podstawy programowania

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie studentów z zadaniem klasyfikacji (w ramach eksploracji danych). Zapoznanie z różnymi technikami budowania klasyfikatorów: naiwny Bayes, drzewa decyzyjne, klasyfikacja poprzez regresję z regularyzacją, które mogą być przydatne w analizach danych genotypowych.
C-2Zapoznanie studentów z różnymi technikami indukcji reguł na podstawie danych - reguły asocjacyjne oraz reguły decyzyjne. Przedstawienie możliwości zastosowania reguł w markerach genetycznych.

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Naiwny klasyfikator Bayesa dla zbiorów danych: "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".4
T-L-2Indukcja reguł dla zbiorów danych: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".4
T-L-3Regresje ridge i lasso dla zbiorów danych: "wydajność mleka", "standaryzowana masa ciała", "przyrosty masy ciała".3
T-L-4Drzewa decyzyjne dla zbiorów: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".4
15
wykłady
T-W-1Przypomnienie wybranych wiadomości z rachunku prawdopodobieństwa i statystyki. Naiwny klasyfikator Bayesa – klasyfikacja pacjentów (chorzy/zdrowi) na podstawie zbiorów danych genetycznych. Czułość i specyficzność klasyfikatora (przykład z testem na obecność narkotyków). Wielokrotne testowanie – bootstrap i kroswalidacja. Reguła Bayesa i uaktualnianie rozkładów/modeli na podstawie nowoprzychodzących danych. Rodzina rozkładów beta.5
T-W-2Indukcja reguł asocjacyjnych – algorytm A priori. Pojęcia: zbiór częsty, wsparcie i zaufanie reguły. Asocjacje pomiędzy genami i grupami genów.2
T-W-3Indukcja reguł decyzyjnych – algorytm do zachłannego wyszukiwania reguł. Miary oceny reguł: zaufanie, entropia, liczba Kullbacka-Leiblera. Istotność atrybutów i grup atrybutów (w szczególności grup genów).2
T-W-4Reguły Pareto-optymalne. Algorytm „wyciągania” kolejnych brzegów Pareto. Algorytm pokryciowy. Klasyfikator regułowy. Testowanie reguł – test dokładny Fischera. Przykłady zastosowania indukcji reguł decyzyjnych: wykrywanie markerów genetycznych, problem sodowrażliwości nadciśnienia tętniczego warunkowanej genetycznie.2
T-W-5Klasyfikatory liniowe (i wielomianowe) z technikami regularyzacji na współczynniki (ridge, lasso). Twierdzenia o ściąganiu atrybutów skorelowanych (shrinkage). Selekcja atrybutów poprzez regularyzację.2
T-W-6Drzewa do klasyfikacji – algorytm CART. Funkcje nieczystości: błąd klasyfikacji, entropia, indeks Gini’ego. Przycinanie drzewa z ustaloną karą za liść. Przycinanie drzewa poprzez kroswalidację2
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1Udział w zajęciach.15
A-L-2Obróbka i analizy zbiorów danych za pomocą zaimplementowanych algorytmów.20
A-L-3Przygotowanie się do wejściówek i zaliczania programów.10
45
wykłady
A-W-1Samodzielne uzupełnienie wiadomości z zakresu podstaw rachunku prawdodpodobieństwa i statystyki.5
A-W-2Pisemne przećwiczenie na przykładach technik probabilistycznych związanych z twierdzeniem Bayesa (maximum a posteriori, rozklady beta, poprawka LaPlace'a).4
A-W-3Uzupełnienie wiadomości z wykładu na temat praktycznych zastosowań indukcji reguł decyzyjnych i asocjacyjnych.4
A-W-4Zrozumienie istoty różnicy pomiędzy regularyzacjami ridge i lasso. Przeglądanie zbiorów danych pod kątem sprawdzenia, gdzie lepiej zachowują się poszczególne rodzaje regularyzacji - próba uzasadnienia dlaczego tak jest.8
A-W-5Przećwiczenie wybranych elementów dotyczących budowy i przycinania drzew decyzyjnych.4
A-W-6Przygotowanie do kolokwium zaliczeniowego.20
45

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład informacyjny.
M-2Metoda przypadków.
M-3Metody programowane z użyciem komputera.

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: Pięć ocen cząstkowych za programy na laboratoria.
S-2Ocena formująca: Pięć ocen cząstkowych za wejściówki z laboratoriów.
S-3Ocena podsumowująca: Ocena końcowa z laboratoriów jako średnia ważona z ocen za: - programy (60%), - wejściówki (40%).
S-4Ocena podsumowująca: Ocena za końcowe kolokwium zaliczeniowe.

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BI_1A_BI-S-O12.1_W01
Ma dobre opanowanie elementów rachunku prawdopodobieństwa i statystyki potrzebnych przy algorytmach eksploracji danych.
BI_1A_W01, BI_1A_W13, BI_1A_W17P1A_W02, P1A_W03, P1A_W04, P1A_W05, P1A_W06, P1A_W07, T1A_W01, T1A_W02, T1A_W03, T1A_W04, T1A_W06, T1A_W07, T1A_W08InzA_W01, InzA_W02, InzA_W03, InzA_W05C-1, C-2T-W-1M-1, M-2S-4
BI_1A_BI-S-O12.1_W02
Zna możliwości podstawowych metod/algorytmów eksploracji danych.
BI_1A_W01, BI_1A_W13, BI_1A_W17P1A_W02, P1A_W03, P1A_W04, P1A_W05, P1A_W06, P1A_W07, T1A_W01, T1A_W02, T1A_W03, T1A_W04, T1A_W06, T1A_W07, T1A_W08InzA_W01, InzA_W02, InzA_W03, InzA_W05C-1, C-2T-W-2, T-W-3, T-W-6, T-W-4, T-W-5, T-L-1, T-L-2, T-L-3, T-L-4M-1, M-2S-4

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BI_1A_BI-S-O12.1_U01
Umie budować (zaprogramować) naiwny klasyfikator bayesowski.
BI_1A_U01, BI_1A_U13P1A_U01, P1A_U02, P1A_U04, T1A_U01, T1A_U03, T1A_U04, T1A_U08, T1A_U09, T1A_U10InzA_U02, InzA_U05, InzA_U06C-1T-W-1, T-L-1M-3S-1, S-2, S-3
BI_1A_BI-S-O12.1_U02
Umie zbudować (zaprogramować) klasyfikatory oparte na drzewach decyzyjnych CART.
BI_1A_U01, BI_1A_U13P1A_U01, P1A_U02, P1A_U04, T1A_U01, T1A_U03, T1A_U04, T1A_U08, T1A_U09, T1A_U10InzA_U02, InzA_U05, InzA_U06C-1T-W-6, T-L-4M-3S-1, S-2, S-3
BI_1A_BI-S-O12.1_U03
Potrafi wyszukiwać ciekawe reguły asocjacyjne i decyzyjne w dużych zbiorach danych.
BI_1A_U01, BI_1A_U13P1A_U01, P1A_U02, P1A_U04, T1A_U01, T1A_U03, T1A_U04, T1A_U08, T1A_U09, T1A_U10InzA_U02, InzA_U05, InzA_U06C-2T-W-2, T-L-2M-3S-1, S-2, S-3
BI_1A_BI-S-O12.1_U04
Potrafi stosować techniki regularyzacji (ridge, lasso) w celu selekcji atrybutów w modelach liniowych.
BI_1A_U01, BI_1A_U13P1A_U01, P1A_U02, P1A_U04, T1A_U01, T1A_U03, T1A_U04, T1A_U08, T1A_U09, T1A_U10InzA_U02, InzA_U05, InzA_U06C-1T-W-5, T-L-3M-3S-1, S-2, S-3

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BI_1A_BI-S-O12.1_K01
Potrafi formułować i rozwiązywać wybrane problemy biologiczne jako problemy analizy danych i uczenia maszynowego.
BI_1A_K02P1A_K01, P1A_K04T-W-1, T-W-2, T-W-3, T-W-6, T-W-4, T-W-5, T-L-1, T-L-2, T-L-3, T-L-4

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
BI_1A_BI-S-O12.1_W01
Ma dobre opanowanie elementów rachunku prawdopodobieństwa i statystyki potrzebnych przy algorytmach eksploracji danych.
2,0Nie rozumie podstawowych pojęć z rachunku prawdopodobieństwa: prawdopodobieństwo warunkowe, prawdopodobieństwo całkowite, reguła Bayesa.
3,0Rozumie podstawowe pojęcia z rachunku prawdopodobieństwa: prawdopodobieństwo warunkowe, prawdopodobieństwo całkowite, reguła Bayesa.
3,5Umie zdefiniować pojęcia: dokładność klasyfikatora, czułość klasyfikatora, specyficzność klasyfikatora.
4,0Potrafi budować przedziały ufności na dokładność, czułość i specyficzność z wykorzystaniem nierówności Chernoffa.
4,5Rozumie pojęcia: a priori, likelihood, a posteriori. Potrafi przeliczać proste przykłady z użyciem reguły Bayesa.
5,0Potrafi przeliczać przykłady z użyciem reguły Bayesa oraz wykorzystaniem rodziny rozkładów beta.
BI_1A_BI-S-O12.1_W02
Zna możliwości podstawowych metod/algorytmów eksploracji danych.
2,0Nie potrafi wyjaśnić sposobu działania naiwnego klasyfikatora Bayesowskiego.
3,0Potrafi wyjaśnić sposób działania naiwnego klasyfikatora Bayesowskiego.
3,5Potrafi wyjaśnić algorytm budowania i przycinania drzewa decyzyjnego CART.
4,0Potrafi podać algorytm A priori do indukcji reguł asocjacyjnych.
4,5Potrafi podać techniki indukcji reguł decyzyjnych i ich mierniki oceny.
5,0Potrafi podać algorytmy uczenia klasyfikatorów poprzez regresję z regularyzacją (rigde oraz lasso).

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
BI_1A_BI-S-O12.1_U01
Umie budować (zaprogramować) naiwny klasyfikator bayesowski.
2,0Nie potrafi zaprogramować podstawowych operacji związanych z odczytaniem i wstępną obróką danych.
3,0Potrafi zaprogramować podstawowe operacje związane z odczytaniem i wstępną obróką danych.
3,5Potrafi zaprogramować skrypt realizujący uczenie klasyfikatora Bayesowskiego (sporządzenie ewidencji potrzebnych rozkładów warunkowych).
4,0Potrafi zaprogramować skrypt realizujący faktyczną klasyfikację za pomocą klasyfikatora Bayesowskiego dla nowoprzychodzących obiektów; oraz skrypty oceniające dokładność klasyfikatora.
4,5Potrafi wykonać wszystkie ww. operacje dla nowego zbioru danych.
5,0Potrafi ocenić dokładność klasyfikatora poprzez krzyżową walidację i bootstrap.
BI_1A_BI-S-O12.1_U02
Umie zbudować (zaprogramować) klasyfikatory oparte na drzewach decyzyjnych CART.
2,0Nie potrafi zaprogramować podstawowych operacji związanych z odczytaniem i wstępną obróką danych.
3,0Potrafi zaprogramować podstawowe operacje związane z odczytaniem i wstępną obróką danych.
3,5Potrafi zaprogramować różne wersje funkcji nieczystości.
4,0Potrafi zaprogramować skrypt do budowy pełnego (nieprzyciętego) drzewa CART.
4,5Potrafi zaprogramować skrypt do przycinania drzewa CART.
5,0Potrafi wykonać wszystkie ww. operacje dla nowego zbioru danych.
BI_1A_BI-S-O12.1_U03
Potrafi wyszukiwać ciekawe reguły asocjacyjne i decyzyjne w dużych zbiorach danych.
2,0Nie potrafi zaprogramować podstawowego zliczania wsparć w ramach algorytmu A priori.
3,0Potrafi zaprogramować podstawowe zliczanie wsparć w ramach algorytmu A priori.
3,5Potrafi zaprogramować indukcję znajdującą zbiory częste w ramach algorytmu A priori.
4,0Potrafi zaprogramować generator reguł asocjacyjnych na podstawie zbiorów częstych i minimalnego zaufania w ramach algorytmu A priori.
4,5Potrafi zaprogramować wyczerpujące generowanie reguł decyzyjnych oraz ich ocenę przy pomocy entropii i liczby Kullbacka-Leiblera.
5,0Potrafi zaprogramować wykrywanie zbioru reguł Pareto-optymalnych.
BI_1A_BI-S-O12.1_U04
Potrafi stosować techniki regularyzacji (ridge, lasso) w celu selekcji atrybutów w modelach liniowych.
2,0Nie potrafi zaprogramować uczenia klasyfikatora liniowego poprzez metodę najmniejszych kwadratów.
3,0Potrafi zaprogramować uczenie klasyfikatora liniowego poprzez metodę najmniejszych kwadratów.
3,5Potrafi rozszerzyć rozwiązanie najmniejszych kwadratów o regularyzację L2 (ridge).
4,0Dla regularyzacji ridge potrafi dobrać odpowiedni współczynnik regularyzacyjny.
4,5Potrafi rozszerzyć klasyfikator liniowy do klasyfikatora wielomianowego (elementy kombinatoryczne - dowolna liczba zmiennych i dowolny stopień wielomianu).
5,0Potrafi zaprogramować algorytm Forward Stagewise Lasso; oraz dobrać odpowiedni współczynnik regularyzacyjny.

Kryterium oceny - inne kompetencje społeczne i personalne

Efekt kształceniaOcenaKryterium oceny
BI_1A_BI-S-O12.1_K01
Potrafi formułować i rozwiązywać wybrane problemy biologiczne jako problemy analizy danych i uczenia maszynowego.
2,0Nie potrafi wskazać podstawowych pojęć z zakresu rachunku prawdopodobieństwa przydatnych w eksploracji danych.
3,0Potrafi wskazać podstawowe pojęcia z zakresu rachunku prawdopodobieństwa przydatne w eksploracji danych.
3,5Umie podać przykłady różnych algorytmów klasyfikacji wraz z ich podstawowymi własnościami.
4,0Umie podać różne techniki indukcji reguł asocjacyjnych i decyzyjnych.
4,5Potrafi ocenić dokładność (czułość, specyficzność, przedziały ufności) otrzymanych klasyfikatorów lub reguł.
5,0Dla podanego nowego problemu potrafi wskazać możliwe sposoby rozwiązania go metodami eksploracji danych.

Literatura podstawowa

  1. D. Hand, H. Mannila, P. Smyth, Eksploracja danych, WNT, Warszawa, 2005
  2. J. Koronacki., J. Ćwik, Statystyczne systemy uczące się, WNT, Warszawa, 2005
  3. W. J. Ewens, G. R. Grant, Statistical Methods in Bionformatics: An Introduction, Springer, 2010, 2
  4. A. D. Baxevanis, B. F. F. Quellette, Bioinformatyka. Podręcznik do analizy genów i białek, PWN, 2005

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Naiwny klasyfikator Bayesa dla zbiorów danych: "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".4
T-L-2Indukcja reguł dla zbiorów danych: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".4
T-L-3Regresje ridge i lasso dla zbiorów danych: "wydajność mleka", "standaryzowana masa ciała", "przyrosty masy ciała".3
T-L-4Drzewa decyzyjne dla zbiorów: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".4
15

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Przypomnienie wybranych wiadomości z rachunku prawdopodobieństwa i statystyki. Naiwny klasyfikator Bayesa – klasyfikacja pacjentów (chorzy/zdrowi) na podstawie zbiorów danych genetycznych. Czułość i specyficzność klasyfikatora (przykład z testem na obecność narkotyków). Wielokrotne testowanie – bootstrap i kroswalidacja. Reguła Bayesa i uaktualnianie rozkładów/modeli na podstawie nowoprzychodzących danych. Rodzina rozkładów beta.5
T-W-2Indukcja reguł asocjacyjnych – algorytm A priori. Pojęcia: zbiór częsty, wsparcie i zaufanie reguły. Asocjacje pomiędzy genami i grupami genów.2
T-W-3Indukcja reguł decyzyjnych – algorytm do zachłannego wyszukiwania reguł. Miary oceny reguł: zaufanie, entropia, liczba Kullbacka-Leiblera. Istotność atrybutów i grup atrybutów (w szczególności grup genów).2
T-W-4Reguły Pareto-optymalne. Algorytm „wyciągania” kolejnych brzegów Pareto. Algorytm pokryciowy. Klasyfikator regułowy. Testowanie reguł – test dokładny Fischera. Przykłady zastosowania indukcji reguł decyzyjnych: wykrywanie markerów genetycznych, problem sodowrażliwości nadciśnienia tętniczego warunkowanej genetycznie.2
T-W-5Klasyfikatory liniowe (i wielomianowe) z technikami regularyzacji na współczynniki (ridge, lasso). Twierdzenia o ściąganiu atrybutów skorelowanych (shrinkage). Selekcja atrybutów poprzez regularyzację.2
T-W-6Drzewa do klasyfikacji – algorytm CART. Funkcje nieczystości: błąd klasyfikacji, entropia, indeks Gini’ego. Przycinanie drzewa z ustaloną karą za liść. Przycinanie drzewa poprzez kroswalidację2
15

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Udział w zajęciach.15
A-L-2Obróbka i analizy zbiorów danych za pomocą zaimplementowanych algorytmów.20
A-L-3Przygotowanie się do wejściówek i zaliczania programów.10
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Samodzielne uzupełnienie wiadomości z zakresu podstaw rachunku prawdodpodobieństwa i statystyki.5
A-W-2Pisemne przećwiczenie na przykładach technik probabilistycznych związanych z twierdzeniem Bayesa (maximum a posteriori, rozklady beta, poprawka LaPlace'a).4
A-W-3Uzupełnienie wiadomości z wykładu na temat praktycznych zastosowań indukcji reguł decyzyjnych i asocjacyjnych.4
A-W-4Zrozumienie istoty różnicy pomiędzy regularyzacjami ridge i lasso. Przeglądanie zbiorów danych pod kątem sprawdzenia, gdzie lepiej zachowują się poszczególne rodzaje regularyzacji - próba uzasadnienia dlaczego tak jest.8
A-W-5Przećwiczenie wybranych elementów dotyczących budowy i przycinania drzew decyzyjnych.4
A-W-6Przygotowanie do kolokwium zaliczeniowego.20
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_W01Ma dobre opanowanie elementów rachunku prawdopodobieństwa i statystyki potrzebnych przy algorytmach eksploracji danych.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_W01zna zjawiska fizyczne i biologiczne, procesy chemiczne oraz analizy matematyczne przydatne przy posługiwaniu się narzędziami bioinformatycznymi
BI_1A_W13ma podstawową wiedzę dotyczącą metod sztucznej inteligencji i uczenia maszynowego
BI_1A_W17posiada wiedzę o narzędziach matematycznych i informatycznych, wykorzystywanych w analizach biologicznych i bioinformatycznych
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_W02w interpretacji zjawisk i procesów przyrodniczych opiera się na podstawach empirycznych, rozumiejąc w pełni znaczenie metod matematycznych i statystycznych
P1A_W03ma wiedzę z zakresu matematyki, fizyki i chemii niezbędną dla zrozumienia podstawowych procesów i zjawisk przyrodniczych
P1A_W04ma wiedzę w zakresie najważniejszych problemów z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów oraz zna ich powiązania z innymi dyscyplinami przyrodniczymi
P1A_W05ma wiedzę w zakresie podstawowych kategorii pojęciowych i terminologii przyrodniczej oraz ma znajomość rozwoju dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów i stosowanych w nich metod badawczych
P1A_W06ma wiedzę w zakresie statystyki i informatyki na poziomie pozwalającym na opisywanie i interpretowanie zjawisk przyrodniczych
P1A_W07ma wiedzę w zakresie podstawowych technik i narzędzi badawczych stosowanych w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
T1A_W01ma wiedzę z zakresu matematyki, fizyki, chemii i innych obszarów właściwych dla studiowanego kierunku studiów przydatną do formułowania i rozwiązywania prostych zadań z zakresu studiowanego kierunku studiów
T1A_W02ma podstawową wiedzę w zakresie kierunków studiów powiązanych ze studiowanym kierunkiem studiów
T1A_W03ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną obejmującą kluczowe zagadnienia z zakresu studiowanego kierunku studiów
T1A_W04ma szczegółową wiedzę związaną z wybranymi zagadnieniami z zakresu studiowanego kierunku studiów
T1A_W06ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
T1A_W07zna podstawowe metody, techniki, narzędzia i materiały stosowane przy rozwiązywaniu prostych zadań inżynierskich z zakresu studiowanego kierunku studiów
T1A_W08ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych pozatechnicznych uwarunkowań działalności inżynierskiej
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_W01ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
InzA_W02zna podstawowe metody, techniki, narzędzia i materiały stosowane przy rozwiązywaniu prostych zadań inżynierskich z zakresu studiowanego kierunku studiów
InzA_W03ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych uwarunkowań działalności inżynierskiej
InzA_W05zna typowe technologie inżynierskie w zakresie studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z zadaniem klasyfikacji (w ramach eksploracji danych). Zapoznanie z różnymi technikami budowania klasyfikatorów: naiwny Bayes, drzewa decyzyjne, klasyfikacja poprzez regresję z regularyzacją, które mogą być przydatne w analizach danych genotypowych.
C-2Zapoznanie studentów z różnymi technikami indukcji reguł na podstawie danych - reguły asocjacyjne oraz reguły decyzyjne. Przedstawienie możliwości zastosowania reguł w markerach genetycznych.
Treści programoweT-W-1Przypomnienie wybranych wiadomości z rachunku prawdopodobieństwa i statystyki. Naiwny klasyfikator Bayesa – klasyfikacja pacjentów (chorzy/zdrowi) na podstawie zbiorów danych genetycznych. Czułość i specyficzność klasyfikatora (przykład z testem na obecność narkotyków). Wielokrotne testowanie – bootstrap i kroswalidacja. Reguła Bayesa i uaktualnianie rozkładów/modeli na podstawie nowoprzychodzących danych. Rodzina rozkładów beta.
Metody nauczaniaM-1Wykład informacyjny.
M-2Metoda przypadków.
Sposób ocenyS-4Ocena podsumowująca: Ocena za końcowe kolokwium zaliczeniowe.
Kryteria ocenyOcenaKryterium oceny
2,0Nie rozumie podstawowych pojęć z rachunku prawdopodobieństwa: prawdopodobieństwo warunkowe, prawdopodobieństwo całkowite, reguła Bayesa.
3,0Rozumie podstawowe pojęcia z rachunku prawdopodobieństwa: prawdopodobieństwo warunkowe, prawdopodobieństwo całkowite, reguła Bayesa.
3,5Umie zdefiniować pojęcia: dokładność klasyfikatora, czułość klasyfikatora, specyficzność klasyfikatora.
4,0Potrafi budować przedziały ufności na dokładność, czułość i specyficzność z wykorzystaniem nierówności Chernoffa.
4,5Rozumie pojęcia: a priori, likelihood, a posteriori. Potrafi przeliczać proste przykłady z użyciem reguły Bayesa.
5,0Potrafi przeliczać przykłady z użyciem reguły Bayesa oraz wykorzystaniem rodziny rozkładów beta.
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_W02Zna możliwości podstawowych metod/algorytmów eksploracji danych.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_W01zna zjawiska fizyczne i biologiczne, procesy chemiczne oraz analizy matematyczne przydatne przy posługiwaniu się narzędziami bioinformatycznymi
BI_1A_W13ma podstawową wiedzę dotyczącą metod sztucznej inteligencji i uczenia maszynowego
BI_1A_W17posiada wiedzę o narzędziach matematycznych i informatycznych, wykorzystywanych w analizach biologicznych i bioinformatycznych
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_W02w interpretacji zjawisk i procesów przyrodniczych opiera się na podstawach empirycznych, rozumiejąc w pełni znaczenie metod matematycznych i statystycznych
P1A_W03ma wiedzę z zakresu matematyki, fizyki i chemii niezbędną dla zrozumienia podstawowych procesów i zjawisk przyrodniczych
P1A_W04ma wiedzę w zakresie najważniejszych problemów z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów oraz zna ich powiązania z innymi dyscyplinami przyrodniczymi
P1A_W05ma wiedzę w zakresie podstawowych kategorii pojęciowych i terminologii przyrodniczej oraz ma znajomość rozwoju dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów i stosowanych w nich metod badawczych
P1A_W06ma wiedzę w zakresie statystyki i informatyki na poziomie pozwalającym na opisywanie i interpretowanie zjawisk przyrodniczych
P1A_W07ma wiedzę w zakresie podstawowych technik i narzędzi badawczych stosowanych w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
T1A_W01ma wiedzę z zakresu matematyki, fizyki, chemii i innych obszarów właściwych dla studiowanego kierunku studiów przydatną do formułowania i rozwiązywania prostych zadań z zakresu studiowanego kierunku studiów
T1A_W02ma podstawową wiedzę w zakresie kierunków studiów powiązanych ze studiowanym kierunkiem studiów
T1A_W03ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną obejmującą kluczowe zagadnienia z zakresu studiowanego kierunku studiów
T1A_W04ma szczegółową wiedzę związaną z wybranymi zagadnieniami z zakresu studiowanego kierunku studiów
T1A_W06ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
T1A_W07zna podstawowe metody, techniki, narzędzia i materiały stosowane przy rozwiązywaniu prostych zadań inżynierskich z zakresu studiowanego kierunku studiów
T1A_W08ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych pozatechnicznych uwarunkowań działalności inżynierskiej
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_W01ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
InzA_W02zna podstawowe metody, techniki, narzędzia i materiały stosowane przy rozwiązywaniu prostych zadań inżynierskich z zakresu studiowanego kierunku studiów
InzA_W03ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych uwarunkowań działalności inżynierskiej
InzA_W05zna typowe technologie inżynierskie w zakresie studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z zadaniem klasyfikacji (w ramach eksploracji danych). Zapoznanie z różnymi technikami budowania klasyfikatorów: naiwny Bayes, drzewa decyzyjne, klasyfikacja poprzez regresję z regularyzacją, które mogą być przydatne w analizach danych genotypowych.
C-2Zapoznanie studentów z różnymi technikami indukcji reguł na podstawie danych - reguły asocjacyjne oraz reguły decyzyjne. Przedstawienie możliwości zastosowania reguł w markerach genetycznych.
Treści programoweT-W-2Indukcja reguł asocjacyjnych – algorytm A priori. Pojęcia: zbiór częsty, wsparcie i zaufanie reguły. Asocjacje pomiędzy genami i grupami genów.
T-W-3Indukcja reguł decyzyjnych – algorytm do zachłannego wyszukiwania reguł. Miary oceny reguł: zaufanie, entropia, liczba Kullbacka-Leiblera. Istotność atrybutów i grup atrybutów (w szczególności grup genów).
T-W-6Drzewa do klasyfikacji – algorytm CART. Funkcje nieczystości: błąd klasyfikacji, entropia, indeks Gini’ego. Przycinanie drzewa z ustaloną karą za liść. Przycinanie drzewa poprzez kroswalidację
T-W-4Reguły Pareto-optymalne. Algorytm „wyciągania” kolejnych brzegów Pareto. Algorytm pokryciowy. Klasyfikator regułowy. Testowanie reguł – test dokładny Fischera. Przykłady zastosowania indukcji reguł decyzyjnych: wykrywanie markerów genetycznych, problem sodowrażliwości nadciśnienia tętniczego warunkowanej genetycznie.
T-W-5Klasyfikatory liniowe (i wielomianowe) z technikami regularyzacji na współczynniki (ridge, lasso). Twierdzenia o ściąganiu atrybutów skorelowanych (shrinkage). Selekcja atrybutów poprzez regularyzację.
T-L-1Naiwny klasyfikator Bayesa dla zbiorów danych: "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
T-L-2Indukcja reguł dla zbiorów danych: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
T-L-3Regresje ridge i lasso dla zbiorów danych: "wydajność mleka", "standaryzowana masa ciała", "przyrosty masy ciała".
T-L-4Drzewa decyzyjne dla zbiorów: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
Metody nauczaniaM-1Wykład informacyjny.
M-2Metoda przypadków.
Sposób ocenyS-4Ocena podsumowująca: Ocena za końcowe kolokwium zaliczeniowe.
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi wyjaśnić sposobu działania naiwnego klasyfikatora Bayesowskiego.
3,0Potrafi wyjaśnić sposób działania naiwnego klasyfikatora Bayesowskiego.
3,5Potrafi wyjaśnić algorytm budowania i przycinania drzewa decyzyjnego CART.
4,0Potrafi podać algorytm A priori do indukcji reguł asocjacyjnych.
4,5Potrafi podać techniki indukcji reguł decyzyjnych i ich mierniki oceny.
5,0Potrafi podać algorytmy uczenia klasyfikatorów poprzez regresję z regularyzacją (rigde oraz lasso).
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_U01Umie budować (zaprogramować) naiwny klasyfikator bayesowski.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_U01wykorzystuje wiedzę o zjawiskach fizycznych i biologicznych, przemianach chemicznych i potrafi opisać je za pomocą modeli matematycznych oraz statystycznych
BI_1A_U13rozwiązuje proste problemy techniczne i biologiczne wykorzystując wiedzę o sztucznej inteligencji i uczeniu maszynowym
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_U01stosuje podstawowe techniki i narzędzia badawcze w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
P1A_U02rozumie literaturę z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów w języku polskim; czyta ze zrozumieniem nieskomplikowane teksty naukowe w języku angielskim
P1A_U04wykonuje zlecone proste zadania badawcze lub ekspertyzy pod kierunkiem opiekuna naukowego
T1A_U01potrafi pozyskiwać informacje z literatury, baz danych oraz innych właściwie dobranych źródeł, także w języku angielskim lub innym języku obcym uznawanym za język komunikacji międzynarodowej w zakresie studiowanego kierunku studiów; potrafi integrować uzyskane informacje, dokonywać ich interpretacji, a także wyciągać wnioski oraz formułować i uzasadniać opinie
T1A_U03potrafi przygotować w języku polskim i języku obcym, uznawanym za podstawowy dla dziedzin nauki i dyscyplin naukowych właściwych dla studiowanego kierunku studiów, dobrze udokumentowane opracowanie problemów z zakresu studiowanego kierunku studiów
T1A_U04potrafi przygotować i przedstawić w języku polskim i języku obcym prezentację ustną, dotyczącą szczegółowych zagadnień z zakresu studiowanego kierunku studiów
T1A_U08potrafi planować i przeprowadzać eksperymenty, w tym pomiary i symulacje komputerowe, interpretować uzyskane wyniki i wyciągać wnioski
T1A_U09potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
T1A_U10potrafi - przy formułowaniu i rozwiązywaniu zadań inżynierskich - dostrzegać ich aspekty systemowe i pozatechniczne
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_U02potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
InzA_U05potrafi dokonać krytycznej analizy sposobu funkcjonowania i ocenić - zwłaszcza w powiązaniu ze studiowanym kierunkiem studiów - istniejące rozwiązania techniczne, w szczególności urządzenia, obiekty, systemy, procesy, usługi
InzA_U06potrafi dokonać identyfikacji i sformułować specyfikację prostych zadań inżynierskich o charakterze praktycznym, charakterystycznych dla studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z zadaniem klasyfikacji (w ramach eksploracji danych). Zapoznanie z różnymi technikami budowania klasyfikatorów: naiwny Bayes, drzewa decyzyjne, klasyfikacja poprzez regresję z regularyzacją, które mogą być przydatne w analizach danych genotypowych.
Treści programoweT-W-1Przypomnienie wybranych wiadomości z rachunku prawdopodobieństwa i statystyki. Naiwny klasyfikator Bayesa – klasyfikacja pacjentów (chorzy/zdrowi) na podstawie zbiorów danych genetycznych. Czułość i specyficzność klasyfikatora (przykład z testem na obecność narkotyków). Wielokrotne testowanie – bootstrap i kroswalidacja. Reguła Bayesa i uaktualnianie rozkładów/modeli na podstawie nowoprzychodzących danych. Rodzina rozkładów beta.
T-L-1Naiwny klasyfikator Bayesa dla zbiorów danych: "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
Metody nauczaniaM-3Metody programowane z użyciem komputera.
Sposób ocenyS-1Ocena formująca: Pięć ocen cząstkowych za programy na laboratoria.
S-2Ocena formująca: Pięć ocen cząstkowych za wejściówki z laboratoriów.
S-3Ocena podsumowująca: Ocena końcowa z laboratoriów jako średnia ważona z ocen za: - programy (60%), - wejściówki (40%).
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi zaprogramować podstawowych operacji związanych z odczytaniem i wstępną obróką danych.
3,0Potrafi zaprogramować podstawowe operacje związane z odczytaniem i wstępną obróką danych.
3,5Potrafi zaprogramować skrypt realizujący uczenie klasyfikatora Bayesowskiego (sporządzenie ewidencji potrzebnych rozkładów warunkowych).
4,0Potrafi zaprogramować skrypt realizujący faktyczną klasyfikację za pomocą klasyfikatora Bayesowskiego dla nowoprzychodzących obiektów; oraz skrypty oceniające dokładność klasyfikatora.
4,5Potrafi wykonać wszystkie ww. operacje dla nowego zbioru danych.
5,0Potrafi ocenić dokładność klasyfikatora poprzez krzyżową walidację i bootstrap.
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_U02Umie zbudować (zaprogramować) klasyfikatory oparte na drzewach decyzyjnych CART.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_U01wykorzystuje wiedzę o zjawiskach fizycznych i biologicznych, przemianach chemicznych i potrafi opisać je za pomocą modeli matematycznych oraz statystycznych
BI_1A_U13rozwiązuje proste problemy techniczne i biologiczne wykorzystując wiedzę o sztucznej inteligencji i uczeniu maszynowym
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_U01stosuje podstawowe techniki i narzędzia badawcze w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
P1A_U02rozumie literaturę z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów w języku polskim; czyta ze zrozumieniem nieskomplikowane teksty naukowe w języku angielskim
P1A_U04wykonuje zlecone proste zadania badawcze lub ekspertyzy pod kierunkiem opiekuna naukowego
T1A_U01potrafi pozyskiwać informacje z literatury, baz danych oraz innych właściwie dobranych źródeł, także w języku angielskim lub innym języku obcym uznawanym za język komunikacji międzynarodowej w zakresie studiowanego kierunku studiów; potrafi integrować uzyskane informacje, dokonywać ich interpretacji, a także wyciągać wnioski oraz formułować i uzasadniać opinie
T1A_U03potrafi przygotować w języku polskim i języku obcym, uznawanym za podstawowy dla dziedzin nauki i dyscyplin naukowych właściwych dla studiowanego kierunku studiów, dobrze udokumentowane opracowanie problemów z zakresu studiowanego kierunku studiów
T1A_U04potrafi przygotować i przedstawić w języku polskim i języku obcym prezentację ustną, dotyczącą szczegółowych zagadnień z zakresu studiowanego kierunku studiów
T1A_U08potrafi planować i przeprowadzać eksperymenty, w tym pomiary i symulacje komputerowe, interpretować uzyskane wyniki i wyciągać wnioski
T1A_U09potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
T1A_U10potrafi - przy formułowaniu i rozwiązywaniu zadań inżynierskich - dostrzegać ich aspekty systemowe i pozatechniczne
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_U02potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
InzA_U05potrafi dokonać krytycznej analizy sposobu funkcjonowania i ocenić - zwłaszcza w powiązaniu ze studiowanym kierunkiem studiów - istniejące rozwiązania techniczne, w szczególności urządzenia, obiekty, systemy, procesy, usługi
InzA_U06potrafi dokonać identyfikacji i sformułować specyfikację prostych zadań inżynierskich o charakterze praktycznym, charakterystycznych dla studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z zadaniem klasyfikacji (w ramach eksploracji danych). Zapoznanie z różnymi technikami budowania klasyfikatorów: naiwny Bayes, drzewa decyzyjne, klasyfikacja poprzez regresję z regularyzacją, które mogą być przydatne w analizach danych genotypowych.
Treści programoweT-W-6Drzewa do klasyfikacji – algorytm CART. Funkcje nieczystości: błąd klasyfikacji, entropia, indeks Gini’ego. Przycinanie drzewa z ustaloną karą za liść. Przycinanie drzewa poprzez kroswalidację
T-L-4Drzewa decyzyjne dla zbiorów: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
Metody nauczaniaM-3Metody programowane z użyciem komputera.
Sposób ocenyS-1Ocena formująca: Pięć ocen cząstkowych za programy na laboratoria.
S-2Ocena formująca: Pięć ocen cząstkowych za wejściówki z laboratoriów.
S-3Ocena podsumowująca: Ocena końcowa z laboratoriów jako średnia ważona z ocen za: - programy (60%), - wejściówki (40%).
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi zaprogramować podstawowych operacji związanych z odczytaniem i wstępną obróką danych.
3,0Potrafi zaprogramować podstawowe operacje związane z odczytaniem i wstępną obróką danych.
3,5Potrafi zaprogramować różne wersje funkcji nieczystości.
4,0Potrafi zaprogramować skrypt do budowy pełnego (nieprzyciętego) drzewa CART.
4,5Potrafi zaprogramować skrypt do przycinania drzewa CART.
5,0Potrafi wykonać wszystkie ww. operacje dla nowego zbioru danych.
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_U03Potrafi wyszukiwać ciekawe reguły asocjacyjne i decyzyjne w dużych zbiorach danych.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_U01wykorzystuje wiedzę o zjawiskach fizycznych i biologicznych, przemianach chemicznych i potrafi opisać je za pomocą modeli matematycznych oraz statystycznych
BI_1A_U13rozwiązuje proste problemy techniczne i biologiczne wykorzystując wiedzę o sztucznej inteligencji i uczeniu maszynowym
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_U01stosuje podstawowe techniki i narzędzia badawcze w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
P1A_U02rozumie literaturę z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów w języku polskim; czyta ze zrozumieniem nieskomplikowane teksty naukowe w języku angielskim
P1A_U04wykonuje zlecone proste zadania badawcze lub ekspertyzy pod kierunkiem opiekuna naukowego
T1A_U01potrafi pozyskiwać informacje z literatury, baz danych oraz innych właściwie dobranych źródeł, także w języku angielskim lub innym języku obcym uznawanym za język komunikacji międzynarodowej w zakresie studiowanego kierunku studiów; potrafi integrować uzyskane informacje, dokonywać ich interpretacji, a także wyciągać wnioski oraz formułować i uzasadniać opinie
T1A_U03potrafi przygotować w języku polskim i języku obcym, uznawanym za podstawowy dla dziedzin nauki i dyscyplin naukowych właściwych dla studiowanego kierunku studiów, dobrze udokumentowane opracowanie problemów z zakresu studiowanego kierunku studiów
T1A_U04potrafi przygotować i przedstawić w języku polskim i języku obcym prezentację ustną, dotyczącą szczegółowych zagadnień z zakresu studiowanego kierunku studiów
T1A_U08potrafi planować i przeprowadzać eksperymenty, w tym pomiary i symulacje komputerowe, interpretować uzyskane wyniki i wyciągać wnioski
T1A_U09potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
T1A_U10potrafi - przy formułowaniu i rozwiązywaniu zadań inżynierskich - dostrzegać ich aspekty systemowe i pozatechniczne
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_U02potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
InzA_U05potrafi dokonać krytycznej analizy sposobu funkcjonowania i ocenić - zwłaszcza w powiązaniu ze studiowanym kierunkiem studiów - istniejące rozwiązania techniczne, w szczególności urządzenia, obiekty, systemy, procesy, usługi
InzA_U06potrafi dokonać identyfikacji i sformułować specyfikację prostych zadań inżynierskich o charakterze praktycznym, charakterystycznych dla studiowanego kierunku studiów
Cel przedmiotuC-2Zapoznanie studentów z różnymi technikami indukcji reguł na podstawie danych - reguły asocjacyjne oraz reguły decyzyjne. Przedstawienie możliwości zastosowania reguł w markerach genetycznych.
Treści programoweT-W-2Indukcja reguł asocjacyjnych – algorytm A priori. Pojęcia: zbiór częsty, wsparcie i zaufanie reguły. Asocjacje pomiędzy genami i grupami genów.
T-L-2Indukcja reguł dla zbiorów danych: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
Metody nauczaniaM-3Metody programowane z użyciem komputera.
Sposób ocenyS-1Ocena formująca: Pięć ocen cząstkowych za programy na laboratoria.
S-2Ocena formująca: Pięć ocen cząstkowych za wejściówki z laboratoriów.
S-3Ocena podsumowująca: Ocena końcowa z laboratoriów jako średnia ważona z ocen za: - programy (60%), - wejściówki (40%).
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi zaprogramować podstawowego zliczania wsparć w ramach algorytmu A priori.
3,0Potrafi zaprogramować podstawowe zliczanie wsparć w ramach algorytmu A priori.
3,5Potrafi zaprogramować indukcję znajdującą zbiory częste w ramach algorytmu A priori.
4,0Potrafi zaprogramować generator reguł asocjacyjnych na podstawie zbiorów częstych i minimalnego zaufania w ramach algorytmu A priori.
4,5Potrafi zaprogramować wyczerpujące generowanie reguł decyzyjnych oraz ich ocenę przy pomocy entropii i liczby Kullbacka-Leiblera.
5,0Potrafi zaprogramować wykrywanie zbioru reguł Pareto-optymalnych.
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_U04Potrafi stosować techniki regularyzacji (ridge, lasso) w celu selekcji atrybutów w modelach liniowych.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_U01wykorzystuje wiedzę o zjawiskach fizycznych i biologicznych, przemianach chemicznych i potrafi opisać je za pomocą modeli matematycznych oraz statystycznych
BI_1A_U13rozwiązuje proste problemy techniczne i biologiczne wykorzystując wiedzę o sztucznej inteligencji i uczeniu maszynowym
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_U01stosuje podstawowe techniki i narzędzia badawcze w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
P1A_U02rozumie literaturę z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów w języku polskim; czyta ze zrozumieniem nieskomplikowane teksty naukowe w języku angielskim
P1A_U04wykonuje zlecone proste zadania badawcze lub ekspertyzy pod kierunkiem opiekuna naukowego
T1A_U01potrafi pozyskiwać informacje z literatury, baz danych oraz innych właściwie dobranych źródeł, także w języku angielskim lub innym języku obcym uznawanym za język komunikacji międzynarodowej w zakresie studiowanego kierunku studiów; potrafi integrować uzyskane informacje, dokonywać ich interpretacji, a także wyciągać wnioski oraz formułować i uzasadniać opinie
T1A_U03potrafi przygotować w języku polskim i języku obcym, uznawanym za podstawowy dla dziedzin nauki i dyscyplin naukowych właściwych dla studiowanego kierunku studiów, dobrze udokumentowane opracowanie problemów z zakresu studiowanego kierunku studiów
T1A_U04potrafi przygotować i przedstawić w języku polskim i języku obcym prezentację ustną, dotyczącą szczegółowych zagadnień z zakresu studiowanego kierunku studiów
T1A_U08potrafi planować i przeprowadzać eksperymenty, w tym pomiary i symulacje komputerowe, interpretować uzyskane wyniki i wyciągać wnioski
T1A_U09potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
T1A_U10potrafi - przy formułowaniu i rozwiązywaniu zadań inżynierskich - dostrzegać ich aspekty systemowe i pozatechniczne
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_U02potrafi wykorzystać do formułowania i rozwiązywania zadań inżynierskich metody analityczne, symulacyjne oraz eksperymentalne
InzA_U05potrafi dokonać krytycznej analizy sposobu funkcjonowania i ocenić - zwłaszcza w powiązaniu ze studiowanym kierunkiem studiów - istniejące rozwiązania techniczne, w szczególności urządzenia, obiekty, systemy, procesy, usługi
InzA_U06potrafi dokonać identyfikacji i sformułować specyfikację prostych zadań inżynierskich o charakterze praktycznym, charakterystycznych dla studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z zadaniem klasyfikacji (w ramach eksploracji danych). Zapoznanie z różnymi technikami budowania klasyfikatorów: naiwny Bayes, drzewa decyzyjne, klasyfikacja poprzez regresję z regularyzacją, które mogą być przydatne w analizach danych genotypowych.
Treści programoweT-W-5Klasyfikatory liniowe (i wielomianowe) z technikami regularyzacji na współczynniki (ridge, lasso). Twierdzenia o ściąganiu atrybutów skorelowanych (shrinkage). Selekcja atrybutów poprzez regularyzację.
T-L-3Regresje ridge i lasso dla zbiorów danych: "wydajność mleka", "standaryzowana masa ciała", "przyrosty masy ciała".
Metody nauczaniaM-3Metody programowane z użyciem komputera.
Sposób ocenyS-1Ocena formująca: Pięć ocen cząstkowych za programy na laboratoria.
S-2Ocena formująca: Pięć ocen cząstkowych za wejściówki z laboratoriów.
S-3Ocena podsumowująca: Ocena końcowa z laboratoriów jako średnia ważona z ocen za: - programy (60%), - wejściówki (40%).
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi zaprogramować uczenia klasyfikatora liniowego poprzez metodę najmniejszych kwadratów.
3,0Potrafi zaprogramować uczenie klasyfikatora liniowego poprzez metodę najmniejszych kwadratów.
3,5Potrafi rozszerzyć rozwiązanie najmniejszych kwadratów o regularyzację L2 (ridge).
4,0Dla regularyzacji ridge potrafi dobrać odpowiedni współczynnik regularyzacyjny.
4,5Potrafi rozszerzyć klasyfikator liniowy do klasyfikatora wielomianowego (elementy kombinatoryczne - dowolna liczba zmiennych i dowolny stopień wielomianu).
5,0Potrafi zaprogramować algorytm Forward Stagewise Lasso; oraz dobrać odpowiedni współczynnik regularyzacyjny.
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O12.1_K01Potrafi formułować i rozwiązywać wybrane problemy biologiczne jako problemy analizy danych i uczenia maszynowego.
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_K02wykazuje zrozumienie podstawowych zjawisk i procesów biologicznych, a przy ich interpretacji opiera się na podstawach empirycznych dostrzegając rolę metod matematycznych i statystycznych
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_K01rozumie potrzebę uczenia się przez całe życie
P1A_K04prawidłowo identyfikuje i rozstrzyga dylematy związane z wykonywaniem zawodu
Treści programoweT-W-1Przypomnienie wybranych wiadomości z rachunku prawdopodobieństwa i statystyki. Naiwny klasyfikator Bayesa – klasyfikacja pacjentów (chorzy/zdrowi) na podstawie zbiorów danych genetycznych. Czułość i specyficzność klasyfikatora (przykład z testem na obecność narkotyków). Wielokrotne testowanie – bootstrap i kroswalidacja. Reguła Bayesa i uaktualnianie rozkładów/modeli na podstawie nowoprzychodzących danych. Rodzina rozkładów beta.
T-W-2Indukcja reguł asocjacyjnych – algorytm A priori. Pojęcia: zbiór częsty, wsparcie i zaufanie reguły. Asocjacje pomiędzy genami i grupami genów.
T-W-3Indukcja reguł decyzyjnych – algorytm do zachłannego wyszukiwania reguł. Miary oceny reguł: zaufanie, entropia, liczba Kullbacka-Leiblera. Istotność atrybutów i grup atrybutów (w szczególności grup genów).
T-W-6Drzewa do klasyfikacji – algorytm CART. Funkcje nieczystości: błąd klasyfikacji, entropia, indeks Gini’ego. Przycinanie drzewa z ustaloną karą za liść. Przycinanie drzewa poprzez kroswalidację
T-W-4Reguły Pareto-optymalne. Algorytm „wyciągania” kolejnych brzegów Pareto. Algorytm pokryciowy. Klasyfikator regułowy. Testowanie reguł – test dokładny Fischera. Przykłady zastosowania indukcji reguł decyzyjnych: wykrywanie markerów genetycznych, problem sodowrażliwości nadciśnienia tętniczego warunkowanej genetycznie.
T-W-5Klasyfikatory liniowe (i wielomianowe) z technikami regularyzacji na współczynniki (ridge, lasso). Twierdzenia o ściąganiu atrybutów skorelowanych (shrinkage). Selekcja atrybutów poprzez regularyzację.
T-L-1Naiwny klasyfikator Bayesa dla zbiorów danych: "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
T-L-2Indukcja reguł dla zbiorów danych: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
T-L-3Regresje ridge i lasso dla zbiorów danych: "wydajność mleka", "standaryzowana masa ciała", "przyrosty masy ciała".
T-L-4Drzewa decyzyjne dla zbiorów: "sodowrażliwość", "zabiegi inseminacyjne", "mastitis", "przyrosty masy ciała".
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi wskazać podstawowych pojęć z zakresu rachunku prawdopodobieństwa przydatnych w eksploracji danych.
3,0Potrafi wskazać podstawowe pojęcia z zakresu rachunku prawdopodobieństwa przydatne w eksploracji danych.
3,5Umie podać przykłady różnych algorytmów klasyfikacji wraz z ich podstawowymi własnościami.
4,0Umie podać różne techniki indukcji reguł asocjacyjnych i decyzyjnych.
4,5Potrafi ocenić dokładność (czułość, specyficzność, przedziały ufności) otrzymanych klasyfikatorów lub reguł.
5,0Dla podanego nowego problemu potrafi wskazać możliwe sposoby rozwiązania go metodami eksploracji danych.