Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (N3)

Sylabus przedmiotu Metody ekstrakcji wiedzy z danych - Przedmiot obieralny III:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia niestacjonarne Poziom trzeciego stopnia
Stopnień naukowy absolwenta doktor
Obszary studiów studia trzeciego stopnia
Profil
Moduł
Przedmiot Metody ekstrakcji wiedzy z danych - Przedmiot obieralny III
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Przemysław Klęsk <pklesk@wi.zut.edu.pl>
Inni nauczyciele
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 3 Grupa obieralna 1

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
laboratoriaL5 5 1,50,50zaliczenie
wykładyW5 15 1,50,50zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1matematyka
W-2rachunek prawdopodobieństwa i statystyka
W-3metody optymalizacji
W-4podstawy oprogramowania

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Przedstawienie wybranych znanych algorytmów klasyfikacji i indukcji reguł do celów ektrakcji wiedzy.
C-2Nauczenie technik testowania i badania dokładności algorytmów.
C-3Ukształtowanie świadomości możliwych praktycznych zastosowań przedstawionych algorytmów.

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Opracowanie w formie zespołowego zadania programu realizującego detektor twarzy w oparciu o cechy Haara lub deskryptor HOG.5
5
wykłady
T-W-1Ekstrakcja cech poprzez obrazy całkowe w zadaniach szybkiej detekcji. Falki Haara, ortogonalność, przybliżanie w normie kwadratowej w bazach ortogonalnych. Cechy Haara i ich parametryzacja. Deskryptor HOG.8
T-W-2Klasyfikatory zespołowe. Algorytmy AdaBoost i RealBoost i ich własności matematyczne. Niektóre "słabe" klasyfikatory w ramach zespołu: decision stumps, płytkie drzewa, rozkłady normalne. Związki RealBoost z regresją logistyczną.5
T-W-3Kaskady klasyfikatorów. Miary: czułość i FAR w kaskadzie i jej etapach. Krzywa ROC i miara AUC. Algorytm uczenia kaskady.2
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1Uczestnictwo w zajęciach.5
A-L-2Samodzielna i zespołowa praca nad detektorem twarzy.34
A-L-3Konsultacje5
44
wykłady
A-W-1Udział w wykładach.15
A-W-2Konsultacje5
A-W-3Samodzielne prześledzenie wyprowadzeń matematycznych i algorytmicznych z wykładów.2
A-W-4Kolokwium zaliczeniowe.2
A-W-5Przygotowanie się do kolokwium egzaminacyjnego.20
44

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład informacyjny
M-2Wykład problemowy
M-3Metody programowane z użyciem komputera

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: Dwie wejściówki (10 minutowe) na zakończenie każdego bloku tematycznego laboratoriów.
S-2Ocena formująca: Dwie oceny zaliczeniowe z napisanych programów.
S-3Ocena podsumowująca: Ocena końcowa za laboratoria jako średnia z ocen formujących.
S-4Ocena podsumowująca: Ocena końcowa za wykłady z kolokwium egzaminacyjnego.

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla dyscyplinyOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_3A_B/03/02_W01
Ma znajomość ważnych algorytmów i technik stosowanych do ekstrakcji cech/wiedzy z danych oraz detekcji ze szczególnym naciskiem na szybkość obliczeń.
I_3A_W02C-1, C-2, C-3M-1, M-2S-4

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla dyscyplinyOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_3A_B/03/02_U01
Potrafi samodzielnie zaprogramować wybrane algorytmy ekstrakcji cech i uczenia, i zastosować je do praktycznego problemu (na przykładzie detektora twarzy).
I_3A_U01, I_3A_U04C-1, C-2, C-3M-3S-1, S-2, S-3

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
I_3A_B/03/02_W01
Ma znajomość ważnych algorytmów i technik stosowanych do ekstrakcji cech/wiedzy z danych oraz detekcji ze szczególnym naciskiem na szybkość obliczeń.
2,0Nie potrafi wyjaśnić podstawowego sensu zadań klasyfikacji i indukcji reguł.
3,0Potrafi wyjaśnić podstawowy sens zadań klasyfikacji i indukcji reguł.
3,5Potrafi wyjaśnić sposób działania naiwnego klasyfikatora Bayesa.
4,0Potrafi wyjaśnić sposób działania naiwnego klasyfikatora CART.
4,5Zna sens i własności technik regularyzacji L1 i L2.
5,0Zna techniki dla meta-klasyfikatorów: bagging i boosting.

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
I_3A_B/03/02_U01
Potrafi samodzielnie zaprogramować wybrane algorytmy ekstrakcji cech i uczenia, i zastosować je do praktycznego problemu (na przykładzie detektora twarzy).
2,0Nie potrafi wykonać podstawowej implementacji w dowolnie wybranym języku/środowisku prostego klasyfikatora (naiwny Bayes lub CART)
3,0Potrafi wykonać podstawową implementację w dowolnie wybranym języku/środowisku prostego klasyfikatora (naiwny Bayes lub CART)
3,5Potrafi przygotować zbiór danych do analizy.
4,0Potrafi przetestować klasyfikator.
4,5Potrafi zmierzyć czułość i specyficzność opracowanego klasyfikatora, a także podać przedziały ufności na te parametry.
5,0Potrafi wykonać zaawansowaną implementację w dowolnie wybranym języku/środowisku klasyfikatora (regularzyacje L1, L2 lub AdaBoost)

Literatura podstawowa

  1. J. Koronacki, J. Ćwik, Statystyczne systemy uczące się, WNT, Warszawa, 2005
  2. P. Cichosz, Systemy uczące się, WNT, Warszawa, 2000
  3. D. Hand, H. Manilla, P. Smyth, Eksploracja danych, WNT, Warszawa, 2005

Literatura dodatkowa

  1. V. Cherskassky, F. Mullier, Learning from data, Wiley and Sons, 2007

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Opracowanie w formie zespołowego zadania programu realizującego detektor twarzy w oparciu o cechy Haara lub deskryptor HOG.5
5

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Ekstrakcja cech poprzez obrazy całkowe w zadaniach szybkiej detekcji. Falki Haara, ortogonalność, przybliżanie w normie kwadratowej w bazach ortogonalnych. Cechy Haara i ich parametryzacja. Deskryptor HOG.8
T-W-2Klasyfikatory zespołowe. Algorytmy AdaBoost i RealBoost i ich własności matematyczne. Niektóre "słabe" klasyfikatory w ramach zespołu: decision stumps, płytkie drzewa, rozkłady normalne. Związki RealBoost z regresją logistyczną.5
T-W-3Kaskady klasyfikatorów. Miary: czułość i FAR w kaskadzie i jej etapach. Krzywa ROC i miara AUC. Algorytm uczenia kaskady.2
15

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach.5
A-L-2Samodzielna i zespołowa praca nad detektorem twarzy.34
A-L-3Konsultacje5
44
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Udział w wykładach.15
A-W-2Konsultacje5
A-W-3Samodzielne prześledzenie wyprowadzeń matematycznych i algorytmicznych z wykładów.2
A-W-4Kolokwium zaliczeniowe.2
A-W-5Przygotowanie się do kolokwium egzaminacyjnego.20
44
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_3A_B/03/02_W01Ma znajomość ważnych algorytmów i technik stosowanych do ekstrakcji cech/wiedzy z danych oraz detekcji ze szczególnym naciskiem na szybkość obliczeń.
Odniesienie do efektów kształcenia dla dyscyplinyI_3A_W02Absolwent posiada zaawansowaną wiedzę o charakterze szczegółowym odpowiadającą obszarowi Informatyka, obejmującą najnowsze osiągnięcia.
Cel przedmiotuC-1Przedstawienie wybranych znanych algorytmów klasyfikacji i indukcji reguł do celów ektrakcji wiedzy.
C-2Nauczenie technik testowania i badania dokładności algorytmów.
C-3Ukształtowanie świadomości możliwych praktycznych zastosowań przedstawionych algorytmów.
Metody nauczaniaM-1Wykład informacyjny
M-2Wykład problemowy
Sposób ocenyS-4Ocena podsumowująca: Ocena końcowa za wykłady z kolokwium egzaminacyjnego.
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi wyjaśnić podstawowego sensu zadań klasyfikacji i indukcji reguł.
3,0Potrafi wyjaśnić podstawowy sens zadań klasyfikacji i indukcji reguł.
3,5Potrafi wyjaśnić sposób działania naiwnego klasyfikatora Bayesa.
4,0Potrafi wyjaśnić sposób działania naiwnego klasyfikatora CART.
4,5Zna sens i własności technik regularyzacji L1 i L2.
5,0Zna techniki dla meta-klasyfikatorów: bagging i boosting.
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_3A_B/03/02_U01Potrafi samodzielnie zaprogramować wybrane algorytmy ekstrakcji cech i uczenia, i zastosować je do praktycznego problemu (na przykładzie detektora twarzy).
Odniesienie do efektów kształcenia dla dyscyplinyI_3A_U01Absolwent posiada umiejętność prowadzenia badań naukowych w zakresie Informatyka z wykorzystaniem najnowszej wiedzy.
I_3A_U04Absolwent posiada umiejętność wykorzystywania nowych narzędzi informatycznych do realizacji badań naukowych.
Cel przedmiotuC-1Przedstawienie wybranych znanych algorytmów klasyfikacji i indukcji reguł do celów ektrakcji wiedzy.
C-2Nauczenie technik testowania i badania dokładności algorytmów.
C-3Ukształtowanie świadomości możliwych praktycznych zastosowań przedstawionych algorytmów.
Metody nauczaniaM-3Metody programowane z użyciem komputera
Sposób ocenyS-1Ocena formująca: Dwie wejściówki (10 minutowe) na zakończenie każdego bloku tematycznego laboratoriów.
S-2Ocena formująca: Dwie oceny zaliczeniowe z napisanych programów.
S-3Ocena podsumowująca: Ocena końcowa za laboratoria jako średnia z ocen formujących.
Kryteria ocenyOcenaKryterium oceny
2,0Nie potrafi wykonać podstawowej implementacji w dowolnie wybranym języku/środowisku prostego klasyfikatora (naiwny Bayes lub CART)
3,0Potrafi wykonać podstawową implementację w dowolnie wybranym języku/środowisku prostego klasyfikatora (naiwny Bayes lub CART)
3,5Potrafi przygotować zbiór danych do analizy.
4,0Potrafi przetestować klasyfikator.
4,5Potrafi zmierzyć czułość i specyficzność opracowanego klasyfikatora, a także podać przedziały ufności na te parametry.
5,0Potrafi wykonać zaawansowaną implementację w dowolnie wybranym języku/środowisku klasyfikatora (regularzyacje L1, L2 lub AdaBoost)