Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (S2)

Sylabus przedmiotu Algorytmy eksploracji danych:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia stacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister
Obszary studiów nauki techniczne
Profil ogólnoakademicki
Moduł
Przedmiot Algorytmy eksploracji danych
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele Przemysław Klęsk <pklesk@wi.zut.edu.pl>
ECTS (planowane) 4,0 ECTS (formy) 4,0
Forma zaliczenia egzamin Język polski
Blok obieralny Grupa obieralna

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
ćwiczenia audytoryjneA2 15 1,10,30zaliczenie
laboratoriaL2 30 1,70,26zaliczenie
wykładyW2 15 1,20,44egzamin

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawowe wiadomości z rachunku prawdopodobieństwa i statystyki
W-2Podstawowe wiadomości z algebry liniowej

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
C-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przypomnienie wiadomości z rachunku prawdopodobieństwa: niezaleznosc, Reguła Bayesa, prawdopopodobieństwo warunkowe, prawo następstw Laplace'a4
T-A-2Klasyfikator Bayesa przykład obliczeniowy2
T-A-3Analiza składowych głównych2
T-A-4Entropia, przyrost informacji, informacja wzajemna, index Giniego, nierówność Gibbsa, zastosowanie do selekcji atrybutów i dyskretyzacji3
T-A-5Miary zanieczyszczenia używane w drzewach decyzyjnych, algorytm budowy drzewa decyzyjnego2
T-A-6Wyszukiwanie reguł reguł asocjacyjnych - przykłady2
15
laboratoria
T-L-1Narzędzia analizy danych, Analiza danych w programie Matlab, wczytywanie danych, publiczne repozytoria danych4
T-L-2Naiwny klasyfikator bayesowski (implementacja), dwa warianty: 1) zmienne dyskretne, 2) zmienne ciągłe4
T-L-3Testowanie klasyfikatora, metoda krosswalidacji2
T-L-4Grupowanie danych, algorytm EM, pakiet netlab2
T-L-5Implementacja algorytmu K-środków wykorzystującego odległości: euklidesową i Mahalanobisa2
T-L-6Analiza składowych głównych - zastosowanie do wizualizacji dancyh2
T-L-7Drzewa decyzyjne - implementacja metody CART, warianty: atrybuty binarne, atrybuty ciągłe i mieszane, mechanizm przycinania4
T-L-8Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych4
T-L-9Klasyfikatory funkcjyne: sieci neuronowe i regresja logistyczna z wykorzystaniem pakietu netlab2
T-L-10Uczestnictwo w prowadzeniu badań z zakresu eksploracji danych -- sprawozdanie podsumowujące4
30
wykłady
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.2
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców2
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków2
T-W-4Ocena jakości maszy klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap2
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski2
T-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART2
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne3
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Uczestnictwo w zajęciach15
A-A-2Samodzielne przygotowanie do zajęć10
A-A-3Przygotowanie do zaliczenia2
A-A-4Konsultacje do ćwiczeń2
29
laboratoria
A-L-1Uczestnictwo w zajęciach30
A-L-2przygotowanie do zajęć5
A-L-3praca nad zadaniami programistycznymi oraz sprawozdaniami10
A-L-4Udział w konsultacjach i zaliczeniu2
47
wykłady
A-W-1Uczestnictwo w wykładach15
A-W-2konsultacje6
A-W-3Przygotowanie do egzaminu11
32

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład prezentacja w postaci slajdów
M-2Ćwiczenia: rozwiązywanie zadań przy tablicy, w niektórych przypadkach wspomagane komputerowo
M-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena formująca: Ćwiczenia: ocena pracy w trakcie zajęć oraz ocena przygotowania do zajęć
S-5Ocena podsumowująca: zaliczenie ćwiczeń w formie kolokwium na koniec semestru
S-6Ocena podsumowująca: egzamin ustny

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_C/05_W01
Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
I_2A_W04, I_2A_W08C-3, C-1, C-2, C-4M-3, M-1, M-2S-1, S-3, S-4, S-6, S-5

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_C/05_U01
Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
I_2A_U09, I_2A_U10, I_2A_U12C-3, C-1, C-2M-3, M-1S-1, S-2, S-3, S-6

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_C/05_K01
Potrafi rozwiązywać problemy eksploracji danych w sposób kreatywny
I_2A_K06C-3, C-2M-3, M-2S-1, S-2, S-3, S-4, S-6

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
I_2A_C/05_W01
Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
2,0Student nie przyswoił sobie podstawowej wiedzy z zakresu eksploracji danych
3,0Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych w stopniu zadowalającym
3,5Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych
4,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych
4,5Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych
5,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych, zna zalety i ograniczenia stosowanych metod i algorytmów

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
I_2A_C/05_U01
Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
2,0Student nie przyswoił sobie podstawowych umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
3,0Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych w stopniu zadowalającycm
3,5Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
4,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach
4,5Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, przy rozwiazywaniu zadań wykazyje sie pomysłowością i kreatywnością
5,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, umie dodatkowo wybrać optymalny sposób implementacji algorytmu oraz w wskazać najlepsze metody do rozwiazania konkretnego zagadnienia

Kryterium oceny - inne kompetencje społeczne i personalne

Efekt kształceniaOcenaKryterium oceny
I_2A_C/05_K01
Potrafi rozwiązywać problemy eksploracji danych w sposób kreatywny
2,0Studen nie potrafi rozwiązać najprostszych problemów eksploracji danych
3,0Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych w stopniu zadowalającycm
3,5Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych
4,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych
4,5Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem
5,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem oraz w sposob kreatywny

Literatura podstawowa

  1. J. Ćwik, J. Koronacki, Statystyczne systemy uczące, Akademicka oficyna wydawnicza EXIT, Warszawa, 2008
  2. David MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 2003

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przypomnienie wiadomości z rachunku prawdopodobieństwa: niezaleznosc, Reguła Bayesa, prawdopopodobieństwo warunkowe, prawo następstw Laplace'a4
T-A-2Klasyfikator Bayesa przykład obliczeniowy2
T-A-3Analiza składowych głównych2
T-A-4Entropia, przyrost informacji, informacja wzajemna, index Giniego, nierówność Gibbsa, zastosowanie do selekcji atrybutów i dyskretyzacji3
T-A-5Miary zanieczyszczenia używane w drzewach decyzyjnych, algorytm budowy drzewa decyzyjnego2
T-A-6Wyszukiwanie reguł reguł asocjacyjnych - przykłady2
15

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Narzędzia analizy danych, Analiza danych w programie Matlab, wczytywanie danych, publiczne repozytoria danych4
T-L-2Naiwny klasyfikator bayesowski (implementacja), dwa warianty: 1) zmienne dyskretne, 2) zmienne ciągłe4
T-L-3Testowanie klasyfikatora, metoda krosswalidacji2
T-L-4Grupowanie danych, algorytm EM, pakiet netlab2
T-L-5Implementacja algorytmu K-środków wykorzystującego odległości: euklidesową i Mahalanobisa2
T-L-6Analiza składowych głównych - zastosowanie do wizualizacji dancyh2
T-L-7Drzewa decyzyjne - implementacja metody CART, warianty: atrybuty binarne, atrybuty ciągłe i mieszane, mechanizm przycinania4
T-L-8Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych4
T-L-9Klasyfikatory funkcjyne: sieci neuronowe i regresja logistyczna z wykorzystaniem pakietu netlab2
T-L-10Uczestnictwo w prowadzeniu badań z zakresu eksploracji danych -- sprawozdanie podsumowujące4
30

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.2
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców2
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków2
T-W-4Ocena jakości maszy klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap2
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski2
T-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART2
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne3
15

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Uczestnictwo w zajęciach15
A-A-2Samodzielne przygotowanie do zajęć10
A-A-3Przygotowanie do zaliczenia2
A-A-4Konsultacje do ćwiczeń2
29
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach30
A-L-2przygotowanie do zajęć5
A-L-3praca nad zadaniami programistycznymi oraz sprawozdaniami10
A-L-4Udział w konsultacjach i zaliczeniu2
47
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestnictwo w wykładach15
A-W-2konsultacje6
A-W-3Przygotowanie do egzaminu11
32
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_2A_C/05_W01Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_W04Ma wiedzę z zakresu zaawansowanych technik programowania systemów informatycznych w wybranym obszarze zastosowań
I_2A_W08Ma rozszerzoną wiedzę o podstawowych zadaniach eksploracji i analizy danych zarówno ilościowych jak i jakościowych
Cel przedmiotuC-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
C-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka
Metody nauczaniaM-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania
M-1Wykład prezentacja w postaci slajdów
M-2Ćwiczenia: rozwiązywanie zadań przy tablicy, w niektórych przypadkach wspomagane komputerowo
Sposób ocenyS-1Ocena formująca: laboratorium ocena sprawozdań
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena formująca: Ćwiczenia: ocena pracy w trakcie zajęć oraz ocena przygotowania do zajęć
S-6Ocena podsumowująca: egzamin ustny
S-5Ocena podsumowująca: zaliczenie ćwiczeń w formie kolokwium na koniec semestru
Kryteria ocenyOcenaKryterium oceny
2,0Student nie przyswoił sobie podstawowej wiedzy z zakresu eksploracji danych
3,0Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych w stopniu zadowalającym
3,5Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych
4,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych
4,5Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych
5,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych, zna zalety i ograniczenia stosowanych metod i algorytmów
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_2A_C/05_U01Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_U09Potrafi wydobywać wiedzę zawartą w dużych zbiorach danych
I_2A_U10Potrafi wykorzystywać oprogramowanie wspomagające rozwiązywanie wybranych problemów
I_2A_U12Ma umiejętność stosowania zaawansowanych technik programowania i metodyki projektowania systemów informatycznych w wybranym obszarze zastosowań
Cel przedmiotuC-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
Metody nauczaniaM-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania
M-1Wykład prezentacja w postaci slajdów
Sposób ocenyS-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-6Ocena podsumowująca: egzamin ustny
Kryteria ocenyOcenaKryterium oceny
2,0Student nie przyswoił sobie podstawowych umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
3,0Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych w stopniu zadowalającycm
3,5Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
4,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach
4,5Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, przy rozwiazywaniu zadań wykazyje sie pomysłowością i kreatywnością
5,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, umie dodatkowo wybrać optymalny sposób implementacji algorytmu oraz w wskazać najlepsze metody do rozwiazania konkretnego zagadnienia
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_2A_C/05_K01Potrafi rozwiązywać problemy eksploracji danych w sposób kreatywny
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_K06Potrafi myśleć i działać w sposób kreatywny i przedsiębiorczy
Cel przedmiotuC-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
Metody nauczaniaM-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania
M-2Ćwiczenia: rozwiązywanie zadań przy tablicy, w niektórych przypadkach wspomagane komputerowo
Sposób ocenyS-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena formująca: Ćwiczenia: ocena pracy w trakcie zajęć oraz ocena przygotowania do zajęć
S-6Ocena podsumowująca: egzamin ustny
Kryteria ocenyOcenaKryterium oceny
2,0Studen nie potrafi rozwiązać najprostszych problemów eksploracji danych
3,0Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych w stopniu zadowalającycm
3,5Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych
4,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych
4,5Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem
5,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem oraz w sposob kreatywny