Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (N2)
specjalność: inżynieria oprogramowania

Sylabus przedmiotu Algorytmy eksploracji danych:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia niestacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister
Obszary studiów nauki techniczne
Profil ogólnoakademicki
Moduł
Przedmiot Algorytmy eksploracji danych
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele Przemysław Klęsk <pklesk@wi.zut.edu.pl>
ECTS (planowane) 4,0 ECTS (formy) 4,0
Forma zaliczenia egzamin Język polski
Blok obieralny Grupa obieralna

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
wykładyW1 10 1,30,44egzamin
laboratoriaL1 14 1,70,26zaliczenie
ćwiczenia audytoryjneA1 10 1,00,30zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawowe wiadomości z rachunku prawdopodobieństwa i statystyki
W-2Podstawowe wiadomości z algebry liniowej

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
C-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przypomnienie wiadomości z rachunku prawdopodobieństwa: niezaleznosc, Reguła Bayesa, prawdopopodobieństwo warunkowe, prawo następstw Laplace'a2
T-A-2Klasyfikator Bayesa przykład obliczeniowy2
T-A-3Analiza składowych głównych2
T-A-4Entropia, przyrost informacji, informacja wzajemna, index Giniego, nierówność Gibbsa, zastosowanie do selekcji atrybutów i dyskretyzacji1
T-A-5Miary zanieczyszczenia używane w drzewach decyzyjnych, algorytm budowy drzewa decyzyjnego1
T-A-6Wyszukiwanie reguł reguł asocjacyjnych - przykłady2
10
laboratoria
T-L-1Narzędzia analizy danych, Analiza danych w programie Matlab, wczytywanie danych, publiczne repozytoria danych. Udzieł w prowadzeniu badań.1
T-L-2Naiwny klasyfikator bayesowski (implementacja), dwa warianty: 1) zmienne dyskretne, 2) zmienne ciągłe. Udzieł w prowadzeniu badań.2
T-L-3Grupowanie danych, algorytm EM, pakiet netlab. Udzieł w prowadzeniu badań.2
T-L-4Implementacja algorytmu K-środków wykorzystującego odległości: euklidesową i Mahalanobisa1
T-L-5Analiza składowych głównych - zastosowanie do wizualizacji dancyh2
T-L-6Klasyfikatory: sieci neuronowe i regresja logistyczna z wykorzystaniem pakietu netlab. drzewa decyzyjne (warianty: atrybuty binarne, atrybuty ciągłe i mieszane, mechanizm przycinania)2
T-L-7Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych2
T-L-8Uczestnictwo w prowadzeniu badań z zakresu eksploracji danych -- sprawozdanie podsumowujące2
14
wykłady
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.2
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców1
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków2
T-W-4Ocena jakości maszy klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap1
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski1
T-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART1
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne2
10

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Uczestnictwo w zajęciach10
A-A-2Samodzielne przygotowanie do zajęć13
A-A-3Przygotowanie do zaliczenia4
27
laboratoria
A-L-1Uczestnictwo w zajęciach14
A-L-2przygotowanie do zajęć10
A-L-3praca nad zadaniami programistycznymi oraz sprawozdaniami20
A-L-4Udział w konsultacjach i zaliczeniu2
46
wykłady
A-W-1Uczestnictwo w wykładach10
A-W-2konsultacje2
A-W-3Przygotowanie do egzaminu23
35

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład prezentacja w postaci slajdów
M-2Ćwiczenia: rozwiązywanie zadań przy tablicy, w niektórych przypadkach wspomagane komputerowo
M-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena formująca: Ćwiczenia: ocena pracy w trakcie zajęć oraz ocena przygotowania do zajęć
S-5Ocena podsumowująca: zaliczenie ćwiczeń w formie kolokwium na koniec semestru
S-6Ocena podsumowująca: egzamin ustny

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_C/05_W01
Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
I_2A_W04, I_2A_W08C-3, C-1, C-2, C-4M-1, M-3, M-2S-6, S-5, S-3, S-1, S-4

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_C/05_U01
Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
I_2A_U09, I_2A_U10, I_2A_U12C-3, C-1, C-2M-1, M-3S-6, S-3, S-1, S-2

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_C/05_K01
Potrafi rozwiązywać problemy eksploracji danych w sposób kreatywny
I_2A_K06C-3, C-2M-3, M-2S-6, S-3, S-1, S-2, S-4

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
I_2A_C/05_W01
Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
2,0Student nie przyswoił sobie podstawowej wiedzy z zakresu eksploracji danych
3,0Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych w stopniu zadowalającym
3,5Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych
4,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych
4,5Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych
5,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych, zna zalety i ograniczenia stosowanych metod i algorytmów

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
I_2A_C/05_U01
Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
2,0Student nie przyswoił sobie podstawowych umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
3,0Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych w stopniu zadowalającycm
3,5Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
4,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach
4,5Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, przy rozwiazywaniu zadań wykazyje sie pomysłowością i kreatywnością
5,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, umie dodatkowo wybrać optymalny sposób implementacji algorytmu oraz w wskazać najlepsze metody do rozwiazania konkretnego zagadnienia

Kryterium oceny - inne kompetencje społeczne i personalne

Efekt kształceniaOcenaKryterium oceny
I_2A_C/05_K01
Potrafi rozwiązywać problemy eksploracji danych w sposób kreatywny
2,0Studen nie potrafi rozwiązać najprostszych problemów eksploracji danych
3,0Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych w stopniu zadowalającycm
3,5Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych
4,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych
4,5Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem
5,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem oraz w sposob kreatywny

Literatura podstawowa

  1. J. Ćwik, J. Koronacki, Statystyczne systemy uczące, Akademicka oficyna wydawnicza EXIT, Warszawa, 2008
  2. David MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 2003

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przypomnienie wiadomości z rachunku prawdopodobieństwa: niezaleznosc, Reguła Bayesa, prawdopopodobieństwo warunkowe, prawo następstw Laplace'a2
T-A-2Klasyfikator Bayesa przykład obliczeniowy2
T-A-3Analiza składowych głównych2
T-A-4Entropia, przyrost informacji, informacja wzajemna, index Giniego, nierówność Gibbsa, zastosowanie do selekcji atrybutów i dyskretyzacji1
T-A-5Miary zanieczyszczenia używane w drzewach decyzyjnych, algorytm budowy drzewa decyzyjnego1
T-A-6Wyszukiwanie reguł reguł asocjacyjnych - przykłady2
10

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Narzędzia analizy danych, Analiza danych w programie Matlab, wczytywanie danych, publiczne repozytoria danych. Udzieł w prowadzeniu badań.1
T-L-2Naiwny klasyfikator bayesowski (implementacja), dwa warianty: 1) zmienne dyskretne, 2) zmienne ciągłe. Udzieł w prowadzeniu badań.2
T-L-3Grupowanie danych, algorytm EM, pakiet netlab. Udzieł w prowadzeniu badań.2
T-L-4Implementacja algorytmu K-środków wykorzystującego odległości: euklidesową i Mahalanobisa1
T-L-5Analiza składowych głównych - zastosowanie do wizualizacji dancyh2
T-L-6Klasyfikatory: sieci neuronowe i regresja logistyczna z wykorzystaniem pakietu netlab. drzewa decyzyjne (warianty: atrybuty binarne, atrybuty ciągłe i mieszane, mechanizm przycinania)2
T-L-7Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych2
T-L-8Uczestnictwo w prowadzeniu badań z zakresu eksploracji danych -- sprawozdanie podsumowujące2
14

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.2
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców1
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków2
T-W-4Ocena jakości maszy klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap1
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski1
T-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART1
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne2
10

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Uczestnictwo w zajęciach10
A-A-2Samodzielne przygotowanie do zajęć13
A-A-3Przygotowanie do zaliczenia4
27
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach14
A-L-2przygotowanie do zajęć10
A-L-3praca nad zadaniami programistycznymi oraz sprawozdaniami20
A-L-4Udział w konsultacjach i zaliczeniu2
46
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestnictwo w wykładach10
A-W-2konsultacje2
A-W-3Przygotowanie do egzaminu23
35
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_2A_C/05_W01Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_W04Ma wiedzę z zakresu zaawansowanych technik programowania systemów informatycznych w wybranym obszarze zastosowań
I_2A_W08Ma rozszerzoną wiedzę o podstawowych zadaniach eksploracji i analizy danych zarówno ilościowych jak i jakościowych
Cel przedmiotuC-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
C-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka
Metody nauczaniaM-1Wykład prezentacja w postaci slajdów
M-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania
M-2Ćwiczenia: rozwiązywanie zadań przy tablicy, w niektórych przypadkach wspomagane komputerowo
Sposób ocenyS-6Ocena podsumowująca: egzamin ustny
S-5Ocena podsumowująca: zaliczenie ćwiczeń w formie kolokwium na koniec semestru
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-1Ocena formująca: laboratorium ocena sprawozdań
S-4Ocena formująca: Ćwiczenia: ocena pracy w trakcie zajęć oraz ocena przygotowania do zajęć
Kryteria ocenyOcenaKryterium oceny
2,0Student nie przyswoił sobie podstawowej wiedzy z zakresu eksploracji danych
3,0Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych w stopniu zadowalającym
3,5Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych
4,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych
4,5Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych
5,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych, zna zalety i ograniczenia stosowanych metod i algorytmów
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_2A_C/05_U01Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_U09Potrafi wydobywać wiedzę zawartą w dużych zbiorach danych
I_2A_U10Potrafi wykorzystywać oprogramowanie wspomagające rozwiązywanie wybranych problemów
I_2A_U12Ma umiejętność stosowania zaawansowanych technik programowania i metodyki projektowania systemów informatycznych w wybranym obszarze zastosowań
Cel przedmiotuC-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
Metody nauczaniaM-1Wykład prezentacja w postaci slajdów
M-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania
Sposób ocenyS-6Ocena podsumowująca: egzamin ustny
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
Kryteria ocenyOcenaKryterium oceny
2,0Student nie przyswoił sobie podstawowych umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
3,0Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych w stopniu zadowalającycm
3,5Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
4,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach
4,5Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, przy rozwiazywaniu zadań wykazyje sie pomysłowością i kreatywnością
5,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, umie dodatkowo wybrać optymalny sposób implementacji algorytmu oraz w wskazać najlepsze metody do rozwiazania konkretnego zagadnienia
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_2A_C/05_K01Potrafi rozwiązywać problemy eksploracji danych w sposób kreatywny
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_K06Potrafi myśleć i działać w sposób kreatywny i przedsiębiorczy
Cel przedmiotuC-3Nabycie umiejętności implementacji wybranych metod eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
Metody nauczaniaM-3Laboratoria pracza przy komputerach w środowisku programu Matlab lub R, samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania
M-2Ćwiczenia: rozwiązywanie zadań przy tablicy, w niektórych przypadkach wspomagane komputerowo
Sposób ocenyS-6Ocena podsumowująca: egzamin ustny
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-4Ocena formująca: Ćwiczenia: ocena pracy w trakcie zajęć oraz ocena przygotowania do zajęć
Kryteria ocenyOcenaKryterium oceny
2,0Studen nie potrafi rozwiązać najprostszych problemów eksploracji danych
3,0Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych w stopniu zadowalającycm
3,5Studen potrafi samodzielnie rozwiązać proste zadania eksploracji danych
4,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych
4,5Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem
5,0Studen potrafi samodzielnie rozwiązać stawiane przed nim zadania eksploracji danych, rozwiązuje je z zaangażowaniem oraz w sposob kreatywny