Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (N1)
specjalność: systemy komputerowe i oprogramowanie

Sylabus przedmiotu Analiza danych i uczenie maszynowe:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia niestacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów nauki techniczne, studia inżynierskie
Profil ogólnoakademicki
Moduł
Przedmiot Analiza danych i uczenie maszynowe
Specjalność systemy komputerowe i oprogramowanie
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Przemysław Klęsk <pklesk@wi.zut.edu.pl>
Inni nauczyciele Przemysław Klęsk <pklesk@wi.zut.edu.pl>, Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia egzamin Język polski
Blok obieralny 8 Grupa obieralna 6

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
wykładyW7 10 1,70,62egzamin
laboratoriaL7 12 1,30,38zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawowe wiadomości ze statystyki
W-2Podstawowe wiadomości z algebry liniowej

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie się z różnymi narzędziami wspomagającymi analizę danych
C-2Zapoznanie się z wybranymi technikami analizy danych i algorytmami uczenia maszynowego od strony praktycznej oraz implementacyjnej
C-3Ukształtowanie umiejętności rozpoznawania w sytuacjach praktycznych róznych zadań analizy danych, umiejętność dobou odpowiednich metod do ich rozwiązywania

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Narzędzia analizy danych - wprowadzenie praktyczne do programu R. Narzędzia analizy danych - pakiety analizy danych programu Matlab.2
T-L-2Analiza składowych głównych, zastosowanie do wykrywania cech i wizualizacji2
T-L-3Implementacja hierarchiczych metod grupowania danych, wizualizacja skupień2
T-L-4Klasyfikatory funkcyjne: sieci neuronowe, regresja logistyczna, metod SVM2
T-L-5Implementacja algorytmu k-NN2
T-L-6Praktyczne zadanie analizy danych rzeczywistch, z wykorzystaniem poznanych techik i narzędzi, sprawozdanie2
12
wykłady
T-W-1Narzędzia analizy danych: R, Matlab (netlab, neural network toolbox), Python (orange)2
T-W-2Uzupełnienie i przypomnienie wiadomości ze statystyki: testowanie hipotez statystycznych, twierdzenie Bayesa, metoda największej wiarygodności, testowanie niezależności, paradoks Simpsona1
T-W-3Metody przetwarzania wstępnego danych: skalowanie, binaryzacja, selekcja atrybutów, braki w danych, analiza składowych głównych, techiniki wizualizacji danych2
T-W-4Grupowanie danych: hierarchiczne metody klasteryzacji, algorytm k-środków1
T-W-5Metody klasyfikacji: drzewa decyzyjne, algorytm k-NN, klasyfikatory funkcyjne: regresja logistyczna, SVM, sieci neuronowe2
T-W-6Analiza regresji2
10

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1Zadania programistyczne do zrealizowania w domu 2-3 zadania w zależności od tempa pracy na zajciach15
A-L-2Uczestnictwo w zajęciach15
A-L-3Przygotowanie do zajęć5
A-L-4Opracowanie sprawozdań5
40
wykłady
A-W-1Uczestnictwo w zajęciach15
A-W-2Przygotowanie do zajęć8
A-W-3Konsultacje2
A-W-4Przygotowanie do egzaminu końcowego25
50

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład informacyjny z prezentacją w postaci slajdów
M-2Cwiczenia audytoryjne: rozwiązywnie zadań, prezentacje, dyskusje
M-3Ćwiczenia laboratoryjne: samodzielna praca nad postawionym problemem, wykorzystanie środowisk obliczeniowych R, Matlab, Python

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: Laboratorium: oceny z zadań programistycznych
S-2Ocena formująca: Ćwiczenia audytoryjne oceny z zadań domowych i zadań rozwiązywanych przy tablicy
S-3Ocena formująca: Ćwiczenia audytoryjne ocena za prezentację
S-4Ocena podsumowująca: Cwiczenia audytoryjne: średnia z ocen uzyskanych w trakcie semestru
S-5Ocena podsumowująca: Wykład, egzamin ustny
S-6Ocena podsumowująca: Ćwiczenia laboratoryjne: średnia z ocen uzyskanych w trakcie semestru
S-7Ocena formująca: Laboratorium: ocena za sprawozdanie

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_1A_O6/04_W01
Rozróżnia i rozumie podstawowe zadania analizy danych, umie je stosować w sytuacjach praktycznych. Posiada wiedzę na temat wybranych techik, metod i narzędzi analizy danych.
I_1A_W16C-2, C-3T-W-1, T-W-5, T-W-4, T-W-6M-3, M-1S-5, S-7

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_1A_O6/04_U02
Umie praktycznie rozwiązywać pewne typy zadań analizy danych oraz implemetować wybrane algorytmy uczenia maszynowego.
I_1A_U15C-2T-W-5, T-W-3, T-W-4, T-W-6, T-L-4, T-L-2, T-L-3, T-L-5, T-L-6M-3, M-1S-5, S-1

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
I_1A_O6/04_W01
Rozróżnia i rozumie podstawowe zadania analizy danych, umie je stosować w sytuacjach praktycznych. Posiada wiedzę na temat wybranych techik, metod i narzędzi analizy danych.
2,0
3,0Uzyskanie przynajmniej 50% punktów z kolokwium sprawdzającego znajomość pojęć i algorytmów uczenia maszynowego.
3,5
4,0
4,5
5,0

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
I_1A_O6/04_U02
Umie praktycznie rozwiązywać pewne typy zadań analizy danych oraz implemetować wybrane algorytmy uczenia maszynowego.
2,0
3,0Realizacja zadań programistycznych związanych z analizą danych i uczeniem. Oddanie programów stanowiących implementacje algorytmów w wariancie minimalnych wymagań.
3,5
4,0
4,5
5,0

Literatura podstawowa

  1. J. Koronacki., J. Ćwik, Statystyczne systemy uczące się, WNT, Warszawa, 2005

Literatura dodatkowa

  1. J. Mielniczuk, J. Koronacji, Statystyka dla studentów kierunków technicznych i przyrodniczych, WNT, Warszawa, 2006
  2. Ian H. Witten, Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann, 2005
  3. W. N. Venables, B. D. Ripley, Modern Applied Statistics with S, Springer, 2002, 4

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Narzędzia analizy danych - wprowadzenie praktyczne do programu R. Narzędzia analizy danych - pakiety analizy danych programu Matlab.2
T-L-2Analiza składowych głównych, zastosowanie do wykrywania cech i wizualizacji2
T-L-3Implementacja hierarchiczych metod grupowania danych, wizualizacja skupień2
T-L-4Klasyfikatory funkcyjne: sieci neuronowe, regresja logistyczna, metod SVM2
T-L-5Implementacja algorytmu k-NN2
T-L-6Praktyczne zadanie analizy danych rzeczywistch, z wykorzystaniem poznanych techik i narzędzi, sprawozdanie2
12

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Narzędzia analizy danych: R, Matlab (netlab, neural network toolbox), Python (orange)2
T-W-2Uzupełnienie i przypomnienie wiadomości ze statystyki: testowanie hipotez statystycznych, twierdzenie Bayesa, metoda największej wiarygodności, testowanie niezależności, paradoks Simpsona1
T-W-3Metody przetwarzania wstępnego danych: skalowanie, binaryzacja, selekcja atrybutów, braki w danych, analiza składowych głównych, techiniki wizualizacji danych2
T-W-4Grupowanie danych: hierarchiczne metody klasteryzacji, algorytm k-środków1
T-W-5Metody klasyfikacji: drzewa decyzyjne, algorytm k-NN, klasyfikatory funkcyjne: regresja logistyczna, SVM, sieci neuronowe2
T-W-6Analiza regresji2
10

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Zadania programistyczne do zrealizowania w domu 2-3 zadania w zależności od tempa pracy na zajciach15
A-L-2Uczestnictwo w zajęciach15
A-L-3Przygotowanie do zajęć5
A-L-4Opracowanie sprawozdań5
40
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestnictwo w zajęciach15
A-W-2Przygotowanie do zajęć8
A-W-3Konsultacje2
A-W-4Przygotowanie do egzaminu końcowego25
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_1A_O6/04_W01Rozróżnia i rozumie podstawowe zadania analizy danych, umie je stosować w sytuacjach praktycznych. Posiada wiedzę na temat wybranych techik, metod i narzędzi analizy danych.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_W16ma wiedzę dotyczącą możliwości zastosowania informatyki w różnych dziedzinach aktywności ludzkiej (np. w przemyśle, zarządzaniu i medycynie)
Cel przedmiotuC-2Zapoznanie się z wybranymi technikami analizy danych i algorytmami uczenia maszynowego od strony praktycznej oraz implementacyjnej
C-3Ukształtowanie umiejętności rozpoznawania w sytuacjach praktycznych róznych zadań analizy danych, umiejętność dobou odpowiednich metod do ich rozwiązywania
Treści programoweT-W-1Narzędzia analizy danych: R, Matlab (netlab, neural network toolbox), Python (orange)
T-W-5Metody klasyfikacji: drzewa decyzyjne, algorytm k-NN, klasyfikatory funkcyjne: regresja logistyczna, SVM, sieci neuronowe
T-W-4Grupowanie danych: hierarchiczne metody klasteryzacji, algorytm k-środków
T-W-6Analiza regresji
Metody nauczaniaM-3Ćwiczenia laboratoryjne: samodzielna praca nad postawionym problemem, wykorzystanie środowisk obliczeniowych R, Matlab, Python
M-1Wykład informacyjny z prezentacją w postaci slajdów
Sposób ocenyS-5Ocena podsumowująca: Wykład, egzamin ustny
S-7Ocena formująca: Laboratorium: ocena za sprawozdanie
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Uzyskanie przynajmniej 50% punktów z kolokwium sprawdzającego znajomość pojęć i algorytmów uczenia maszynowego.
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_1A_O6/04_U02Umie praktycznie rozwiązywać pewne typy zadań analizy danych oraz implemetować wybrane algorytmy uczenia maszynowego.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_U15potrafi wykorzystywać poznane metody, modele matematyczne oraz symulacje komputerowe do rozwiązywania prostych problemów inżynierskich
Cel przedmiotuC-2Zapoznanie się z wybranymi technikami analizy danych i algorytmami uczenia maszynowego od strony praktycznej oraz implementacyjnej
Treści programoweT-W-5Metody klasyfikacji: drzewa decyzyjne, algorytm k-NN, klasyfikatory funkcyjne: regresja logistyczna, SVM, sieci neuronowe
T-W-3Metody przetwarzania wstępnego danych: skalowanie, binaryzacja, selekcja atrybutów, braki w danych, analiza składowych głównych, techiniki wizualizacji danych
T-W-4Grupowanie danych: hierarchiczne metody klasteryzacji, algorytm k-środków
T-W-6Analiza regresji
T-L-4Klasyfikatory funkcyjne: sieci neuronowe, regresja logistyczna, metod SVM
T-L-2Analiza składowych głównych, zastosowanie do wykrywania cech i wizualizacji
T-L-3Implementacja hierarchiczych metod grupowania danych, wizualizacja skupień
T-L-5Implementacja algorytmu k-NN
T-L-6Praktyczne zadanie analizy danych rzeczywistch, z wykorzystaniem poznanych techik i narzędzi, sprawozdanie
Metody nauczaniaM-3Ćwiczenia laboratoryjne: samodzielna praca nad postawionym problemem, wykorzystanie środowisk obliczeniowych R, Matlab, Python
M-1Wykład informacyjny z prezentacją w postaci slajdów
Sposób ocenyS-5Ocena podsumowująca: Wykład, egzamin ustny
S-1Ocena formująca: Laboratorium: oceny z zadań programistycznych
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Realizacja zadań programistycznych związanych z analizą danych i uczeniem. Oddanie programów stanowiących implementacje algorytmów w wariancie minimalnych wymagań.
3,5
4,0
4,5
5,0