Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (S1)

Sylabus przedmiotu Przetwarzanie i analiza danych:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia stacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów nauki techniczne, studia inżynierskie
Profil ogólnoakademicki
Moduł
Przedmiot Przetwarzanie i analiza danych
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele Paweł Forczmański <Pawel.Forczmanski@zut.edu.pl>, Przemysław Klęsk <pklesk@wi.zut.edu.pl>, Izabela Rejer <irejer@wi.zut.edu.pl>
ECTS (planowane) 5,0 ECTS (formy) 5,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny Grupa obieralna

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
wykładyW4 30 2,00,40zaliczenie
ćwiczenia audytoryjneA4 15 1,00,20zaliczenie
laboratoriaL4 30 2,00,40zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Algebra liniowa
W-2Matematyka stosowana ze statystyką 2
W-3Metody numeryczne
W-4Algorytmy 2

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.2
T-A-2Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.2
T-A-3Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania2
T-A-4Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa4
T-A-5Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.4
T-A-6Kolokwium podsumowujące1
15
laboratoria
T-L-1Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.4
T-L-2Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych2
T-L-3Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych4
T-L-4Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.2
T-L-5Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.4
T-L-6Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.2
T-L-7Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,2
T-L-8Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.4
T-L-9Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.4
T-L-10Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.2
30
wykłady
T-W-1Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.3
T-W-2Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.5
T-W-3Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)2
T-W-4Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)2
T-W-5Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena2
T-W-6Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu2
T-W-7Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.6
T-W-8Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.2
T-W-9Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.4
T-W-10Zaliczenie wykładu2
30

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Uczestnictwo w zajęciach.14
A-A-2Kolokwium podsumowujące.1
A-A-3Praca własna studenta, przygotowanie się do kolowium.9
A-A-4Konsultacje1
25
laboratoria
A-L-1Uczestnictwo w zajęciach30
A-L-2Praca własna studenta, przygotowywanie się do zajęć, przygotowywanie sprawozdań18
A-L-3Konsultacje2
50
wykłady
A-W-1Uczestictwo w wykładach30
A-W-2Praca własna studenta, przygotowanie do zaliczenia18
A-W-3Konsultacje2
50

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład informacyjny i problemowy
M-2Ćwiczenia przedmiotowe

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: Ćwiczenia: ocena z kolokwium podsumowującego, ocena pracy na zajęciach Laboratorium: oceny ze sprawozdań, ocena pracy na zajęciach
S-2Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_1A_C14_W01
Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
I_1A_W04, I_1A_W03C-1T-W-7, T-W-8, T-W-6, T-W-3, T-W-9, T-W-1, T-W-2, T-W-5, T-W-4M-1S-2

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_1A_C14_U01
Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
I_1A_U05, I_1A_U01, I_1A_U03, I_1A_U06C-1T-A-4, T-L-7, T-L-4, T-L-3, T-A-3, T-A-5, T-A-1, T-L-6, T-L-8, T-L-5, T-L-10, T-A-2, T-L-2, T-L-1, T-L-9M-2S-2, S-1

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
I_1A_C14_W01
Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
2,0Uzyskanie z zaliczenia 50% punktów lub poniżej
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
I_1A_C14_U01
Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
2,0Uzyskanie z zaliczenia minie lub rowno 50% punktów
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów

Literatura podstawowa

  1. J. Ćwik, J. Koronacki, Statystyczne systemy uczące się, PWN, Warszawa, 2013

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.2
T-A-2Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.2
T-A-3Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania2
T-A-4Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa4
T-A-5Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.4
T-A-6Kolokwium podsumowujące1
15

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.4
T-L-2Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych2
T-L-3Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych4
T-L-4Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.2
T-L-5Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.4
T-L-6Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.2
T-L-7Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,2
T-L-8Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.4
T-L-9Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.4
T-L-10Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.2
30

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.3
T-W-2Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.5
T-W-3Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)2
T-W-4Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)2
T-W-5Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena2
T-W-6Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu2
T-W-7Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.6
T-W-8Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.2
T-W-9Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.4
T-W-10Zaliczenie wykładu2
30

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Uczestnictwo w zajęciach.14
A-A-2Kolokwium podsumowujące.1
A-A-3Praca własna studenta, przygotowanie się do kolowium.9
A-A-4Konsultacje1
25
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach30
A-L-2Praca własna studenta, przygotowywanie się do zajęć, przygotowywanie sprawozdań18
A-L-3Konsultacje2
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestictwo w wykładach30
A-W-2Praca własna studenta, przygotowanie do zaliczenia18
A-W-3Konsultacje2
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_1A_C14_W01Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_W04Ma wiedzę w zakresie programowania systemów komputerowych, zna podstawowe paradygmaty programowania i wiodące języki programowania.
I_1A_W03Posiada poszerzoną wiedzę w zakresie metod przechowywania, przetwarzania, przesyłania i analizy danych oraz modelowania systemów umożliwiającą rozwiązywanie rzeczywistych problemów obliczeniowych.
Cel przedmiotuC-1Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.
Treści programoweT-W-7Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.
T-W-8Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.
T-W-6Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu
T-W-3Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)
T-W-9Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.
T-W-1Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.
T-W-2Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.
T-W-5Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena
T-W-4Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)
Metody nauczaniaM-1Wykład informacyjny i problemowy
Sposób ocenyS-2Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych
Kryteria ocenyOcenaKryterium oceny
2,0Uzyskanie z zaliczenia 50% punktów lub poniżej
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaI_1A_C14_U01Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_U05Potrafi rozwiązywać zadania i problemy informatyczne z wykorzystaniem metod matematyki obliczeniowej w szczególności stosując techniki analityczne lub symulacyjne.
I_1A_U01Potrafi wykrywać związki i zależności w procesach zachodzących w systemach rzeczywistych i na tej podstawie tworzyć modele komputerowe i przeprowadzać ich symulacje.
I_1A_U03Potrafi pozyskiwać, przesyłać, przetwarzać dane, podsumowywać wyniki eksperymentów empirycznych, dokonywać interpretacji uzyskanych wyników i formułować wynikające z nich wnioski.
I_1A_U06Potrafi rozwiązywać podstawowe problemy algorytmiczne z uwzględnieniem ich złożoności posługując się kluczowymi językami programowania.
Cel przedmiotuC-1Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.
Treści programoweT-A-4Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa
T-L-7Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,
T-L-4Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.
T-L-3Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych
T-A-3Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania
T-A-5Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.
T-A-1Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.
T-L-6Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.
T-L-8Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.
T-L-5Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.
T-L-10Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.
T-A-2Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.
T-L-2Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych
T-L-1Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.
T-L-9Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.
Metody nauczaniaM-2Ćwiczenia przedmiotowe
Sposób ocenyS-2Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych
S-1Ocena formująca: Ćwiczenia: ocena z kolokwium podsumowującego, ocena pracy na zajęciach Laboratorium: oceny ze sprawozdań, ocena pracy na zajęciach
Kryteria ocenyOcenaKryterium oceny
2,0Uzyskanie z zaliczenia minie lub rowno 50% punktów
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów