Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (N1)
specjalność: Inżynieria aplikacji webowych

Sylabus przedmiotu Przetwarzanie i analiza danych:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia niestacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów charakterystyki PRK, kompetencje inżynierskie PRK
Profil ogólnoakademicki
Moduł
Przedmiot Przetwarzanie i analiza danych
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele Paweł Forczmański <Pawel.Forczmanski@zut.edu.pl>, Przemysław Klęsk <pklesk@wi.zut.edu.pl>, Izabela Rejer <irejer@wi.zut.edu.pl>
ECTS (planowane) 6,0 ECTS (formy) 6,0
Forma zaliczenia egzamin Język polski
Blok obieralny Grupa obieralna

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
ćwiczenia audytoryjneA5 10 1,00,20zaliczenie
wykładyW5 18 3,00,40egzamin
laboratoriaL5 16 2,00,40zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Algebra liniowa
W-2Matematyka stosowana ze statystyką 2
W-3Metody numeryczne
W-4Algorytmy 2

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.1
T-A-2Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.2
T-A-3Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania2
T-A-4Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa2
T-A-5Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.2
T-A-6Kolokwium podsumowujące1
10
laboratoria
T-L-1Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.1
T-L-2Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych1
T-L-3Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych2
T-L-4Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.2
T-L-5Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.2
T-L-6Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.1
T-L-7Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,1
T-L-8Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.2
T-L-9Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.2
T-L-10Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.2
16
wykłady
T-W-1Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.2
T-W-2Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.2
T-W-3Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)1
T-W-4Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)2
T-W-5Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena1
T-W-6Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu2
T-W-7Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.2
T-W-8Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.2
T-W-9Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.2
T-W-10Zaliczenie wykładu2
18

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Uczestnictwo w zajęciach.10
A-A-2Praca własna15
25
laboratoria
A-L-1Uczestnictwo w zajęciach16
A-L-2Praca własna34
50
wykłady
A-W-1Uczestnictwo w wykładach18
A-W-2Praca własna53
A-W-3Konsultacje2
A-W-4Egzamin2
75

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład informacyjny i problemowy
M-2Ćwiczenia przedmiotowe

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: Ćwiczenia: ocena z kolokwium podsumowującego, ocena pracy na zajęciach Laboratorium: oceny ze sprawozdań, ocena pracy na zajęciach
S-2Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych

Zamierzone efekty uczenia się - wiedza

Zamierzone efekty uczenia sięOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
Itest_1A_C14_W01
Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
I_1A_W02, I_1A_W05C-1T-W-2, T-W-1, T-W-3, T-W-8, T-W-5, T-W-6, T-W-9, T-W-7, T-W-4M-1S-2

Zamierzone efekty uczenia się - umiejętności

Zamierzone efekty uczenia sięOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
Itest_1A_C14_U01
Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
I_1A_U04, I_1A_U05, I_1A_U06, I_1A_U08, I_1A_U09C-1T-A-1, T-A-3, T-A-4, T-A-2, T-A-5, T-L-9, T-L-1, T-L-10, T-L-2, T-L-6, T-L-3, T-L-5, T-L-7, T-L-8, T-L-4M-2S-1, S-2

Kryterium oceny - wiedza

Efekt uczenia sięOcenaKryterium oceny
Itest_1A_C14_W01
Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
2,0Uzyskanie z zaliczenia 50% punktów lub poniżej
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów

Kryterium oceny - umiejętności

Efekt uczenia sięOcenaKryterium oceny
Itest_1A_C14_U01
Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
2,0Uzyskanie z zaliczenia minie lub rowno 50% punktów
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów

Literatura podstawowa

  1. J. Ćwik, J. Koronacki, Statystyczne systemy uczące się, PWN, Warszawa, 2013

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.1
T-A-2Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.2
T-A-3Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania2
T-A-4Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa2
T-A-5Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.2
T-A-6Kolokwium podsumowujące1
10

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.1
T-L-2Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych1
T-L-3Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych2
T-L-4Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.2
T-L-5Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.2
T-L-6Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.1
T-L-7Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,1
T-L-8Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.2
T-L-9Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.2
T-L-10Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.2
16

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.2
T-W-2Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.2
T-W-3Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)1
T-W-4Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)2
T-W-5Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena1
T-W-6Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu2
T-W-7Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.2
T-W-8Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.2
T-W-9Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.2
T-W-10Zaliczenie wykładu2
18

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Uczestnictwo w zajęciach.10
A-A-2Praca własna15
25
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach16
A-L-2Praca własna34
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestnictwo w wykładach18
A-W-2Praca własna53
A-W-3Konsultacje2
A-W-4Egzamin2
75
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty uczenia sięItest_1A_C14_W01Student zna postawowe pojęcia związane z analizą i przetwarzaniem danych, zna i rozróżnia podstawowe zagadnienia, metody i narzedzia analizy danych.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_W02Ma zaawansowaną i uporządkowaną, podbudowaną teoretycznie wiedzę ogólną obejmującą kluczowe zagadnienia z zakresu fundamentalnych obszarów informatyki.
I_1A_W05Ma wiedzę o nowoczesnych metodach projektowania, analizowania, wytwarzania, testowania oprogramowania oraz rozwiązywania wybranych zadań inżynierskich obejmujących w szczególności narzędzia wspomagające wytwarzanie oprogramowania na różnych etapach powstawania, eksploatacji i rozwoju systemów informatycznych.
Cel przedmiotuC-1Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.
Treści programoweT-W-2Techniki przetwarzania wstępnego (binaryzacja, normalizacje, skalowanie, braki w danych), Metody selekcji zmiennych oraz ogólne metody ekstrakcji cech z danych, transformacje ortogonalne danych: transformacja Fouriera, transformacja cosinusowa, PCA, techniki wizualizacji danych.
T-W-1Modele danych oraz i różne rodzaje danych, rodzaje atrybutów, skale pomiarowe, Dane numeryczne, tabelaryczne, ramki danych, dane tekstowe, obrazy, dźwięki, szeregi czasowe, Załażenia odnośnie danych, i.i.d stacjonarność.
T-W-3Duże małe, zbiory danych (big data), zagadnienia związane z przetwarzaniem dużych zbiorów danych (np. zarządzanie pamięcią, paradygmat map-reduce)
T-W-8Zadanie regresji, modele regresyjne: regresja liniowa, regresja odporna liniowa, regresje lokalne, regularyzacja modelu.
T-W-5Histogramy, techniki wygładzania danych, Jądrowe metody estymacji funkcji gęstości, estymator Parzena
T-W-6Metody oceny dokładności modeli (próba ucząca, walidująca, testowa, krosswalidacja, bootstap), miary oceny jakości modeli klasyfikacyjnych (dokładnosć, czułość, precyzja, F1, krzywa ROC, AUC), regresyjnych (MAE, MSE), funkcja wiarygodności, wiarygodność modelu
T-W-9Techniki grupowania danych, kwantowanie wektorowe, metryki, miary oceny podobieństwa obiektów i skupień, metoda k-środków, metody hierarchiczne (Warda, najbliżeszego sąsiedztwa), Algorytm EM.
T-W-7Podstawowe modele klasyfikacyjne: klasyfikatory liniowe (lda, regresja logistyczna, liniowy SVM), k-nn, drzewa decyzyjne; Klasyfikacja wieloklasowa.
T-W-4Zadania analizy danych (wygładzanie danych, identyfikacja rozkładu, klasyfikacja, regresja, klasteryzacja, wykrywanie zależności, wykrywanie obserwacji odstających, analiza szeregów czasowych), Komponenty typowego zadania analizy danych jak: wybór modelu, funkcja uczące, ocena jakości modelu, sposób zarządzania danymi. Paradygmaty uczenia maszynowego (nadzorowane, nienadzorowane, półnadzorowane, ze wzmocnieniem)
Metody nauczaniaM-1Wykład informacyjny i problemowy
Sposób ocenyS-2Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych
Kryteria ocenyOcenaKryterium oceny
2,0Uzyskanie z zaliczenia 50% punktów lub poniżej
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów
PoleKODZnaczenie kodu
Zamierzone efekty uczenia sięItest_1A_C14_U01Student umie rozpoznawać typy zadań analizy i przetwarzania danych,umie wybrać odpowiednie metody i stosować wybrane narzędzia przy rozwiązywaniu zagadnień związanych z analizą i przetwarzaniem danych.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_U04Potrafi identyfikować związki i zależności w procesach zachodzących w systemach rzeczywistych i na tej podstawie tworzyć modele komputerowe oraz przeprowadzać ich symulacje.
I_1A_U05Potrafi zaplanować i zrealizować eksperymenty w zakresie oceny wydajności, złożoności, efektywności systemów informatycznych i ich składowych.
I_1A_U06Potrafi pozyskiwać, przesyłać, przetwarzać dane, podsumowywać wyniki eksperymentów empirycznych, dokonywać interpretacji uzyskanych wyników i formułować wynikające z nich wnioski.
I_1A_U08Potrafi rozwiązywać inżynierskie zadania informatyczne z wykorzystaniem metod matematyki obliczeniowej w szczególności stosując techniki analityczne lub symulacyjne.
I_1A_U09Potrafi dobrać właściwe metody i narzędzia do rozwiązywania wybranych zadań informatycznych w warunkach nie w pełni przewidywalnych.
Cel przedmiotuC-1Zasadniczym celem przedmiotu jest zaznajomienie studenta z podstawowymi technikami analizy i przetwarzania różnego rodzaju danych. Celem dodatkowym jest zapoznanie praktyczne studenta z wybranym środowiiskiem analizy danych do wyboru rozważane mogą być środowiska analizy danych w językach Python, Matlab lub R.
Treści programoweT-A-1Przypomnienie wiadomośći z rachunku prewdopodobieństwa: niezależnośc, tw. Bayesa wzór na prawdopodobieństow całkowite.
T-A-3Techniki przetwarzania wstępnego, transformacje ortogonalne (PCA, dyskretne przekształcenie Foruriera), zadania
T-A-4Zadanie klasyfikacji, miary jakości klasyfikacji, wyznaczanie krzywej ROC, zadania ilustrujące związki pomiędzy miarami jakości, klasyfikacja bezregułowa
T-A-2Elementarne pojęcia teorii informacji: entorpia, entropia krzyżowa, informacja wzajemna, przyrost informacji, indeks Giniego, nierówność Gibbsa, własności związki z selekcją atrybutów oraz dyskretyzacją.
T-A-5Zadanie klasteryzacji, metryki geometryczne oraz miary podobieństwa pomiędzy skupieniami, grupowanie hierarchiczne, algorytm k-środków, zadania powiązane z analizą i działaniem algorytmów grupujących.
T-L-9Grupowanie danych implementacja algorytmu k-środków. Analiza działania algorytmu, zastosowanie do kwantyzacji wektorowej.
T-L-1Wprowadzenie do środowiska obliczeniowego (Python (numpy, scipy, matplotlib, pandas, sklearn), Matlab (Statistical Toolbox), lub R) oraz wczytywanie danych w róznych formatach.
T-L-10Gurpowanie hierarchiczne, dendorogram porównanie metod grupowania danych. Dobór liczby skupień, miary AIC oraz BIC.
T-L-2Metody preprocesingu normalizacja, binaryzacja, atrybutów, selekcja zmiennych
T-L-6Przegląd metod klasyfikacyjnych oraz ocena jakiości i czasu działania wybranych metod.
T-L-3Transformacje ortogonalne oraz analiza składowych głównych, zastosowanie do ekstrakcji cech oraz wizualizacji danych
T-L-5Medody klasyfikacji implementacja wybranej metody (liniowy SVM, regresja logistyczna drzewo decyzyjne lub k-nn) oraz porównaie własnej implementacji z metodami wbudowanym w pakiet scikit-klearn.
T-L-7Klasyfikacja wielkolasowa różne strategie: 1:1 1:pozostali,
T-L-8Regresja zwykłą i odporna zagadnienie selekcji zmiennych w modelu liniowym.
T-L-4Wygładzanie danych, interpolacja, jądrowe estymatory funkcji gęstości.
Metody nauczaniaM-2Ćwiczenia przedmiotowe
Sposób ocenyS-1Ocena formująca: Ćwiczenia: ocena z kolokwium podsumowującego, ocena pracy na zajęciach Laboratorium: oceny ze sprawozdań, ocena pracy na zajęciach
S-2Ocena podsumowująca: Wykład: ocena z egzaminu Ćwiczenia: wypadkowa z ocen cząstkowych Laboratoria: wypadkowa z ocen cząstkowych
Kryteria ocenyOcenaKryterium oceny
2,0Uzyskanie z zaliczenia minie lub rowno 50% punktów
3,0Uzyskanie z zaliczenia powyżej 50% punktów
3,5Uzyskanie z zaliczenia 60%-70% punktów
4,0Uzyskanie z zaliczenia 70%-80% punktów
4,5Uzyskanie z zaliczenia 80%-90% punktów
5,0Uzyskanie z zaliczenia 90%-100% punktów