Wydział Informatyki - Zarządzanie i inżynieria produkcji (S2)
specjalność: zarządzanie energią i środowiskiem
Sylabus przedmiotu Analiza danych i procesów:
Informacje podstawowe
Kierunek studiów | Zarządzanie i inżynieria produkcji | ||
---|---|---|---|
Forma studiów | studia stacjonarne | Poziom | drugiego stopnia |
Tytuł zawodowy absolwenta | magister inżynier | ||
Obszary studiów | nauk technicznych | ||
Profil | ogólnoakademicki | ||
Moduł | — | ||
Przedmiot | Analiza danych i procesów | ||
Specjalność | przedmiot wspólny | ||
Jednostka prowadząca | Katedra Inżynierii Oprogramowania | ||
Nauczyciel odpowiedzialny | Valery Rogoza <wrogoza@zut.edu.pl> | ||
Inni nauczyciele | |||
ECTS (planowane) | 4,0 | ECTS (formy) | 4,0 |
Forma zaliczenia | zaliczenie | Język | polski |
Blok obieralny | — | Grupa obieralna | — |
Formy dydaktyczne
Wymagania wstępne
KOD | Wymaganie wstępne |
---|---|
W-1 | Przystępując do nauczania z danego przedmiotu student powinien mieć wiedze z teorii algorytmów i podstaw informatyki, z programowania w jednym z algorytmicznych języków programowania (C, C++, C#, Java, Basic), organizacji baz danych i struktur danych. |
Cele przedmiotu
KOD | Cel modułu/przedmiotu |
---|---|
C-1 | Celem nauczania się danego przedmiotu jest opanowywanie nowych technologi komputerowychi analizy danych, w tym dużych zbiorów danych, wyszukiwania nowej wiedzy na tych zbiorach do podejmowanioa decyzji, a także nabycie zdolności do rozwiązani problemów klasyfikacji i klasteryzacji danych, budowania modeli procesów (technologicznmych , ekonomicznych socjalnych itd.) i przewidywania przyszłych stanów systemów ulegających badaniu na podstawie tworzenia modeli regresyjnych. |
Treści programowe z podziałem na formy zajęć
KOD | Treść programowa | Godziny |
---|---|---|
laboratoria | ||
T-L-1 | Rozwiązanie problemów klasyfikacji zbiorów danych zasobami MATLABu | 4 |
T-L-2 | Badanie metody Naiv Bayes klasyfikacji zbiorów danych zasobami MATLABu | 4 |
T-L-3 | Badanie technik budowy drzew klasyfikacyjnych zasobami MATLABu | 4 |
T-L-4 | Badanie technik klasyfikacji dużych zbiorów danych zasobami MATLABu | 4 |
T-L-5 | Badanie metod regresij zasobami MATLABu ( regresja liniowa i nieliniowa, dzrewa regresyjne, regresja wielu zmiennych) | 4 |
T-L-6 | Banaie metod regresji wielokrotnej, regresji wielomianowej i falkowej zasobami MATLABu | 4 |
T-L-7 | Badanie metody "k-means" do clasteryzacji danych zasobami MATLABu | 4 |
T-L-8 | Badanie metod analizy szeregów czasowych zasobami MATLABu | 2 |
30 | ||
wykłady | ||
T-W-1 | Przechowywalnie danych * Koncepcja przechowywalni danych * Struktura przechowywalni danych * Techniki oczyszczania i filtracji danych. | 2 |
T-W-2 | Systemy analitycznego przetwarzania danych z dostępem bezpośrednim (systemy OLAP, On-line Analytical Processing) * Wielowymiarowe modele danych * Konceptualne wielowymiarowe przedstawienie danych * Architektury OLAP-systemów | 2 |
T-W-3 | Zasady tworzenia i wykorzystania technologii analizy danych * Zasady analizy danych * Dane strukturowane * Przygotowanie danych do analizy * Technologie Knowledge Discovery in Database * Platformy analityczne * Zasady budowy metod exploracji danych | 2 |
T-W-4 | Konsolidacja danych * Określenie problemu konsolidacji danych * Podstawowe koncepcje hurtowni danych * Wielowymiarowe, relacyjne, hybrydowe i wirtualne hurtownie danych * ETL-systemy (ETL, Extraction-Transformation-Loading): ekstrakcja danych z ETL, konwersja danych w ETL, ładowanie danych do hurtowni danych | 2 |
T-W-5 | Transformacja danych * Zasady transformacji danych * Uporządkowanie danych * Łączenie danych * Kwantowanie danych * Normalizacja i kodowanie danych | 2 |
T-W-6 | Wizualizacja danych * Właściwości zasobów wizualizacji danych * Metody wizualizacji danych * Hierarchiczne reguły assocjacyjne * Szablony szeregowe | 2 |
T-W-7 | Metody klasyfikacji i regresji * Metody tworzenia reguł klasyfikacyjnych * Metody tworzenia drzew decyzyjnych * Metody tworzenia funkcji matematycznych * Prognostyka procesów * Wprowadzenie do metod uczenia się maszynowego * Posługiwanie się sieciami neuronowymi do rozwiązania problemów klasyfikacji i regresji | 2 |
T-W-8 | Tworzenie reguł asocjacyjnych * Formułowanie zagadnienia tworzenia reguł asocjacyjnych * Analiza sekwencyjna * Algorytmy tworzenia reguł asocjacyjnych * Hierarchiczne reguły asocjacyjne * Szablony * Przedstawienie wyników | 2 |
T-W-9 | Klasteryzacja * Oceny błiskości elementów zbiorów oparte na miarach odłegłości * Podstawowe algorytmy klasteryzacji * Adaptacyjne algorytmy klasteryzacji * Posługiwanie się sieciami neuronowymi do rozwiązania problemów klasteryzacji | 2 |
T-W-10 | Całokształt modeli * Metody tworzenia całokształtów modeli * Techniki baggingu * Techniki boostingu * Alternatywne metody tworzenia całokształtów modeli | 2 |
T-W-11 | Metody exploracji danych w czasie rzeczywistym * Adaptacyjne techniki exploracji danych * Statystyczne metody exploracji danych oraz exploracja danych w czasie rzeczywistym * Maszyny polecające (podejście oparte na semantykę, wspólna filtracja, analiza koszyka rynkowego i analiza sekwencyjna * Wzmacnianie kształcenia i posługiwanie się agentami * Przykłady zasobów exploracji danych w czasie rzeczywistym (systemy Amazon.com, Prudsys, SpamAssassin) | 2 |
T-W-12 | Exploracja danych w sieciach WWW * Problemy i etapy analizy danych w WWW * Metody eksploracji kontenta WWW * Metodt eksploracji strukltur WWW * Wykorzystanie sacobw WWW | 2 |
T-W-13 | Rozproszona analiza danych * Systemy agentw mobilnyvh * Posugiwanie si agentami mobilnymi do analizy danych * System analizy rozproszonych danych | 2 |
T-W-14 | Porwnajnie modeli eksploracji danych * Ocena efektywnoci modeli * Ocena bdw modeli * Koszty bdnej klasyfikacji * Lift- oraz -Profit-krzywe * ROC-analiza (ROC = Receive Operating Characteristics) | 2 |
T-W-15 | Standardy technologii eksploracji danych * Standard CWM * Standard CRISP * Standard PMML | 2 |
30 |
Obciążenie pracą studenta - formy aktywności
KOD | Forma aktywności | Godziny |
---|---|---|
laboratoria | ||
A-L-1 | Uczęszczenie na zajęciach laboratoryjnych | 30 |
A-L-2 | Przygotowanie się do zajęć laboratoryjnych i opracowywanie sprawozdań z tematów badanych na zajęciach laboratoryjnych | 40 |
A-L-3 | Konsultacje z tematów zajęć laboratoryjnych | 2 |
A-L-4 | Obrona prac badawczych wykonywanych w ramach zajęć ćwiczeniowych | 4 |
76 | ||
wykłady | ||
A-W-1 | Uczęszczenie na wykłady | 30 |
A-W-2 | Znajomość źródeł literackimi proponowanymi przez wykładowca i przygotowanie do zaliczenia | 6 |
A-W-3 | Konsultacje z tenatów wykładów | 1 |
A-W-4 | Zaliczenie | 2 |
39 |
Metody nauczania / narzędzia dydaktyczne
KOD | Metoda nauczania / narzędzie dydaktyczne |
---|---|
M-1 | Wykady, wykonanie indywidualnych zadań badawczych w ramach zajęć laboratoryjnych, konsultacje z tematów wykładów i tematów zajęć laboratoryjnych. |
Sposoby oceny
KOD | Sposób oceny |
---|---|
S-1 | Ocena formująca: Ocena jakości i pełnoty wykonania badania za indywidualnym tematem na zjęciach laboratoryjnych, ocena jakości i pełnoty odpowiedzi na pytania wykładowcy podczas zaliczeń tematów prac laboratoryjnych i podczas zaliczenia z przedmiotu. |
Zamierzone efekty kształcenia - wiedza
Zamierzone efekty kształcenia | Odniesienie do efektów kształcenia dla kierunku studiów | Odniesienie do efektów zdefiniowanych dla obszaru kształcenia | Cel przedmiotu | Treści programowe | Metody nauczania | Sposób oceny |
---|---|---|---|---|---|---|
ZIP_2A_C/05_W01 ma wiedzę w zakresie technologii przechowywania danych, wstępnej obróbki, czyszczania i stosowania reduktów w dużych zbiorów danych a także zna podstawowe metody i algorytmy exploracji danych (klasyfikacja i klasteryzacja), tworzenia modeli procesów oraz badania i prognozowania procesów za pomocą metod matematycznych. | ZIP_2A_W01, ZIP_2A_W02, ZIP_2A_W04, ZIP_2A_W07 | T2A_W01, T2A_W03, T2A_W05, T2A_W07 | C-1 | — | M-1 | S-1 |
Zamierzone efekty kształcenia - umiejętności
Zamierzone efekty kształcenia | Odniesienie do efektów kształcenia dla kierunku studiów | Odniesienie do efektów zdefiniowanych dla obszaru kształcenia | Cel przedmiotu | Treści programowe | Metody nauczania | Sposób oceny |
---|---|---|---|---|---|---|
ZIP_2A_C/05_U01 Potrafi zastosować poznane metody do studium przypadku | ZIP_2A_U01, ZIP_2A_U08, ZIP_2A_U09, ZIP_2A_U11, ZIP_2A_U18, ZIP_2A_U19, ZIP_2A_U21 | T2A_U01, T2A_U08, T2A_U09, T2A_U11, T2A_U19 | C-1 | — | M-1 | S-1 |
Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne
Zamierzone efekty kształcenia | Odniesienie do efektów kształcenia dla kierunku studiów | Odniesienie do efektów zdefiniowanych dla obszaru kształcenia | Cel przedmiotu | Treści programowe | Metody nauczania | Sposób oceny |
---|---|---|---|---|---|---|
ZIP_2A_C/05_K01 Jest świadomy roli i potrzeby dokształcania | ZIP_2A_K01 | T2A_K01 | C-1 | — | M-1 | S-1 |
Kryterium oceny - wiedza
Efekt kształcenia | Ocena | Kryterium oceny |
---|---|---|
ZIP_2A_C/05_W01 ma wiedzę w zakresie technologii przechowywania danych, wstępnej obróbki, czyszczania i stosowania reduktów w dużych zbiorów danych a także zna podstawowe metody i algorytmy exploracji danych (klasyfikacja i klasteryzacja), tworzenia modeli procesów oraz badania i prognozowania procesów za pomocą metod matematycznych. | 2,0 | Student nie wykazał wiedzy z tematów teoretycznych przedstawionych na wykładach i nie wykonał wszystkie zadania na zajęciach laboratoryjnych. |
3,0 | Student wykazał bardzo słąbą wiedzę z tematów teoretycznych przedstawionych na wykładach i nie wykonał wszystkie zadania na zajęciach laboratoryjnych. | |
3,5 | Student wykazał słabą wiedzę kompetencję z tematów teoretycznych przedstawionych na wykładach, ale w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych. | |
4,0 | Student wykazał dobrą wiedzę z większości tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, ale nie wykazał dobrą wiedzę w analizę metod alternatywnych rozwiązania charakterystycznych problemów z dziedziny analizy danych i procesów. | |
4,5 | Student wykazał dobrą wiedzę ze wszystkich tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, ale niekiedy myli się w ocenie zalet i wad metod rozwiązania charakterystycznych problemów z dziedziny analizy danych i procesów. | |
5,0 | Student wykazał bardzo dobrą wiedzę ze wszystkich tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, i w stanie przedstawić dokładną i pełną analizę zalet i wad metod rozwiązania charakterystycznych problemów z dziedziny analizy danych i procesów. |
Kryterium oceny - umiejętności
Efekt kształcenia | Ocena | Kryterium oceny |
---|---|---|
ZIP_2A_C/05_U01 Potrafi zastosować poznane metody do studium przypadku | 2,0 | Student nie wykazał umiejętności wykorzystania wiedzy z teorii analizy danych i porocesów do wykonania zadań na zajęciach laboratoryjnych. |
3,0 | Student wykazał słabą umiejętnośc posługiwania wiedą teoretyczną do rozwiązania zadań na zajęciach laboratoryjnych i w stanie rozwiązywać nie zbyt trudne problemy. | |
3,5 | Student wykazał pewną kompetencję z tematów teoretycznych przedstawionych na wykładach i w stanie zastosować tę wiedzą do rozwiązania zadań określonych na zajęciach laboratoryjnych. | |
4,0 | Student wykazał dobre umiejętności zastosowania wiedzy zdobytej na wykładach do rozwiązania wiekszości zadań określonych na zajęciach laboratoryjnych, ale niekiedy myli się w szczególach tych czy inncyh algorytmów. | |
4,5 | Student wykazał dobre umiejętności zastosowania wiedzy ze wszystkich tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, ale niekiedy nie wykazuje dobre umiejętności posługiwania się alternatywnymi metodami i algorytmami rozwiązania problemów. | |
5,0 | Student wykazał bardzo dobre umiejętności wykorzystania wiedzy zdobytej na wykładach do rozwiązania problemów proponowanych na zajęciach laboratoryjnych, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, a ponadto proponuje swoje własne rozwiązania dysponująć wiedzą ze wszystkich algorytmów opanowanych na wykładach i wykazuje zdolność do kreatywności muszłenia |
Kryterium oceny - inne kompetencje społeczne i personalne
Efekt kształcenia | Ocena | Kryterium oceny |
---|---|---|
ZIP_2A_C/05_K01 Jest świadomy roli i potrzeby dokształcania | 2,0 | Student nie wykazał kompetencji z tematów teoretycznych przedstawionych na wykładach i nie wykonał wszystkie zadania na zajęciach laboratoryjnych. |
3,0 | Student wykazał bardzo słabą kompetencję z tematów teoretycznych przedstawionych na wykładach i nie w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych. | |
3,5 | Student wykazał słabą kompetencję z tematów teoretycznych przedstawionych na wykładach, ale w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych. | |
4,0 | Student wykazał dobrą kompetencję z większości tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, ale nie wykazał dobrą kompetencję w analizę metod alternatywnych rozwiązania charakterystycznych problemów z dziedziny analizy danych i procesów. | |
4,5 | Student wykazał dobrą kompetencję ze wszystkich tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, ale niekiedy nie wykazue dobrą kompetencję w ocenie zalet i wad metod rozwiązania charakterystycznych problemów z dziedziny analizy danych i procesów. | |
5,0 | Student wykazał bardzo dobrą kompetencję ze wszystkich tematów teoretycznych przedstawionych na wykładach, w pełnym stopniu wykonał zadania na zajęciach laboratoryjnych, i wykazuje bardzo dobrą kompetencję w analizę zalet i wad metod rozwiązania charakterystycznych problemów z dziedziny analizy danych i procesów. |
Literatura podstawowa
- D.N. Larose, Data Mining Methods and Models, Wiley Publishing. Inc., 2006
- C. Vercellis, Business Intelligence: Data Mining and Optimization for Decision Making, Wiley Publishing, Inc., 2009
- L. Wang, X. Fu, Data Mining with Computational Intelligence, Springer-Verlag, Berlin; Heidelberg, 2005
Literatura dodatkowa
- H.A. Abbas, R.A. Sarker, C.S. Newton, Data Mining: A Heuristic Approach, University of New South Wales, Idea Group Publishing, Australia, 2002
- M. Berthold, D.J. Hand (eds.), Intelligent Data Analysis, Springer-Verlag, Berlin; Heidelberg, 2007
- J. Han, M. Kamber, Data Mining: Concepts and Techniques, Elsevier Inc., USA, 2006