Study program:
Educational and professional program "Computer Science” (Artificial Intelligence)
Degree: Bachelor
Type of module: lecture, exercise
Lecturer: Assoc. Prof., PhD Oleg Zolotukhin / Олег Золотухін
Language: Ukrainian
Credit Points: 6 ECTS
Description:
Content module 1. Big data processing technologies, Big Data architectural models, virtualization technologies, container technologies 1. Sources of big data. Internet of Things. Definition of Big Data 2. Development of software for analyzing websites that provide open data using Python Pandas. Open data, their formats and processing tools 3. Formatting time and date data, reading and writing files in Python. Interaction with external applications 4. Processing of missing data. Converting data types and manipulating date frames in Python 5. Regression data analysis 6. Errors in data analysis and predictive analytics. 7. Data classification algorithms. Applications and problems of classifications. Decision tree classifier model 8. Types of data visualization. Visualization of anomalies. Content module 2. Big data distributed processing technologies. 1. Basic tools for data analysis and visualization in PowerBI 2. Architectural models of Big Data. Virtualization technologies. Hypervisors. Container technology for executing software code on the server 3.Hadoop Big Data technologies. Distributed MapReduce processing 4.Apache Spark platform
Змістовний модуль 1. Технології для оброблення великих даних, архітектурні моделі Big Data, технології віртуалізації, контейнерні технології 1. Джерела великих даних. Інтернет Речей. Визначення Big Data 2. Розроблення програмного забезпечення для аналізу веб-сайтів, які надають відкриті дані. Відкриті дані, їх формати та засоби оброблення 3. Форматування даних про час та дату. Взаємодія із зовнішніми додатками 4. Процедура імпорту даних із файлів. Імпорт даних з мережі Інтернет. Засоби для кореляційного аналізу. 5. Оброблення відсутніх даних. Перетворення типів даних та маніпулювання дата фреймами 6. Регресійний аналіз даних 7. Помилки в аналізі даних та прогнозній аналітиці. Оцінка помилок регресії 8. Алгоритми класифікації даних. Застосування та проблеми класифікацій. Модель класифікатора дерева рішень 9. Типи візуалізації даних. Візуалізація аномалій. Використання PowerBI. Змістовний модуль 2. Технології розподіленої обробки великих даних. 1. Експорт, імпорт та оброблення даних 2. Основні інструменти аналізу та візуалізаціїданих в PowerBI 3. Архітектурні моделі Big Data. Технології віртуалізації. Гіпервізори. 4. Технології Hadoop Big Data. Розподілена обробка MapReduce