Обучение

Консультация

Консультируем с 8:30 до 19:00 Выходной: суббота и воскресенье


Сообщение об ошибке

Обучение

Сообщение об ошибке

Основы Data Science

Профессиональный курс (для трудоустройства)

Интересуетесь работой с данными и хотите получить престижную профессию? Курс по основам Data Science в Гродно поможет получить все необходимые навыки и умения. 

Вы поймёте науку о данных, научитесь анализировать информацию, находить зависимости, приобретете знания в областях Data Mining, Big Data, Machine Learning. Это позволит претендовать на должность Data Scientist в IT-компании. Средняя зарплата у данных специалистов на белорусском рынке труда – свыше 2400 долларов.

Технические требования к оборудованию слушателей дистанционных курсов.

Описание курса

Условия отбора

Зачисление на курс производится на конкурсной основе по результатам:

  • выполнения тестового задания от тренера на знание основ математики и языка программирования Python;

  • теста по английскому языку.

Для кого этот курс

  • для разработчиков, желающих расширить свои компетенции;

  • для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;

  • для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;

  • для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.

Необходимая подготовка

Для чего этот курс

Курс предназначен для: 

  • приобретения знаний в областях Machine Learning/Data Science/Big Data;

  • формирования устойчивых навыков и умений по постановке и решению задач с использованием математической статистики и современных информационных технологий;

  • приобретения навыков для решения бизнес задач при помощи технологий глубокого обучения и нейронных сетей;

  • приобретения умений интерпретировать данные на язык бизнеса и доносить инсайты до бизнес пользователей.

Вы будете уметь

  • осуществлять сбор, очистку и исследование исходных данных;

  • находить инсайты и зависимости в структурированных и неструктурированных данных;

  • доносить ключевые идеи с языка данных на язык бизнеса;

  • графически интерпретировать данные;

  • осуществлять постановку и решение задач машинного обучения согласно современному стандарту CRISP-DM;

  • применять основные алгоритмы машинного обучения и математического программирования;

  • пользоваться основными инструментами и фреймворками для решения задач в области Data Science;

  • разбираться в современных архитектурах нейронных сетей и применять их на практике для решения задач;

  • решать задачи Computer Vision / Natural Language Processing / Time Series;

  • применять концепции и инструменты при работе с большими объемами данных;

  • разрабатывать высококачественные рекомендательные системы;

  • определять и выяснять требования для проектов у заказчика;

  • определять качество построенных решений на реальных данных;

  • разворачивать модели в production.

Внимание:

Доступ к электронным материалам открыт в период прохождения курса. По окончании курса доступ закрывается.

Программа курса

  1. Введение в Data Science
    Обзор Data Science и Machine Learning.
    Инструменты для работы:
    • Что изучим в процессе курса.
    • Python / Anaconda / Jupyter Notebook - установка, быстрый экскурс по языку (синтаксис, типы данных и конструкции, функции, GIL и ООП).
    • Знакомства с менеджерами пакетов (pip, conda). Введение в понятия репозитория. Введение в понятия сборки пакета.
    • Работа с инструментами контроля версий Git.
    Numpy - введение в библиотеку. Линейная алгебра / Статистика.
    Pandas - введение в библиотеку. Получение и обработка данных.
    • Чтение данных.
    • Обработка данных.
    • Сохранение данных для последующей работы.
    Базовый эксплоративный анализ и визуализация данных.
    • Базовые статистики.
    • Распределение данных.
    • Базовая визуализация данных.
    Методология работы в области DS - CRISP- DM.
  2. Математические основы для Data Science
    Понятия линейной алгебры. Пределы, производные, интегрирование, матрицы.
    Понятия математической статистики и теории вероятностей.
    Тензоры и операции над тензорами.
    Реализация математических вычислений в Python.
    Формулировка и проверка гипотез: теория и практика.
    Визуализация данных в Python.
  3. Введение в машинное обучение Часть 1
    Классы решаемых задач в машинном обучении.
    Обзор и классификация алгоритмов в машинном обучении.
    Supervised Learning / обучение с учителем:
    • Линейная регрессия.
    • Нелинейная регрессия.
    • Логистическая регрессия.
    • Метод опорных векторов.
    • Деревья решений.
    • Метод опорных векторов.
    Feature Engineering и углубленная обработка данных.
    Переобучение моделей. Регуляризация.
    Бустинг. Градиентный бустинг и ансамбли моделей.
    Проверка качества моделей. Метрики качества для алгоритмов регрессии и метрики качества для алгоритмов классификации.
    Библиотека XGboost / CatBoost.
    Автоматический поиск алгоритмов.
  4. Введение в машинное обучение Часть 2
    Unsupervised Learning / Обучение без учителя:
    • Метод k-ближайших соседей и EM алгоритм.
    • Кластеризация. Иерархическая кластеризация. DBSCAN.
    • Affinity Propagation.
    • Задача декомпозиции. Алгоритмы SVD / ALS / PCA / T-SNE / NMF.
    • Алгоритмы понижения размерности.
    • Алгоритм SVM (Support Vector Machine).
    Углубленный Feature Engineering.
    Проблемы качества и размерности данных.
    Методы уменьшения размерности данных.
    Спрямляющие пространства.
    Поиск аномалий в данных.
    Углубленный статистический анализ данных.
    Методы декомпозиции.
    Выводы на основе статистических данных.
    Оценка и улучшение качества модели (GridSearchCV, различные стратегии kfold).
    Объединение алгоритмов в цепочки и конвейеры (например Pipeline).
  5. Рекомендательные Системы
    Введение в рекомендательные системы.
    Типы рекомендательных систем.
    Рекомендации на основе содержания.
    Коллаборативная фильтрация.
    Рекомендации на основе скрытых факторов.
    Гибридные рекомендательные системы.
    Рекомендательные системы в production.
    Проверка качества рекомендаций.
  6. Обработка естественного языка. Natural Language Processing
    Введение в обработку естественного языка.
    Морфологический и синтаксический анализ языка.
    Виды языковых моделей.
    Векторная модель и методы снижения размерности. Информационный поиск.
    Представление языка для обучения моделей в задачах NLP.
    Языковые модели. Счетные языковые модели и вероятностные языковые модели.
    Извлечение информации. Именованные сущности, отношения, факты, события.
    Генерация текста.
    Сбор, обработка и хранение текстовой информации для задач Machine Learning.
  7. Основы глубокого обучения. Нейронные сети
    Понятия нейронной сети.
    Персептрон. Многослойная нейронная сеть.
    Функции активации. Функции потерь. Прямое и обратное распространение ошибки.
    Градиент. Стохастический градиентный спуск.
    Инициализация весов для нейронных сетей. Виды инициализаций.
    Применение фреймворка TensorFlow / Keras для построения и обучения нейронных сетей.
    Методы оптимизации нейронных сетей. Борьба с переобучением.
    Обзор ключевых архитектур для нейронных сетей:
    Цепи Маркова.
    Обзор внутренней структуры нейронной сети
  8. Работа с большими данными
    Хранение и обработка больших данных.
    Фреймворк Spark для работы с большими массивами данных.
    Хранение данных в облаке.
    Использование PySpark для обработки больших данных.
    Обзор фреймворка Dask для работы с большими данными.
  9. Машинное зрение в задачах машинного обучения
    Базовая теория машинного зрения.
    Форматы данных, обработка данных для задач машинного зрения.
    Обзор фреймворка OpenCV для работы с задачами машинного зрения. Введение в очистку изображений. Введение в работу с потоковым видео.
    Работа с изображением на GPU.
    Извлечение признаков из изображений, поиск по изображениям.
    Задача сегментации изображений в машинном зрении.
    Применение сверточных нейронных сетей для машинного зрения.
    Применение сверточных нейронных сетей для задач сегментации и распознавания.
    Генеративные конкурирующие сети (GAN).
    Получение, хранение и обработка изображений для задач машинного зрения.
  10. Временные ряды
    Базовая теория временных рядов.
    Элементарные алгоритмы обработки временных рядов.
    Модели Arima/SaRIMA/ Sarimax и Garch для прогнозирования временных рядов.
    Задача прогнозирования временных рядов на основе марковских моделей.
    Использование рекуррентных нейронных сетей в задачах прогнозирования временных рядов.
    Выявления аномалий во временных рядах.
    Проверка качества предсказаний в задачах прогнозирования временных рядов.
    Обзор готовых библиотек для прогнозирования временных рядов.
  11. Подготовка моделей для интеграции
    Введение в понятие Runtime.
    Фреймворк onnx как универсальный инструмент для конвертации моделей.
    Введение в понятие “оптимизация”. Квантование весов.
    Введение в tflite.
  12. Подведение итогов. Подход к реализации проектов в области Data Science
    Требования к DS проектам.
    Составление отчетов по исследованиям.
    Общение с заказчиком и представление результатов.
  13. Защита итогового проекта
    Защита итогового проекта

Трудоустройство выпускников

IT-Academy не только обучает, но и помогает слушателям, нацеленным на результат, найти работу. Выпускники курса «Основы Data Science» участвуют в «Программе трудоустройства», с помощью которой можно получить заветную должность практически в любой IT-компании!

Преподаватели курса

Николай Кухальский

Специальность:Data Science
Опыт работы:c 2015 года

Сфера интересов: Python, MathCad, Mathlab, Wolfram, Statistica, SPSS, Computer vision, OpenCv, Keras, Machine, Learning, Deep Learning, Nltk, NLP, Fasttext, CUDA, Pytorch, SciPy, NumPy, SkyKit, Xgboost, CatBoost.

Профессиональный путь: В 2005 году окончил Военную академию Республики Беларусь по специальности «Инженер по телекоммуникациям, радиоконтроль и противодействие». В 2008 году прошел адъюнктуру этой же академии. С 2008 года занимался научной и исследовательской работой в центре пограничных исследований ГУО «Институт пограничной службы Республики Беларусь». 

В 2010 году защитил диссертацию в УО «Военная академия Республики Беларусь» с присвоением ученой степени кандидат технических наук. 

С 2018 года член государственного экспертного совета «Безопасность человека, общества и государства» Государственного комитета по науке и технологиям Республики Беларусь.

С 2019 года доцент кафедры ГУО «Институт пограничной службы Республики Беларусь». В июне 2020 года присвоено ученое звание доцент по специальности «Радиотехника и связь». 

С августа 2020 года профессор кафедры ГУО «Институт пограничной службы Республики Беларусь». Профессиональная область: разработка, сопровождение, модернизации технических систем различного назначения. Анализ технологических процессов. Мною опубликовано более 20 научных работ, 5 учебных пособий.

С Июля 2021 года работаю в компании iTechArt в качестве Data scientist.

Особенности преподавания: Образовательный курс нацелен на приобретение слушателями знаний, умений и навыков, достаточных для самостоятельного улучшения различных процессов, протекающих в бизнес-среде, предприятиях и организациях, с дальнейшей возможностью выработки соответствующего решения или программного продукта, а также осуществления анализа технологических процессов и выработки необходимых рекомендаций.

Data Scientist – специалист по данным, занимающийся интеллектуальным анализом структурированных и неструктурированных данных. Использует статистику, машинное обучение и продвинутые методы предиктивной аналитики для решения ключевых бизнес-задач. Специалист по данным должен не только уметь анализировать полученную информацию, но и обладать отличными навыками программирования, уметь разрабатывать новые алгоритмы, обрабатывать большие объемы информации и иметь хорошее представление о той сфере, в которой он применяет свои знания. 

Применение методологии Data Science в программном продукте позволяет значительно повысить его качество и эффективность, что приводит к увеличению прибыли и сокращению затрат организации. Поэтому руководители предприятия или организации готовы платить немалые деньги тем, кто является специалистом Data Science и умеет воплощать ее методологию в жизнь. 

Для успешного освоения курса слушателям необходимо иметь знания высшей математики на уровне 1-2 курса технического или математического высшего учебного заведения, а также владеть начальными навыками программирования, преимущественно на языке Python.

   Рубрика ХоббIT

Марат Мовламов

Специальность:Data Science
Опыт работы:с 2016 года

Сфера интересов: Профессиональная область связана с аналитикой и машинным и глубоким обучением.

Среди языков программирования и фреймворков использую: Python, C++, Swift, TensorFLow, Keras, PyTorch, Numpy, Pandas, Sklearn, Scipy, Cuda, OpenCV, nltk, XGboost, CatBoost, PyCaret, Flask, Docker, Faiis, Facebook Prophet, Gluonts, plotly, bash, SQL, Dask, PySpark.

Профессиональный путь: Высшее образование получил в Беларусском Государственном Экономическом Университете по специальности "Аналитик".

С 2016 года занимаюсь решением проблем в области аналитики и Data Science. На данный момент работаю Senior Machine Learning Engineer в крупной видеостриминговой компании в сфере Entertainment в отделе Анализа данных.

Data Scientist - современная молодая профессия, в которой пересекаются такие направления как программирование, анализ данных и математика. По данным Glassdoor, потребность в Data Scientist будет расти из года в года в среднем на 25%. Всё больше компаний (особенно крупных) понимают, что надо принимать решения не только исходя из личного опыта, но и исходя из данных.

Специалист по данным должен не только уметь применять алгоритмы машинного обучения, но отлично переводить полученные решения с языка данных на язык бизнеса, должен отлично понимать математический аппарат для анализа данных, а также обладать отличными навыками программирования.

Особенности преподавания: Курс "Основы Data Science" представляет с собой интенсив, который нацелен на приобретение практических навыков для решения задач машинного и глубокого обучения, а также того теоретического багажа знаний, который послужит стимулом для дальнейшего углубления в тему Data Science.

В процессе обучения мы познакомимся с практической стороной применения Data Science, разберем реальные задачи на реальных данных, построим несколько полноценных решений для разных сфер (Бизнес, Обработка видео, текста и прогнозирование).

При выпуске студент будет обладать всеми необходимыми знаниями, чтобы успешно искать возможности для реализации в разных сферах бизнеса, где принятие решений основанно на данных.

Для того, чтобы освоить материал курса, слушателям необходимо иметь знания в сфере высшей математики, а также знать базовый синтаксис языка программирования Python.

Арсений Колосов

Опыт работы:с 2019 года

Сфера интересов: Data Science, Data Engineering, Data Analysis, Python, Algorithms.

Профессиональный путь: Окончил Школу Анализа Данных Яндекса, матфак ГрГУ и один курс магистратуры БГУ ФПМИ.

Профессиональная карьера:

  • Стажировка и работа в Azati (Data Science)

  • Работа в ITechArt (Data Science)

  • Преподаватель-семинарист в БГУИР, БГУ

Особенности преподавания: Обучение на практике. Необходимая теория. Подготовка к собеседованиям.



Отзывы на курс от выпускников Все отзывы

Вы откроете для себя целый новый мир

Это непростой курс, но от этого только интереснее. На занятиях дается много материала по разным темам и рассказывается о множестве технологий. Очень понравилось то, что теоретический материал сразу подкрепляется практикой.

Смотрите видеоотзыв выпускницы курса Data Science.

За наукой о данных будущее

Я выбрала этот курс, потому что уверена: за наукой о данных будущее. Курс составлен хорошо и полезен как новичкам в Data Science, так и тем, кто уже работает в отрасли. Приятно, что ты сама выбираешь, как тебе заниматься: онлайн или оффлайн. 

Хотелось бы отметить поддержку 24/7 нашего тренера Николая Кухальского. Ваша помощь бесценна. Всем рекомендую пройти курс, особенно у Николая Геннадьевича. Огромное спасибо IT-Academy за новых друзей и полезные знания.

Смотрите видеоотзыв выпускницы курса Data Science.

Программа обучения очень насыщенная

На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база. 

Курс сложный, но дал много новых и полезных знаний

Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science.

Это непростой курс, но от этого только интереснее. На занятиях дается много материала по разным темам и рассказывается о множестве технологий. Очень понравилось то, что теоретический материал сразу подкрепляется практикой. 

Хочу сказать огромное спасибо тренеру курса Николаю Геннадьевичу, благодаря которому эти шесть месяцев прошли максимально продуктивно в спокойной дружелюбной атмосфере. Он искренне болеет за каждого студента. Его девиз – лучше можно, хуже нельзя – еще долго будет мотивировать студентов.

Всем советую курс по Data Science в IT-Academy – это сложно и интересно. Вы точно не пожалеете и откроете для себя целый новый мир науки о данных.

Смотрите видеоотзыв выпускницы курса Data Science:

Я выбрала этот курс, потому что уверена: за наукой о данных будущее. Курс составлен хорошо и полезен как новичкам в Data Science, так и тем, кто уже работает в отрасли. Приятно, что ты сама выбираешь, как тебе заниматься: онлайн или оффлайн. 

Хотелось бы отметить поддержку 24/7 нашего тренера Николая Кухальского. Ваша помощь бесценна. Всем рекомендую пройти курс, особенно у Николая Геннадьевича. Огромное спасибо IT-Academy за новых друзей и полезные знания.

Смотрите видеоотзыв выпускницы курса Data Science:


На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база. 

А вот сама программа обучения – очень насыщенная, всё шло плотнячком, времени расслабляться не было. Но здесь нужно понимать, что Data Science – довольно широкая область и углубляться в ней можно бесконечно. На курсе мы получили основы, были интересные задания. Впечатления остались самые положительные.

Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science. Увидел это и решил: почему бы не попробовать? Входные тесты дались нормально, у меня математическое образование, с программированием тоже дружу, поэтому особых проблем не возникло. 

Курс в целом достаточно сложный, потребовал много усилий, но дал много новых и полезных знаний. В том числе и в программировании. Программа обучения полностью оправдала мои ожиданий. Теперь намерен искать работу в области Data Science и связать дальнейшую карьеру с этим направлением.

Более 6100 выпускников успешно работают в IT-компаниях в Беларуси и за рубежом

Акции и новости