Интересуетесь работой с данными и хотите получить престижную профессию? Курс по основам Data Science в Гродно поможет получить все необходимые навыки и умения.
Вы поймёте науку о данных, научитесь анализировать информацию, находить зависимости, приобретете знания в областях Data Mining, Big Data, Machine Learning. Это позволит претендовать на должность Data Scientist в IT-компании. Средняя зарплата у данных специалистов на белорусском рынке труда – свыше 2400 долларов.
Зачисление на курс производится на конкурсной основе по результатам:
выполнения тестового задания от тренера на знание основ математики и языка программирования Python;
теста по английскому языку.
Для кого этот курс
для разработчиков, желающих расширить свои компетенции;
для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;
для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;
для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.
базовые знания математики: пределы, дифференциальное и интегральное исчисление.
Для чего этот курс
Курс предназначен для:
приобретения знаний в областях Machine Learning/Data Science/Big Data;
формирования устойчивых навыков и умений по постановке и решению задач с использованием математической статистики и современных информационных технологий;
приобретения навыков для решения бизнес задач при помощи технологий глубокого обучения и нейронных сетей;
приобретения умений интерпретировать данные на язык бизнеса и доносить инсайты до бизнес пользователей.
Вы будете уметь
осуществлять сбор, очистку и исследование исходных данных;
находить инсайты и зависимости в структурированных и неструктурированных данных;
доносить ключевые идеи с языка данных на язык бизнеса;
графически интерпретировать данные;
осуществлять постановку и решение задач машинного обучения согласно современному стандарту CRISP-DM;
применять основные алгоритмы машинного обучения и математического программирования;
пользоваться основными инструментами и фреймворками для решения задач в области Data Science;
разбираться в современных архитектурах нейронных сетей и применять их на практике для решения задач;
решать задачи Computer Vision / Natural Language Processing / Time Series;
применять концепции и инструменты при работе с большими объемами данных;
Обзор Data Science и Machine Learning.
Инструменты для работы:
• Что изучим в процессе курса.
• Python / Anaconda / Jupyter Notebook - установка, быстрый экскурс по языку (синтаксис, типы данных и конструкции, функции, GIL и ООП).
• Знакомства с менеджерами пакетов (pip, conda). Введение в понятия репозитория. Введение в понятия сборки пакета.
• Работа с инструментами контроля версий Git.
Numpy - введение в библиотеку. Линейная алгебра / Статистика.
Pandas - введение в библиотеку. Получение и обработка данных.
• Чтение данных.
• Обработка данных.
• Сохранение данных для последующей работы.
Базовый эксплоративный анализ и визуализация данных.
• Базовые статистики.
• Распределение данных.
• Базовая визуализация данных.
Методология работы в области DS - CRISP- DM.
Понятия линейной алгебры. Пределы, производные, интегрирование, матрицы.
Понятия математической статистики и теории вероятностей.
Тензоры и операции над тензорами.
Реализация математических вычислений в Python.
Формулировка и проверка гипотез: теория и практика.
Визуализация данных в Python.
Классы решаемых задач в машинном обучении.
Обзор и классификация алгоритмов в машинном обучении.
Supervised Learning / обучение с учителем:
• Линейная регрессия.
• Нелинейная регрессия.
• Логистическая регрессия.
• Метод опорных векторов.
• Деревья решений.
• Метод опорных векторов.
Feature Engineering и углубленная обработка данных.
Переобучение моделей. Регуляризация.
Бустинг. Градиентный бустинг и ансамбли моделей.
Проверка качества моделей. Метрики качества для алгоритмов регрессии и метрики качества для алгоритмов классификации.
Библиотека XGboost / CatBoost.
Автоматический поиск алгоритмов.
Unsupervised Learning / Обучение без учителя:
• Метод k-ближайших соседей и EM алгоритм.
• Кластеризация. Иерархическая кластеризация. DBSCAN.
• Affinity Propagation.
• Задача декомпозиции. Алгоритмы SVD / ALS / PCA / T-SNE / NMF.
• Алгоритмы понижения размерности.
• Алгоритм SVM (Support Vector Machine).
Углубленный Feature Engineering.
Проблемы качества и размерности данных.
Методы уменьшения размерности данных.
Спрямляющие пространства.
Поиск аномалий в данных.
Углубленный статистический анализ данных.
Методы декомпозиции.
Выводы на основе статистических данных.
Оценка и улучшение качества модели (GridSearchCV, различные стратегии kfold).
Объединение алгоритмов в цепочки и конвейеры (например Pipeline).
Введение в рекомендательные системы.
Типы рекомендательных систем.
Рекомендации на основе содержания.
Коллаборативная фильтрация.
Рекомендации на основе скрытых факторов.
Гибридные рекомендательные системы.
Рекомендательные системы в production.
Проверка качества рекомендаций.
Введение в обработку естественного языка.
Морфологический и синтаксический анализ языка.
Виды языковых моделей.
Векторная модель и методы снижения размерности. Информационный поиск.
Представление языка для обучения моделей в задачах NLP.
Языковые модели. Счетные языковые модели и вероятностные языковые модели.
Извлечение информации. Именованные сущности, отношения, факты, события.
Генерация текста.
Сбор, обработка и хранение текстовой информации для задач Machine Learning.
Понятия нейронной сети.
Персептрон. Многослойная нейронная сеть.
Функции активации. Функции потерь. Прямое и обратное распространение ошибки.
Градиент. Стохастический градиентный спуск.
Инициализация весов для нейронных сетей. Виды инициализаций.
Применение фреймворка TensorFlow / Keras для построения и обучения нейронных сетей.
Методы оптимизации нейронных сетей. Борьба с переобучением.
Обзор ключевых архитектур для нейронных сетей:
Цепи Маркова.
Обзор внутренней структуры нейронной сети
Хранение и обработка больших данных.
Фреймворк Spark для работы с большими массивами данных.
Хранение данных в облаке.
Использование PySpark для обработки больших данных.
Обзор фреймворка Dask для работы с большими данными.
Базовая теория машинного зрения.
Форматы данных, обработка данных для задач машинного зрения.
Обзор фреймворка OpenCV для работы с задачами машинного зрения. Введение в очистку изображений. Введение в работу с потоковым видео.
Работа с изображением на GPU.
Извлечение признаков из изображений, поиск по изображениям.
Задача сегментации изображений в машинном зрении.
Применение сверточных нейронных сетей для машинного зрения.
Применение сверточных нейронных сетей для задач сегментации и распознавания.
Генеративные конкурирующие сети (GAN).
Получение, хранение и обработка изображений для задач машинного зрения.
Базовая теория временных рядов.
Элементарные алгоритмы обработки временных рядов.
Модели Arima/SaRIMA/ Sarimax и Garch для прогнозирования временных рядов.
Задача прогнозирования временных рядов на основе марковских моделей.
Использование рекуррентных нейронных сетей в задачах прогнозирования временных рядов.
Выявления аномалий во временных рядах.
Проверка качества предсказаний в задачах прогнозирования временных рядов.
Обзор готовых библиотек для прогнозирования временных рядов.
Введение в понятие Runtime.
Фреймворк onnx как универсальный инструмент для конвертации моделей.
Введение в понятие “оптимизация”. Квантование весов.
Введение в tflite.
IT-Academy не только обучает, но и помогает слушателям, нацеленным на результат, найти работу. Выпускники курса «Основы Data Science» участвуют в «Программе трудоустройства», с помощью которой можно получить заветную должность практически в любой IT-компании!
Профессиональный путь: В 2005 году окончил Военную академию Республики Беларусь по специальности «Инженер по телекоммуникациям, радиоконтроль и противодействие». В 2008 году прошел адъюнктуру этой же академии. С 2008 года занимался научной и исследовательской работой в центре пограничных исследований ГУО «Институт пограничной службы Республики Беларусь».
В 2010 году защитил диссертацию в УО «Военная академия Республики Беларусь» с присвоением ученой степени кандидат технических наук.
С 2018 года член государственного экспертного совета «Безопасность человека, общества и государства» Государственного комитета по науке и технологиям Республики Беларусь.
С 2019 года доцент кафедры ГУО «Институт пограничной службы Республики Беларусь». В июне 2020 года присвоено ученое звание доцент по специальности «Радиотехника и связь».
С августа 2020 года профессор кафедры ГУО «Институт пограничной службы Республики Беларусь». Профессиональная область: разработка, сопровождение, модернизации технических систем различного назначения. Анализ технологических процессов. Мною опубликовано более 20 научных работ, 5 учебных пособий.
С Июля 2021 года работаю в компании iTechArt в качестве Data scientist.
Особенности преподавания: Образовательный курс нацелен на приобретение слушателями знаний, умений и навыков, достаточных для самостоятельного улучшения различных процессов, протекающих в бизнес-среде, предприятиях и организациях, с дальнейшей возможностью выработки соответствующего решения или программного продукта, а также осуществления анализа технологических процессов и выработки необходимых рекомендаций.
Data Scientist – специалист по данным, занимающийся интеллектуальным анализом структурированных и неструктурированных данных. Использует статистику, машинное обучение и продвинутые методы предиктивной аналитики для решения ключевых бизнес-задач. Специалист по данным должен не только уметь анализировать полученную информацию, но и обладать отличными навыками программирования, уметь разрабатывать новые алгоритмы, обрабатывать большие объемы информации и иметь хорошее представление о той сфере, в которой он применяет свои знания.
Применение методологии Data Science в программном продукте позволяет значительно повысить его качество и эффективность, что приводит к увеличению прибыли и сокращению затрат организации. Поэтому руководители предприятия или организации готовы платить немалые деньги тем, кто является специалистом Data Science и умеет воплощать ее методологию в жизнь.
Для успешного освоения курса слушателям необходимо иметь знания высшей математики на уровне 1-2 курса технического или математического высшего учебного заведения, а также владеть начальными навыками программирования, преимущественно на языке Python.
Профессиональный путь: Высшее образование получил в Беларусском Государственном Экономическом Университете по специальности "Аналитик".
С 2016 года занимаюсь решением проблем в области аналитики и Data Science. На данный момент работаю Senior Machine Learning Engineer в крупной видеостриминговой компании в сфере Entertainment в отделе Анализа данных.
Data Scientist - современная молодая профессия, в которой пересекаются такие направления как программирование, анализ данных и математика. По данным Glassdoor, потребность в Data Scientist будет расти из года в года в среднем на 25%. Всё больше компаний (особенно крупных) понимают, что надо принимать решения не только исходя из личного опыта, но и исходя из данных.
Специалист по данным должен не только уметь применять алгоритмы машинного обучения, но отлично переводить полученные решения с языка данных на язык бизнеса, должен отлично понимать математический аппарат для анализа данных, а также обладать отличными навыками программирования.
Особенности преподавания: Курс "Основы Data Science" представляет с собой интенсив, который нацелен на приобретение практических навыков для решения задач машинного и глубокого обучения, а также того теоретического багажа знаний, который послужит стимулом для дальнейшего углубления в тему Data Science.
В процессе обучения мы познакомимся с практической стороной применения Data Science, разберем реальные задачи на реальных данных, построим несколько полноценных решений для разных сфер (Бизнес, Обработка видео, текста и прогнозирование).
При выпуске студент будет обладать всеми необходимыми знаниями, чтобы успешно искать возможности для реализации в разных сферах бизнеса, где принятие решений основанно на данных.
Для того, чтобы освоить материал курса, слушателям необходимо иметь знания в сфере высшей математики, а также знать базовый синтаксис языка программирования Python.
Это непростой курс, но от этого только интереснее. На занятиях дается много материала по разным темам и рассказывается о множестве технологий. Очень понравилось то, что теоретический материал сразу подкрепляется практикой.
Смотрите видеоотзыв выпускницы курса Data Science.
Я выбрала этот курс, потому что уверена: за наукой о данных будущее. Курс составлен хорошо и полезен как новичкам в Data Science, так и тем, кто уже работает в отрасли. Приятно, что ты сама выбираешь, как тебе заниматься: онлайн или оффлайн.
Хотелось бы отметить поддержку 24/7 нашего тренера Николая Кухальского. Ваша помощь бесценна. Всем рекомендую пройти курс, особенно у Николая Геннадьевича. Огромное спасибо IT-Academy за новых друзей и полезные знания.
Смотрите видеоотзыв выпускницы курса Data Science.
На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база.
Курс сложный, но дал много новых и полезных знаний
Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science.
Это непростой курс, но от этого только интереснее. На занятиях дается много материала по разным темам и рассказывается о множестве технологий. Очень понравилось то, что теоретический материал сразу подкрепляется практикой.
Хочу сказать огромное спасибо тренеру курса Николаю Геннадьевичу, благодаря которому эти шесть месяцев прошли максимально продуктивно в спокойной дружелюбной атмосфере. Он искренне болеет за каждого студента. Его девиз – лучше можно, хуже нельзя – еще долго будет мотивировать студентов.
Всем советую курс по Data Science в IT-Academy – это сложно и интересно. Вы точно не пожалеете и откроете для себя целый новый мир науки о данных.
Смотрите видеоотзыв выпускницы курса Data Science:
Я выбрала этот курс, потому что уверена: за наукой о данных будущее. Курс составлен хорошо и полезен как новичкам в Data Science, так и тем, кто уже работает в отрасли. Приятно, что ты сама выбираешь, как тебе заниматься: онлайн или оффлайн.
Хотелось бы отметить поддержку 24/7 нашего тренера Николая Кухальского. Ваша помощь бесценна. Всем рекомендую пройти курс, особенно у Николая Геннадьевича. Огромное спасибо IT-Academy за новых друзей и полезные знания.
Смотрите видеоотзыв выпускницы курса Data Science:
На курс по Data Science записался, поскольку начал интересоваться этой областью. До этого изучил язык программирования Python и думал, как можно его применить. Собственно, это и привело меня в IT-Academy. Прошёл отбор. Входные задания мне показались интересными, но не очень сложными. Наверное, потому что уже была база.
А вот сама программа обучения – очень насыщенная, всё шло плотнячком, времени расслабляться не было. Но здесь нужно понимать, что Data Science – довольно широкая область и углубляться в ней можно бесконечно. На курсе мы получили основы, были интересные задания. Впечатления остались самые положительные.
Пришёл на курс с целью сменить сферу деятельности, связать свою карьеру с машинным обучением и Data Science. Образовательный центр ПВТ предлагает основательную программу обучения по Data Science. Увидел это и решил: почему бы не попробовать? Входные тесты дались нормально, у меня математическое образование, с программированием тоже дружу, поэтому особых проблем не возникло.
Курс в целом достаточно сложный, потребовал много усилий, но дал много новых и полезных знаний. В том числе и в программировании. Программа обучения полностью оправдала мои ожиданий. Теперь намерен искать работу в области Data Science и связать дальнейшую карьеру с этим направлением.
Более 6100 выпускников успешно работают в IT-компаниях в Беларуси и за рубежом
ООО «Образовательный центр программирования и высоких технологий» стремится открыто и в понятной форме сообщать своим пользователям о том, как собираются и используются их данные. Наша организация осознает значимость для Вас того, каким образом ваша информация обрабатывается и используется в режиме коллективного доступа, и мы ценим Вашу уверенность в том, что мы будем делать это тщательно и разумно. Мы полагаем, что для Вас, как для пользователя, важно знать реализуемый нами порядок обращения с информацией о Вас, получаемой нами в ходе посещений Вами нашего сайта. Политика конфиденциальности предназначена для того, чтобы способствовать формированию у Вас понимания того, каким образом мы осуществляем сбор, раскрытие и обеспечение безопасности, получаемой нами в ходе посещения и просмотра Вами нашего веб-сайта. Продолжая использовать данный сайт и нажимая на кнопку «Согласен», Вы подтверждаете, что ознакомились с
Политикой использования файлов cookie и согласны на обработку Ваших персональных данных в соответствии с
Политикой в отношении обработки персональных данных.