Openbravo-rus.ru

Образование по русски
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Статистика и машинное обучение

Machine Learning и Традиционная Статистика: разные суть и подходы

“Machine Learning (МL)” и Традиционная Статистика (ТС) различаются как по своей сути, так и в подходах к данным. Так как в наши дни Data Science привлекает к себе всё больше и больше внимания общества, я бы хотел посвятить эту публикацию разъяснению различий между ML и ТС. Я нередко вижу, как статистики и практикующие машинное обучение спорят о том, что же такое “Data Science” и какие навыки нужны для работы с данными. На практике достаточно всего лишь следить за развитием обеих этих отраслей.

Из Википедии: Машинное обучение (англ. Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающая знания из данных.

Когда мы говорим об “Аналитике”, то мы, несомненно, включаем в это понятие как data mining/machine learning, так и традиционные статистические методы. Но не стоит забывать о том, что они различаются как в сферах применения, так и в общей философии.

Что такое МL?

МL — подвид Искусственного Интеллекта (ИИ). Основная задача ИИ — понимание и воспроизведение мыслительного процесса человека и его воспроизведение в нечеловеческой (машинной) среде. МL же нацелено на автоматическое обнаружение закономерностей в данных при помощи вычислительных алгоритмов и их дальнейшая структуризация в новые, но схожие данные. Т.е. основная задача — изучение и создание систем, которые способны делать выводы из данных с помощью обучения на примерах. МL — не то же самое, что “data mining” или “предсказательная аналитика”, но при этом является неотъемлемой частью их обоих.

Основные понятия МО начали формулироваться в 1950-х годах, а в конце 80-х — начале 90-х появлялись различные успешные стартапы по этой теме с самыми различными способами применений, как, например, реальновременное отслеживание случаев мошенничества, распознавание символов и рекомендательные сервисы (первое поколение систем МL). МL также тесно связано с “Теорией Распознавания Образов” (ТРО). Правда в то время, как МL создавалось преимущественно программистами и для программистов, ТРО имеет свои корни в инженерном деле. Но несмотря на это, они являются двумя сторонами одной и той же отрасли, чья задача — интеллектуальный анализ данных. Рост интереса к МL сегодня сигнализирует о начале следующей крупной волны инноваций.

Область применения МL
Data Mining и предсказательная аналитика
— Обнаружение случаев мошенничества, размещение рекламных объявлений, оценка заёмщиков, рекоммендации, создание лекарственных средств, торговля акциями, улучшение потребительского опыта, …
— Обработка текста и аналитика
— Интернет — поиск, фильтрация спама, анализ тональности, …
— Визуализация результатов
— Прочее: распознавание речи, человеческого генома, биоинформатика, оптическое распознавание символов (ОРС), распознавание лиц, самоуправляемые автомобили, анализ сцен, …

Сообщество/практики МL
— Как правило имеют техническое образование
— Более склонны к программированию
— Не ограничены использованием одного инструмента
— Одобряют open-source
— Быстро прототипизируют желаемые идеи/решения

МL против Традиционной Статистики

Исторически, методы и подходы практикующих МО сильно зависели от вычислительной мощности компьютеров. С другой стороны, методы ТС разрабатывались в условиях, в которых не было возможности полагаться на компьютеры. Как результат, ТС в основном оперирует малыми выборками и больших допущениях в вопросе данных и их распространения.

МL, как правило, старается уменьшить число изначальных допущений и более свободно в использовании различных методов и средств для решения поставленной задачи, часто прибегая к эвристике. Предпочитаемый метод обучения в МL — индуктивный. В своих крайних проявлениях, данных при индуктивном обучении доступно много, а прошлого опыта либо практически нет, либо его для успешного обучения не требуется. Другой спектр инструментов МL — аналитическое (или дедуктивное) обучение, где данных либо мало, либо предпочтительна работа с их малыми наборами. При этом также наличествует хорошее знание проблемы и ей сопутствующей информации. В реальном мире, МL обычно чередует использование обоих методов. Традиционная же статистика крайне консервативна в своих подходах к задаче и часто прибегает слишком большие допущения, особенно в вопросе распределения данных.

Таблица ниже иллюстрирует разницу в подходах и идеологии этих двух направлений:

Обучение может быть достигнуто путём написания программы, учитывающей все возможные комбинации данных. Этот процесс будет крайне ресурсоёмким и невозможным в выполнении применительно к реальным рабочим ситуациям. Такая программа также никогда не будет также хороша, как тщательно написанный и выверенный алгоритм обучения. Подобные алгоритмы автоматически учатся на примерах (как и люди), а затем обобщают данные на основе того, что они узнали (индуктивное обучение). Способность к обобщению и категоризации — ключевой показатель оценки производительности обучающейся платформы. Самые популярные алгоритмы обучения можно разделить на контролируемые и неконтролируемые, а затем каждую категорию разделить по возможностям и функциям (also called data mining functions):

Контролируемое обучение включает:

Классификация: Определение к какой категории принадлежит то или иное понятие (чаще всего используется двоичная классификация) — например, платёжеспособные ли покупатель.

Регрессия: Прогнозирование конкретного показателя на протяжении выбранного промежутка времени — например, сколько средств со своей кредитной карты покупатель потратит в следующем месяце при учёте всей прочей доступной информации.

Прогнозирование: Оценка макропеременных (суммарных) как, например, месячные продажи конкретного продукта.

Определение важности показателя: Распознаёт наиболее значимые в расчете прочей классификации или регрессии показатели.

Неконтролируемое обучение включает:

Кластеризация: Поиск уже существующих групп данных.

Ассоциативные модели: Анализ т.н. “потребительской корзины” (например, комбинации продуктов, которые часто приобретают вместе).

Теория статистического обучения

Статистики, как правило, скептично относятся к машинному обучению и до сих пор не все из них хотят признавать действенность этого метода. Причиной этому служит более свободный подход МL и меньшее сосредоточение на теоретических обоснованиях. Но и это сегодня не проблема, так как “Теория Статистического Обучения” помогла сузить пропасть между дисциплинами и дало им общие принципы для совместной работы. Основные принципы статистики также лежат в основе многих точных дисциплин, в чём они схожи с математикой. Но применение лишь традиционной статистики по своей сути отрицает прогресс теории анализа данных последних лет. МL и ТС — различаются, что первые и показали на практике. Для тех же, кого заинтересовала ТСО, советую ознакомиться с, лекцией от Yaser S. Abu-Mostafa в Cal Tech.

Читать еще:  Таблицы xl обучение

Прикладная статистика в машинном обучении

Содержание

О курсе

Курс читается для студентов 3-го курса ПМИ ФКН ВШЭ в 1-2 модулях.

Лектор: Артемов Алексей Валерьевич

Лекции проходят по субботам (9, 23 сентября, 7, 21 октября, 11, 25 ноября, 9, 16 декабря), 13:40 — 16:30, ауд. 509.

Полезные ссылки

Репозиторий с материалами на GitHub: TBD

Сдача домашних заданий через систему AnyTask: http://anytask.org , в профиле вводите инвайт, соотвествующей вашей группе и курс появится в списке ваших курсов.

Семинары

Дата выдачи/сдачи дз

  • Задание #1 25/09 — 08/10 (см. AnyTask)
  • Задание #2 09/10 — 23/10 (см. AnyTask)
  • Задание #3 13/11 — 27/11 (см. AnyTask, по 6 баллов за задачу, максимальный балл 18)

Система оценок

Результирующая оценка по дисциплине рассчитывается по формуле

Накопленная оценка рассчитывается по формуле

Накопленная и итоговая оценки округляются арифметически.

  1. За каждую выполенную задачу в задании студент получает соответствующее число баллов, максимум указан в тексте задания. Они суммируются и получается общее число баллов за конкретное домашнее задание.
  2. Рассчитывается взвешенное средние из баллов за все домашние задания. Веса пропорциональны числу баллов за задания.
  3. Полученный результат отобржается в [0;10] делением

Бонус: при верном решении всех задач в домашнем задании, студент получает два бонусных балла. Бонусные баллы можно будет конвертировать как плюс-баллы на экзамене. Бонусные баллы суммируются.

  • Оценка за коллоквиум — это (приведенная в [0; 10]) оценка за первую контрольную работу, проведенную 11.11.2017
  • Оценка за самостоятельную работу — это (приведенная в [0; 10]) оценка за вторую контрольную работу, проведенную 19.12.2017

Студенту, получившему отличную накопленную оценку, данная оценка может быть выставлена в качестве итоговой при условии, что им набрано не менее 2 бонусных баллов.

Коллоквиум

Коллоквиум в письменной форме будет проведен в субботу 11.11.2017 в аудитории 509 четвертой парой 15.10-16.30 и будет включать темы:

  • Основные задачи и методы теории статистических выводов;
  • Параметрическое оценивание;
  • Проверка гипотез.

Программа курса

1. Введение. Основные задачи и методы теории статистических выводов (1 лекция, 1 семинар) (проведена 09.09.2017)

Параметрические и непараметрические модели. Основные задачи: точечное оценивание, доверительные множества, тестирование гипотез, исследование зависимостей. Эмпирическая функция распределения. Статистические функционалы.

2. Параметрическое оценивание (2 лекции, 2 семинара) (первая часть проведена 09.09.2017)

Метод моментов. Метод максимального правдоподобия и его свойства. Дельта-метод. Случай векторного параметра. Параметрический бутстреп. Доверительное оценивание. Достаточная статистика. Экспоненциальное семейство распределений. EM-алгоритм.

3. Бутстреп (1 лекция, 1 семинар)

Моделирование Монте-Карло, бутстреп. Оценка дисперсии на основе бутстрепа. Оценка доверительных интервалов на основе бутстрепа. Метод складного ножа.

4. Проверка гипотез (2 лекции, 2 семинара)

Основные понятия теории проверки гипотез. Критерий Вальда. P-значение. Распределение хи-квадрат и критерий Пирсона. Критерий перестановок. Критерий на основе отношения правдоподобия. Множественные тесты. Критерий согласия. Критерий Неймана-Пирсона для случая двух простых гипотез, t-критерий.

5. Линейная и логистическая регрессия (2 лекции, 2 семинара)

Стандартная линейная регрессия. Метод оценивания на основе минимизации невязок/максимизации правдоподобия. Свойства оценок метода наименьших квадратов. Прогнозирование. Множественная регрессия. Выбор модели. AIC, BIC. Логистическая регрессия.

6. Непараметрическое оценивание сигналов (1 лекция, 1 семинар) (проведена 21.10.2017)

Выбор оптимального соотношения между смещением и дисперсией. Гистограммы. Ядерная оценка плотности. Непараметрическая регрессия.

7. Нелинейные методы построения регрессионных зависимостей (1 лекция, 1 семинар) (проведена 11.11.2017)

Аддитивные модели. Аппроксимационные модели на основе параметрических словарей (сигмоидальные функции, гауссоподобные функции, и т.д.). Построение аппроксимационных моделей на основе параметрических словарей: методы инициализации структуры; методы оценки параметров, учитывающие структуру модели; методы адаптивной регуляризации в процесс оценки параметров модели.

8. Регрессионные модели на основе гауссовских процессов (1 лекция, 1 семинар) (проведена 25.11.2017)

Гауссовские процессы. Прогноз и оценка точности прогноза на основе гауссовских процессов. Оценка параметров ковариационной функции. Регуляризация логарифма правдоподобия. Модель нестационарной ковариационной функции. Регрессия на основе гауссовских процессов как ядерная гребневая регрессия. Глобальная оптимизация на основе гауссовских процессов. Планирование экспериментов на основе гауссовских процессов.

9. Оценка чувствительности модели (1 лекция, 1 семинар)

Введение, начальные условия, области применения. Постановка задачи оценки глобальной чувствительности модели. Обзор методов оценки чувствительности модели в случае выборки данных. Обзор методов оценки чувствительности модели в случае черного ящика. Выделение параметров, которые сильнее всего влияют на уровень радиоактивных изотопов в воде (Level E test case). Обзор теоретических основ метода оценки чувствительности модели на основе индексов Соболя.

10. Методы планирования экспериментов (Design of Experiments) (1 лекция, 1 семинар) (проведена 16.12.2017)

Space-filling DoE. Планирование экспериментов для линейных регрессионных моделей.

11. Снижение размерности многомерных данных (1 лекция, 1 семинар)

Снижение размерности в суррогатном моделировании. Постановка задачи снижения размерности. Обзор линейных методов снижения размерности (метод главных компонент, целенаправленное проектирование и т.п.). Обзор локальных и нелинейных методов снижения размерности (метод нелинейных главных компонент, метод локального линейного вложения и т.п.). Новые постановки задач снижения размерности. Аппроксимация многомерных зависимостей как решение задачи снижения размерности.

Чем отличаются наука о данных, анализ данных и машинное обучение

Перевод статьи Клеофаса Мулонго «Difference Between Data Science, Analytics And Machine Learning».

Наука о данных, машинное обучение и анализ данных это три главные сферы деятельности, получившие в последние годы огромную популярность. Для профессионалов в этих областях настал их звездный час. Спрос на них на рынке труда высок. Предсказывают, что к 2020 году в этих сферах деятельности будет много открытых вакансий.

Так что же означают эти названия? Чем отличаются эти сферы деятельности? Чтобы ответить на эти и другие вопросы, мы сравнили науку о данных, машинное обучение и анализ данных.

Наука о данных

Что такое наука о данных?

Хотя этот предмет имеет множество определений, мы воспользуемся самым распространенным, которое будет понятно всем. Наука о данных это концепция, которая используется для работы с большими данными. Эта концепция включает аспекты подготовки данных, очистки данных и анализа данных.

В нормальных обстоятельствах человек, занимающийся наукой о данных, собирает данные из различных источников и применяет различные техники для того чтобы извлечь из этих наборов данных осмысленную информацию. Среди часто используемых при этом методов можно назвать предикативную аналитику, анализ настроений и даже машинное обучение.

Читать еще:  Обучающая программа по английскому языку

Люди, занимающиеся наукой о данных, рассматривают эти данные с точки зрения бизнеса. Они стараются делать прогнозы максимально точно, поскольку на их основе могут приниматься решения.

Навыки, необходимые, чтобы заниматься наукой о данных

Вы хотите быть профессиональным data scientist? Есть несколько ключевых областей специализации, на которых вам нужно будет сфокусироваться. Это программирование, аналитика и предметная область (узкоспециальные знания).

Вам нужно будет приобрести следующие знания и навыки:

  • Практический опыт в программировании на Python.
  • Хорошие знания программирования баз данных SQL.
  • Способность работать с неструктурированными данными из различных источников, например, социальных медиа-платформ.
  • Знание машинного обучения.
  • Понимание аналитических функций.

Машинное обучение

Начнем с главного. Что такое машинное обучение?

Машинное обучение можно описать как процесс использования алгоритмов для тщательного исследования данных и извлечения из них осмысленной информации. Машинное обучение также может использовать заданные наборы данных для предсказания будущих тенденций. Годами программное обеспечение для машинного обучения использует статистический и предикативный анализ для определения шаблонов и выявления в них скрытых, но имеющих значение знаний.

Прекрасным примером реализации машинного обучения в жизни является алгоритм Facebook. Этот алгоритм создан для изучения вашего поведения в этой социальной сети. Полученные знания он затем использует для формирования вашей ленты. Amazon изучит ваше поведение в браузере, чтобы рекомендовать вам продукты, которые вы, вероятно, захотите купить. То же самое касается Netflix. Он будет рекомендовать вам фильмы, исходя из ваших привычек браузинга.

Что нужно, чтобы стать экспертом в машинном обучении?

Если рассматривать строго, то машинное обучение можно считать ответвлением как информатики, так и статистики. Если вы планируете остановить свой выбор на этой карьере, вам следует:

  • Приобрести опыт работы с компьютерными системами.
  • Овладеть практическими навыками программирования.
  • Разбираться в вероятностях и статистике.
  • Изучить моделирование данных.

Чем отличаются наука о данных и машинное обучение?

Наука о данных это широкое поле деятельности, которое включает в себя многие дисциплины. Машинное обучение подпадает под понятие науки о данных, ведь оно применяет несколько техник, обычно используемых в этой сфере.

А вот наука о данных может быть производной машинного обучения, а может и не быть. Она включает в себя много дисциплин, в отличие от машинного обучения, которое концентрируется на одном предмете.

Анализ данных

Анализ данных, чтобы прийти к какому-то выводу, влечет за собой появление описательной статистики и визуализации данных. Он очень связан со статистикой. Аналитик должен уметь работать с числами. В большинстве случаев анализ данных рассматривается как базовая версия науки о данных.

Если вы занимаетесь анализом данных, вы должны хорошо уметь объяснять разнообразные причины, почему данные именно такие, какие есть. Вы должны уметь представлять данные таким образом, чтобы они были понятны каждому, а не только экспертам.

Какие навыки нужны, чтобы работать в сфере анализа данных?

Вы должны хорошо разбираться в следующих областях знаний:

Как видите, все три сферы деятельности тесно связаны друг с другом. Однако между ними существуют различия, о которых мы вам и рассказали в нашей статье. Надеемся, теперь вы сможете лучше различать науку о данных, машинное обучение и анализ данных.

Статистика и машинное обучение: в чем отличие? — Блог SkillFactory

Историческая справка

Одной из составляющих науки о данных является машинное обучение (МО) — молодая отрасль Data Science, основные понятия которой были сформулированы во второй половине 20 века. Цель МО — спрогнозировать результат по входным данным и частично или полностью автоматизировать решение сложной задачи в различных сферах деятельности человека. Его суть — выявлять некие закономерности в массивах данных, чтобы затем применять их к новым объектам.

Итак, машинное обучение — группа методов искусственного интеллекта, которые отличаются не прямым решением задач, а обучением в процессе обработки решений новых, но схожих задач.

Начало статистической практики относят ещё к временам до нашей эры, а рождение термина «статистика» — к 18 веку. Статистика (С) — наука, которая занимается общими вопросами сбора, измерения и анализа данных. Она берёт свои корни в инженерном деле, тогда как МО развивалось программистами. Методы машинного обучения с самого начала сильно зависели от вычислительной мощности компьютеров. Статистика же наоборот, в силу исторических особенностей, опиралась на вычислительные способности человека, поэтому в ней использовались маленькие выборки и большие допущения в отношении данных и их распространения.

Типы машинного обучения

Существует два типа обучения: индуктивное (по прецедентам) и дедуктивное. Некоторые методы индуктивного обучения были разработаны в качестве альтернативы классическим статистическим подходам. Индуктивное обучение основано на выявлении эмпирических закономерностей, дедуктивное — на формализации знаний экспертов и их использовании в качестве базы знаний. Первый тип характеризуется большим количеством данных и отсутствием или ненадобностью прошлого опыта. Второй тип обучения отличается малым массивом данных или выбором в пользу малых наборов данных, а также глубокими знаниями изучаемого вопроса. МО применяет оба этих метода, чередуя их в своем анализе. Статистика же ограничивается в своих подходах, оставаясь крайне консервативной.

Инструменты и применение МО

Для создания методов МО использует математическую статистику, методы оптимизации, численные методы, теорию вероятностей, графов и др.

Машинное обучение используется в биржевом анализе, распознавании речи и жестов, обнаружении мошенничества и спама, медицинской диагностике, системе кредитного скоринга и т. д. Например, банки используют кредитный скоринг (систему оценки заёмщика), основанный на статистических методах. Баллы выставляются по результатам заполненной анкеты, разработанной оценщиками кредитных рисков, а система, в свою очередь, принимает решение: одобрить кредит или отказать в нём.

Таким образом, основная задача МО — изучить и создать системы, способные выводить закономерности из данных. В нашем случае закономерность — погасит заёмщик кредит или не погасит — строится на основе полученных и проанализированных данных: возраст, стаж работы, уровень дохода, имеющиеся кредиты и др.

Читайте также

Итоги

В обсуждаемых нами двух дисциплинах есть общие элементы, инструменты и даже объект, но у них разные корни и свои особенности и цели. Обе анализируют данные, но МО «учится» на всех типах данных, тогда как С анализирует и классифицирует данные. Статистика консервативна в подходах и отдаёт предпочтение традиционным методам анализа, в отличие от МО, открытого для новых подходов. Также МО нередко прибегает к эвристическим методам в поисках лучшего решения, что абсолютно не свойственно традиционной статистике, остающейся при решении задач в заданных рамках. МО поощряет изобилие информации: чем больше входных данных, тем точнее будет результат. Статистика же, напротив, поддерживает анализ меньших объёмов данных.

Читать еще:  Программа обучения предпринимателей

Статистики осторожно относятся к машинному обучению и порой не признают его методы, ссылаясь на свободу МО в выборе подходов в изучении данных. Однако машинное обучение приобретает все большую популярность, находясь на стыке нескольких дисциплин и решая сложные задачи в условиях непрекращающегося роста количества данных.

Интерес к машинному обучению и желание применять его методы на практике можно утолить здесь:

Курс по математике для Data Science за 8 недель даст необходимую базу по математике и статистике, чтобы вы могли освоить машинное обучение.

Практический курс по машинному обучению с менторской поддержкой научит решать бизнес-задачи методами машинного обучения. С его помощью вы сможете начать карьеру Data Scientist или углубить свои знания в области Data Science. Стартуем 30 апреля!

Профессия Data Scientist: машинное обучение

Вы научитесь создавать аналитические системы и использовать алгоритмы машинного обучения, освоите работу с нейросетями. Наполните портфолио и получите престижную профессию.

Записаться на курс

  • Длительность 13 месяцев
  • Помощь в трудоустройстве
  • 7 курсов в одной программе
  • Доступ к курсу навсегда

На рынке не хватает специалистов по Data Science

  • 2 300 компаний сейчас ищут специалистов в Data Science & Machine Learning
  • 80 000 рублей зарплата начинающего специалиста

Данные сайта hh.ru

Кому подойдёт этот курс

Новичкам в IT

Вы получите базовые навыки по аналитике, статистике и математике, которые откроют путь к карьере в Data Science и Machine Learning.

Программистам

Вы прокачаете свои знания и навыки в программировании на Python. Научитесь использовать алгоритмы машинного обучения, решать бизнес-задачи — и усилите портфолио мощными проектами.

Менеджерам и владельцам бизнеса

Научитесь использовать данные для построения прогнозов и оптимизации бизнес-процессов и переведёте компанию на новый уровень.

Чему вы научитесь

Программировать на Python

Визуализировать данные

Работать с библиотеками и базами данных

Применять нейронные сети для решения реальных задач

Строить модели машинного обучения

Писать рекомендательные системы

От первого урока к работе мечты

Студенты и выпускники Skillbox получают индивидуальную поддержку от Центра карьеры на протяжении всего обучения — от помощи с выбором профессии до выхода на работу мечты. Вот как это происходит.

С каждым уроком ваш профессиональный уровень растёт и вы можете планировать карьеру уже во время обучения.

Реакция потенциального работодателя зависит от того, как вы подаёте себя в резюме. Мы дадим советы по его составлению и поможем написать резюме, подающее вас лучшим образом.

Выбираете лучшую вакансию

Мы экономим ваше время — подбираем подходящие вакансии и договариваемся об интервью с работодателем. Вам нужно только пройти собеседование.

Начинаете карьеру мечты

Вы успешно проходите собеседование, выходите на работу и сразу начинаете выполнять задачи.

Записаться на курс или получить бесплатную консультацию

Похоже произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

Ваша заявка успешно отправлена

Как проходит обучение

Изучаете тему

В курсе — практические видеоуроки.

Выполняете задания

В том темпе, в котором вам удобно.

Работаете с наставником

Закрепляете знания и исправляете ошибки.

Защищаете дипломную работу

И дополняете ею своё портфолио.

Программа

Вас ждут 7 курсов с разным уровнем сложности, знание которых можно приравнять к году работы.

  1. Аналитика. Начальный уровень
  1. Введение.
  2. Основы Python: базовые структуры данных.
  3. Основы Python: циклы и условия.
  4. Основы Python: функции.
  5. Основы Python: классы и объекты.
  6. Основы Python: исключения.
  7. Библиотека NumPy. Часть 1.
  8. Библиотека NumPy. Часть 2.
  9. Библиотека pandas. Часть 1.
  10. Библиотека pandas. Часть 2.
  11. Визуализация данных с помощью matplotlib.
  12. Чтение и запись данных.
  13. Введение в SQL.
  14. Работа со строками.
  1. Основы статистики и теории вероятностей.
  1. Основные концепции Machine Learning (ML).
  2. Жизненный цикл ML-проекта.
  3. Регрессия.
  4. Классификация.
  5. Кластеризация
  6. Дополнительные техники.
  7. Знакомство с Kaggle.
  1. Базовые математические объекты и SymPy. Дроби и преобразования.
  2. Базовые математические объекты и SymPy. Необходимые функции и некоторые дополнительные объекты.
  3. Функции одной переменной, их свойства и графики.
  4. Интерполяция и полиномы.
  5. Аппроксимация и преобразования функций.
  6. Функции нескольких переменных, их свойства и графики.
  7. Линейные функции.
  8. Матрицы и координаты.
  9. Линейные уравнения.
  10. Производная функции одной переменной.
  11. Производная по направлению и градиент + частные производные.
  12. Линейная регрессия.
  13. Собственные векторы и значения. Определитель.
  14. Разложения матриц.
  1. Введение в нейронные сети.
  2. Обучение нейронных сетей.
  3. Нейронные сети на практике.
  4. Свёрточные нейросети для задачи классификации изображений.
  5. Семантическая сегментация. Часть 1. Слабая локализация и полносвёрточные нейросети (FCN).
  6. Семантическая сегментация. Часть 2. Продвинутые архитектуры FCN для семантической сегментации.
  7. Детектирование объектов.
  8. От дискриминативных моделей к генеративным. Style transfer.
  9. Генеративные состязательные сети.
  10. Введение в NLP.
  11. NLP на нейросетях. Рекуррентные нейросети, классификация текстов.
  12. NLP на нейросетях. Языковые модели, Attention, Transformer.
  13. Обучение с подкреплением. Q-Learning.
  14. Обучение с подкреплением. Deep Q-Learning.
  15. Ускорение и оптимизация нейронных сетей.
  16. Внедрение в DL моделей в Production.
  17. Рекомендательные системы.
  18. Вывод моделей машинного обучения в production, post production и мониторинг.
  1. Как стать первоклассным программистом.
  2. Как искать заказы на разработку.
  3. Личный бренд разработчика.
  4. Photoshop для программиста.
  5. Вёрстка email-рассылок. Советы на реальных примерах.
  6. The state of soft skills.
  7. Как мы создавали карту развития для разработчиков.
  8. Как общаться по email и эффективно работать с почтой.
  9. Повышение своей эффективности.
  10. Спор о первом языке программирования.
  11. Саморазвитие: как я не усидел на двух стульях и нашёл третий.
  12. Data-driven подход к продуктивности — инсайты из данных миллиона людей.
  1. IT Resume and CV.
  2. Job interview: questions and answers.
  3. Teamwork.
  4. Workplace communication.
  5. Business letter.
  6. Software development.
  7. System concept development and SRS.
  8. Design.
  9. Development and Testing.
  10. Deployment and Maintenance.

Уже учились на каком-то курсе из программы?

Скажите об этом менеджеру — за этот курс платить не придётся!

Получить полную программу курса и консультацию

Похоже произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

Ссылка на основную публикацию
Adblock
detector