Openbravo-rus.ru

Образование по русски
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Машинное обучение лекции воронцов

нБЫЙООПЕ ПВХЮЕОЙЕ Й БОБМЙЪ ДБООЩИ

чОЙНБОЙЕ! ьФБ УФТБОЙГБ ПВОПЧМСФШУС ВПМШЫЕ ОЕ ВХДЕФ. фЕРЕТШ ПВОПЧМЕОЙС ЛХТУБ ВХДХФ ЧЩЛМБДЩЧБФШУС ОБ MachineLearning.ru

ч ЛХТУЕ ТБУУНБФТЙЧБАФУС ТБЪМЙЮОЩЕ ЪБДБЮЙ НБЫЙООПЗП ПВХЮЕОЙС (machine learning), Ч ФПН ЮЙУМЕ ЪБДБЮЙ ЛМБУУЙЖЙЛБГЙЙ, ЛМБУФЕТЙЪБГЙЙ, ТЕЗТЕУУЙЙ Й РТПЗОПЪЙТПЧБОЙС. йЪХЮБАФУС ТБЪМЙЮОЩЕ НЕФПДЩ ТЕЫЕОЙС ЬФЙИ ЪБДБЮ.

ъБДБЮБ ПВХЮЕОЙС РП РТЕГЕДЕОФБН

йНЕЕФУС НОПЦЕУФЧП ПВЯЕЛФПЧ, ЛБЦДПНХ ЙЪ ЛПФПТЩИ РПУФБЧМЕО Ч УППФЧЕФУФЧЙЕ ОЕЛПФПТЩК ПФЧЕФ. ьФП УППФЧЕФУФЧЙЕ ЙЪЧЕУФОП ФПМШЛП ОБ ЛПОЕЮОПК ЧЩВПТЛЕ РТЕГЕДЕОФПЧ — РБТ ЧЙДБ «ПВЯЕЛФ–ПФЧЕФ». рП ЬФЙН ДБООЩН ОЕПВИПДЙНП ЧПУУФБОПЧЙФШ ЪБЧЙУЙНПУФШ, ФП ЕУФШ РПУФТПЙФШ БМЗПТЙФН, ЛПФПТЩК ДМС МАВПЗП ПВЯЕЛФБ ЧЩДБЧБМ ВЩ ОЕЛПФПТЩК ПФЧЕФ, Й РТЙ ЬФПН ПЫЙВБМУС ВЩ ЛБЛ НПЦОП ТЕЦЕ.

рТЙНЕТЩ

ч ЪБДБЮБИ НЕДЙГЙОУЛПК ДЙБЗОПУФЙЛЙ ПВЯЕЛФБНЙ СЧМСАФУС РБГЙЕОФЩ, ПФЧЕФБНЙ — ДЙБЗОПЪЩ ЙМЙ ТЕЫЕОЙС П ГЕМЕУППВТБЪОПУФЙ ФПЗП ЙМЙ ЙОПЗП ЧЙДБ МЕЮЕОЙС.
ч ЪБДБЮБИ ЛТЕДЙФОПЗП УЛПТЙОЗБ (credit scoring) ПВЯЕЛФБНЙ СЧМСАФУС ЪБЕНЭЙЛЙ (ФПЮОЕЕ, БОЛЕФЩ, ЪБРПМОЕООЩЕ РТЙ РПДБЮЕ ЪБСЧЛЙ ОБ ЧЩДБЮХ ЛТЕДЙФБ), ПФЧЕФБНЙ — ТЕЫЕОЙС ЧЩДБФШ ЙМЙ ОЕ ЧЩДБФШ ЛТЕДЙФ.
ч ЪБДБЮБИ РТЕДУЛБЪБОЙС ХИПДБ ЛМЙЕОФПЧ (churn prediction) ПВЯЕЛФБНЙ СЧМСАФУС РТПФПЛПМЩ ЧУЕИ ДЕКУФЧЙК (РМБФЕЦЕК, ФТБОЪБЛГЙК, УНЕО ФБТЙЖОПЗП РМБОБ, Й Ф.Д.) ЛМЙЕОФБ, ПФЧЕФБНЙ — ПГЕОЛЙ ЧЕТПСФОПУФЙ ФПЗП, ЮФП ЛМЙЕОФ ПФЛБЦЕФУС ПФ ХУМХЗ ЛПНРБОЙЙ Ч ФЕЮЕОЙЕ ВМЙЦБКЫЕЗП ЧТЕНЕОЙ (ОБРТЙНЕТ, НЕУСГБ).
ч ЪБДБЮБИ РТПЗОПЪЙТПЧБОЙС РТПДБЦ (sales forecast) ПВЯЕЛФБНЙ СЧМСАФУС ЧТЕНЕООЩЕ ТСДЩ ПВЯЕНПЧ РТПДБЦ ФПЧБТПЧ Ч НБЗБЪЙОБИ; ПФЧЕФБНЙ — РТПЗОПЪЩ ПВЯЕНПЧ РПФТЕВЙФЕМШУЛПЗП УРТПУБ.
нПЦОП РТЙЧПДЙФШ ЕЭЕ ДЕУСФЛЙ Й УПФОЙ РТЙНЕТПЧ РТЙМПЦЕОЙК, Ч ЛПФПТЩИ ПВХЮЕОЙЕ РП РТЕГЕДЕОФБН РПЪЧПМСЕФ БЧФПНБФЙЪЙТПЧБФШ ТЕЫЕОЙЕ ДПУФБФПЮОП УМПЦОЩИ РТПЖЕУУЙПОБМШОЩИ РТПВМЕН. уНПФТЙФЕ ЧЧПДОХА МЕЛГЙА.

рЕТЧЩК УЕНЕУФТ:

чФПТПК УЕНЕУФТ:

лХТУ ОБИПДЙФУС Ч УФБДЙЙ ТБЪТБВПФЛЙ. рПЦБМХКУФБ, ОЕ УФЕУОСКФЕУШ УППВЭБФШ П ОБКДЕООЩИ ПЫЙВЛБИ, ЧЩУЛБЪЩЧБФШ ЪБНЕЮБОЙС Й РТЕДМПЦЕОЙС.

дТХЗЙЕ ЛХТУЩ РП НБЫЙООПНХ ПВХЮЕОЙА Й УНЕЦОЩН ФЕНБН

нЕУФЕГЛЙК м. н. нБФЕНБФЙЮЕУЛЙЕ НЕФПДЩ ТБУРПЪОБЧБОЙС ПВТБЪПЧ. чнЙл нзх, ЛБЖЕДТБ ннр — 2002.
www.ccas.ru/frc/papers/mestetskii04course.pdf.

нЕТЛПЧ б. в. пУОПЧОЩЕ НЕФПДЩ, РТЙНЕОСЕНЩЕ ДМС ТБУРПЪОБЧБОЙС ТХЛПРЙУОПЗП ФЕЛУФБ. мБВПТБФПТЙС ТБУРПЪОБЧБОЙС ПВТБЪПЧ нгонп. — 2004.
http://www.recognition.mccme.ru/pub/RecognitionLab.html/methods.html.

мЙЖЫЙГ а. уПЧТЕНЕООЩЕ ЪБДБЮЙ ФЕПТЕФЙЮЕУЛПК ЙОЖПТНБФЙЛЙ. йфнп. — 2005.
http://teormin.ifmo.ru/education/modern.

оЕЛПФПТЩЕ ОБРТБЧМЕОЙС ОБХЮОЩИ ЙУУМЕДПЧБОЙК

чОЙНБОЙЕ! вПМЕЕ УЧЕЦБС ЧЕТУЙС ЬФПЗП ФЕЛУФБ ОБИПДЙФУС ЪДЕУШ: MachineLearning.ru

рТПВМЕНБ ПВПВЭБАЭЕК УРПУПВОПУФЙ СЧМСЕФУС ЛМАЮЕЧПК Й Ч ФП ЦЕ ЧТЕНС ОБЙВПМЕЕ УМПЦОПК Ч НБЫЙООПН ПВХЮЕОЙЙ. еУМЙ БМЗПТЙФН ПВХЮЕО РП ЛПОЕЮОПК ЧЩВПТЛЕ РТЕГЕДЕОФПЧ, ФП ЛБЛ РТЕДУЛБЪБФШ ЛБЮЕУФЧП ЕЗП ТБВПФЩ ОБ ОПЧЩИ ПВЯЕЛФБИ? рПЮЕНХ ЬФП ЧППВЭЕ ЧПЪНПЦОП? лБЛ ОБДП ПВХЮБФШ БМЗПТЙФН, ЮФПВЩ ПО ТЕДЛП ПЫЙВБМУС ОБ ОПЧЩИ ДБООЩИ?

бЛФЙЧОПЕ ЙУУМЕДПЧБОЙЕ ЬФЙИ ЧПРТПУПЧ ОБЮБМПУШ Ч ЛПОГЕ 60-И, ЛПЗДБ ч.о.чБРОЙЛ Й б.с.юЕТЧПОЕОЛЙУ РТЕДМПЦЙМЙ УФБФЙУФЙЮЕУЛХА ФЕПТЙА ЧПУУФБОПЧМЕОЙС ЪБЧЙУЙНПУФЕК РП ЬНРЙТЙЮЕУЛЙН ДБООЩН. пОЙ РПМХЮЙМЙ ЧЕТИОЙЕ ПГЕОЛЙ ЧЕТПСФОПУФЙ ПЫЙВПЛ ПВХЮЕООПЗП БМЗПТЙФНБ, РПЪЧПМЙЧЫЙЕ ПВПУОПЧБФШ ДБЧОП ЪБНЕЮЕООЩК ЬНРЙТЙЮЕУЛЙК ЖБЛФ: РП НЕТЕ ХЧЕМЙЮЕОЙС УМПЦОПУФЙ ЙУРПМШЪХЕНПЗП УЕНЕКУФЧБ БМЗПТЙФНПЧ ЛБЮЕУФЧП ПВХЮЕОЙС УОБЮБМБ ХМХЮЫБЕФУС, ЪБФЕН ОБЮЙОБЕФ ХИХДЫБФШУС. хИХДЫЕОЙЕ УЧСЪБОП У ЬЖЖЕЛФПН РЕТЕПВХЮЕОЙС: ЮТЕЪНЕТОП УМПЦОЩЕ БМЗПТЙФНЩ ЙНЕАФ ЙЪВЩФПЮОПЕ ЮЙУМП УЧПВПДОЩИ РБТБНЕФТПЧ; РТЙ ПВХЮЕОЙЙ ЬФЙИ РБТБНЕФТПЧ РП ЧЩВПТЛЕ БМЗПТЙФН ОБУФТБЙЧБЕФУС ОЕ ФПМШЛП ОБ ЧПУУФБОПЧМЕОЙЕ ЪБЧЙУЙНПУФЙ, ОП Й ОБ ЧПУРТПЙЪЧЕДЕОЙЕ ТБЪОПЗП ТПДБ РПЗТЕЫОПУФЕК. рПЗТЕЫОПУФЙ Ч ТЕБМШОЩИ ЪБДБЮБИ ЧУЕЗДБ РТЙУХФУФЧХАФ: ЧП-РЕТЧЩИ, ЬФП ПЫЙВЛЙ ЙЪНЕТЕОЙС (ЫХН), ЧП-ЧФПТЩИ, ЮФП ЗПТБЪДП УХЭЕУФЧЕООЕЕ, ЬФП ОЕЧСЪЛБ НЕЦДХ ЙУРПМШЪХЕНПК НПДЕМША Й ОЕЙЪЧЕУФОПК ЙУФЙООПК ЪБЧЙУЙНПУФША. ч ФЕПТЙЙ чБРОЙЛБ-юЕТЧПОЕОЛЙУБ ТБЪТБВПФБО НЕФПД УФТХЛФХТОПК НЙОЙНЙЪБГЙЙ ТЙУЛБ (унт), РПЪЧПМСАЭЙК БЧФПНБФЙЮЕУЛЙ ОБИПДЙФШ НПДЕМШ ПРФЙНБМШОПК УМПЦОПУФЙ.

л УПЦБМЕОЙА, УФБФЙУФЙЮЕУЛЙЕ ПГЕОЛЙ ЮТЕЪЧЩЮБКОП УЙМШОП ЪБЧЩЫЕОЩ. ч НЕФПДЕ унт ЬФП ЮБУФП ЧМЕЮЕФ РЕТЕХРТПЭЕОЙЕ НПДЕМЙ. оЕУНПФТС ОБ 40-МЕФОЙЕ ХУЙМЙС НОПЗЙИ ХЮЕОЩИ, ФПЮОЩЕ ПГЕОЛЙ ЛБЮЕУФЧБ ПВХЮЕОЙС ДП УЙИ РПТ ОЕ РПМХЮЕОЩ.

пУОПЧОЩЕ ОБРТБЧМЕОЙС ЙУУМЕДПЧБОЙК:
— ЛПНВЙОБФПТОБС ФЕПТЙС ПВПВЭБАЭЕК УРПУПВОПУФЙ;
— ХФПЮОЕОЙЕ ПГЕОПЛ ПВПВЭБАЭЕК УРПУПВОПУФЙ ДМС ТБЪМЙЮОЩИ ЮБУФОЩИ УМХЮБЕЧ;
— ТБЪТБВПФЛБ ОПЧЩИ БМЗПТЙФНПЧ ПВХЮЕОЙС ОБ ЙИ ПУОПЧЕ.

лМАЮЕЧЩЕ УМПЧБ:
generalization ability, computational learning theory, Vapnik-Chervonenkis theory.

лПНВЙОБФПТОБС УФБФЙУФЙЛБ. ьФП ОБРТБЧМЕОЙЕ МПЗЙЮОП ЧЩФЕЛБЕФ ЙЪ РТЕДЩДХЭЕЗП Й СЧМСЕФУС ЕЗП ПВПВЭЕОЙЕН. пЛБЪЩЧБЕФУС, НОПЗЙЕ ЖХОДБНЕОФБМШОЩЕ ЖБЛФЩ ФЕПТЙЙ ЧЕТПСФОПУФЕК Й НБФЕНБФЙЮЕУЛПК УФБФЙУФЙЛЙ НПЦОП РЕТЕЖПТНХМЙТПЧБФШ Й ДПЛБЪБФШ, ОЕ ПРЙТБСУШ ОБ ЛПМНПЗПТПЧУЛХА БЛУЙПНБФЙЛХ, ФП ЕУФШ ОЕ ЙУРПМШЪХС ФЕПТЙА НЕТЩ, Й ДБЦЕ ОЕ ХРПФТЕВМСС УБНП РПОСФЙЕ ЧЕТПСФОПУФЙ. ч ЪБДБЮБИ БОБМЙЪБ ДБООЩИ НЩ ЧУЕЗДБ ЙНЕЕН ДЕМП У ЧЩВПТЛБНЙ ЛПОЕЮОПК ДМЙОЩ. рПЬФПНХ ЕУФЕУФЧЕООП УФБЧЙФШ ЧПРТПУ ОЕ «ЛБЛПЧБ ЧЕТПСФОПУФШ УПВЩФЙС?», Б «ЛБЛПК НПЦЕФ ВЩФШ ЮБУФПФБ ЬФПЗП УПВЩФЙС ОБ УЛТЩФЩИ (РПЛБ ЕЭЕ ОЕ ЙЪЧЕУФОЩИ) ДБООЩИ?». пФЧЕФЩ ОБ ЬФЙ ДЧБ ЧПРТПУБ, ЧППВЭЕ ЗПЧПТС, ТБЪМЙЮОЩ, РТЙЮЕН ОБ ЧЩВПТЛБИ НБМПК ДМЙОЩ ТБЪМЙЮЙЕ УХЭЕУФЧЕООП. чЕТПСФОПУФШ УПВЩФЙС — БВУФТБЛФОБС ЙДЕБМЙЪЙТПЧБООБС ЧЕМЙЮЙОБ. юБУФПФБ УПВЩФЙС — ЬФП ЛБЛ ТБЪ ФП, ЮФП ТЕБМШОП ЙЪНЕТСЕФУС Ч ЬЛУРЕТЙНЕОФЕ. йНЕООП ЕЕ Й ЙНЕЕФ УНЩУМ РТЕДУЛБЪЩЧБФШ.

ч ЮБУФПФОПК РПУФБОПЧЛЕ ХДБЕФУС РЕТЕЖПТНХМЙТПЧБФШ ЪБЛПО ВПМШЫЙИ ЮЙУЕМ, ЪБЛПО УИПДЙНПУФЙ ЬНРЙТЙЮЕУЛЙИ ТБУРТЕДЕМЕОЙК (ЛТЙФЕТЙК уНЙТОПЧБ), НОПЗЙЕ УФБФЙЮЕУЛЙЕ ЛТЙФЕТЙЙ, Ч РЕТЧХА ПЮЕТЕДШ, ТБОЗПЧЩЕ ЛТЙФЕТЙЙ, ФЕПТЙА ПВПВЭБАЭЕК УРПУПВОПУФЙ, ФЕПТЙА ЙОЖПТНБГЙЙ. чП НОПЗЙИ УМХЮБСИ РПМХЮБЕНЩЕ ПГЕОЛЙ СЧМСАФУС ФПЮОЩНЙ, Ф.Е. ОЕ БУЙНРФПФЙЮЕУЛЙНЙ Й ОЕ ЪБЧЩЫЕООЩНЙ. пДОБЛП ДМС ЙИ ЧЩЮЙУМЕОЙС НПЦЕФ РПФТЕВПЧБФШУС ТБЪТБВПФЛБ УРЕГЙБМШОЩИ ЬЖЖЕЛФЙЧОЩИ БМЗПТЙФНПЧ.

пУОПЧОЩЕ ОБРТБЧМЕОЙС ЙУУМЕДПЧБОЙК:
— ЧЩСУОЕОЙЕ ЗТБОЙГ РТЙНЕОЙНПУФЙ УМБВПК ЧЕТПСФОПУФОПК БЛУЙПНБФЙЛЙ;
— ФПЮОЩЕ (ЛПНВЙОБФПТОЩЕ) УФБФЙУФЙЮЕУЛЙЕ ЛТЙФЕТЙЙ;
— ЬЖЖЕЛФЙЧОЩЕ БМЗПТЙФНЩ ЧЩЮЙУМЕОЙС ЛПНВЙОБФПТОЩИ ПГЕОПЛ.

нЕФПДЩ ПВХЮЕОЙС БМЗПТЙФНЙЮЕУЛЙИ ЛПНРПЪЙГЙК РТЙНЕОСАФУС Ч УМПЦОЩИ ЪБДБЮБИ, ЛПЗДБ ЙНЕАЭЙЕУС (ВБЪПЧЩЕ) БМЗПТЙФНЩ ОЕ ДБАФ ЦЕМБЕНПЗП ЛБЮЕУФЧБ ПВХЮЕОЙС. ч ФБЛЙИ УМХЮБСИ УФТПСФ ЛПНРПЪЙГЙЙ БМЗПТЙФНПЧ, УФБТБСУШ, ЮФПВЩ ПЫЙВЛЙ ТБЪМЙЮОЩИ БМЗПТЙФНПЧ УЛПНРЕОУЙТПЧБМЙ ДТХЗ ДТХЗБ.

уБНЩК РТПУФПК РТЙНЕТ ЛПНРПЪЙГЙЙ — ХУТЕДОЕОЙЕ ПФЧЕФПЧ, ЧЩДБЧБЕНЩИ ВБЪПЧЩНЙ БМЗПТЙФНБНЙ. нПЦОП ХУТЕДОСФШ У ЧЕУБНЙ. нПЦОП ЧЩДЕМСФШ ПВМБУФЙ ЛПНРЕФЕОФОПУФЙ ТБЪМЙЮОЩИ БМЗПТЙФНПЧ, Й Ч ЛБЦДПК ПВМБУФЙ ЙУРПМШЪПЧБФШ УЧПЕ ТБУРТЕДЕМЕОЙЕ ЧЕУПЧ. нПЦОП УФТПЙФШ ЛПНРПЪЙГЙЙ БМЗПТЙФНПЧ У РПНПЭША ОЕМЙОЕКОЩИ ПРЕТБГЙК. лБЛПК ЙЪ ЬФЙИ НЕФПДПЧ МХЮЫЕ? ч ЛБЛЙИ ЪБДБЮБИ? лБЛ ПВХЮБФШ ВБЪПЧЩЕ БМЗПТЙФНЩ, ХЮЙФЩЧБС, ЮФП ПОЙ ВХДХФ ТБВПФБФШ ОЕ РП-ПФДЕМШОПУФЙ, Б Ч УПУФБЧЕ ЛПНРПЪЙГЙЙ? нПЦОП МЙ РТЙУРПУПВЙФШ ДМС ЬФПЗП УФБОДБТФОЩЕ НЕФПДЩ ПВХЮЕОЙС? лБЛ ПГЕОЙЧБФШ Й ГЕМЕОБРТБЧМЕООП ХМХЮЫБФШ ПВПВЭБАЭХА УРПУПВОПУФШ ЛПНРПЪЙГЙЙ? лБЛ РТЙ ЬФПН УДЕМБФШ ЮЙУМП БМЗПТЙФНПЧ Ч ЛПНРПЪЙГЙЙ РПНЕОШЫЕ?

йДЕС БМЗПТЙФНЙЮЕУЛЙИ ЛПНРПЪЙГЙК ВЩМБ ЧЩДЧЙОХФБ Ч УЕТЕДЙОЕ 70-И ЗПДПЧ Ч ТБВПФБИ БЛБДЕНЙЛБ тбо а.й.цХТБЧМЕЧБ. ч ЪБТХВЕЦОЩИ ЙУУМЕДПЧБОЙСИ ЬФП ФЕНБ УФБМБ ЮТЕЪЧЩЮБКОП РПРХМСТОПК Ч 90-Е ЗПДЩ, РПУМЕ ЙЪПВТЕФЕОЙС БМЗПТЙФНПЧ ВХУФЙОЗБ, УНЕУЕК ЬЛУРЕТФПЧ Й ДТХЗЙИ ЛПНРПЪЙФОЩИ ЛПОУФТХЛГЙК.

Читать еще:  Обучение по работе с эксель

пУОПЧОЩЕ ОБРТБЧМЕОЙС ЙУУМЕДПЧБОЙК:
— ТБЪТБВПФЛБ ЬЖЖЕЛФЙЧОЩИ БМЗПТЙФНПЧ РПУФТПЕОЙС ЛПНРПЪЙГЙК;
— РПЧЩЫЕОЙЕ ПВПВЭБАЭЕК УРПУПВОПУФЙ ЛПНРПЪЙГЙК;
— УТБЧОЙФЕМШОЩК БОБМЙЪ ТБЪМЙЮОЩИ НЕФПДПЧ РПУФТПЕОЙС ЛПНРПЪЙГЙК.

лМАЮЕЧЩЕ УМПЧБ:
multiple classifier systems, ensemble learning, classifier fusion, mixture of experts.

бОБМЙЪ ЛМЙЕОФУЛЙИ УТЕД (блу) СЧМСЕФУС ПФОПУЙФЕМШОП ОПЧПК Й ВЩУФТП ТБЪЧЙЧБАЭЕКУС ПВМБУФША ЙОФЕММЕЛФХБМШОПЗП БОБМЙЪБ ДБООЩИ (data mining). ч УПЧТЕНЕООПН ВЙЪОЕУЕ ЮТЕЪЧЩЮБКОП ЧПУФТЕВПЧБОП ТЕЫЕОЙЕ УМЕДХАЭЕК ЪБДБЮЙ, ФПЮОЕЕ ДБЦЕ ЗТХРРЩ ЪБДБЮ.

йНЕЕФУС ОЕЛПФПТЩК ОБВПТ ТЕУХТУПЧ (ФПЧБТПЧ, ХУМХЗ, РТЕДНЕФПЧ) ЛПФПТЩНЙ РПМШЪХЕФУС ПЗТПНОПЕ ЛПМЙЮЕУФЧП ЛМЙЕОФПЧ. чУЕ ДЕКУФЧЙС РПМШЪПЧБФЕМЕК РТПФПЛПМЙТХАФУС Ч ЬМЕЛФТПООПН ЧЙДЕ. ьФЙ ДБООЩЕ УПДЕТЦБФ ГЕООЕКЫХА ЙОЖПТНБГЙА, ОЕПВИПДЙНХА ДМС РПЧЩЫЕОЙС ЛБЮЕУФЧБ ПЛБЪЩЧБЕНЩИ ХУМХЗ, ПДОБЛП ЙЪЧМЕЮШ ЕЕ ОЕ ФБЛ РТПУФП ЧЧЙДХ ПЗТПНОПЗП ПВЯЕНБ ДБООЩИ. лБЛЙЕ ТЕУХТУЩ ОБЙВПМЕЕ РПРХМСТОЩ, Й УТЕДЙ ЛБЛЙИ ЗТХРР ЛМЙЕОФПЧ? чПЪНПЦОП МЙ ХЗБДБФШ ЙОФЕТЕУЩ ЛМЙЕОФБ Й УЖПТНЙТПЧБФШ ДМС ОЕЗП РЕТУПОБМШОПЕ РТЕДМПЦЕОЙЕ, ПФ ЛПФПТПЗП ПО У ЧЩУПЛПК ЧЕТПСФОПУФША ОЕ ПФЛБЦЕФУС? лБЛ ЧЩСЧЙФШ ЛМЙЕОФПЧ, УПВЙТБАЭЙИУС Ч ВМЙЦБКЫЕЕ ЧТЕНС ПФЛБЪБФШУС ПФ ПВУМХЦЙЧБОЙС? ьФЙ Й ДТХЗЙЕ ЪБДБЮЙ ТЕЫБАФУС Ч УЙУФЕНБИ ХРТБЧМЕОЙС ЧЪБЙНППФОПЫЕОЙСНЙ У ЛМЙЕОФБНЙ (client relationship management, CRM). уПЪДБОЙЕ НБФЕНБФЙЮЕУЛПЗП ПВЕУРЕЮЕОЙС ДМС ОЙИ СЧМСЕФУС БЛФХБМШОПК, ОБХЛПЕНЛПК ЪБДБЮЕК.

пДЙО ЙЪ ФЙРЙЮОЩИ РТЙНЕТПЧ ЛМЙЕОФУЛПК УТЕДЩ — ЙОФЕТОЕФ-РПТФБМ, РТЕДПУФБЧМСАЭЙК ДПУФХР Л ВПМШЫПНХ ЛПМЙЮЕУФЧХ ТЕУХТУПЧ, УЛБЦЕН, ЙОФЕТОЕФ-НБЗБЪЙО ЙМЙ РПЙУЛПЧЩК УЕТЧЕТ. фЕИОПМПЗЙС блу РПЪЧПМСЕФ ТЕЫБФШ ЪБДБЮЙ РЕТУПОБМЙЪБГЙЙ ЛПОФЕОФБ — ЛПЗДБ ТЕЪХМШФБФЩ РПЙУЛБ, ЙОЖПТНБГЙПООЩЕ ЛБФБМПЗЙ, РТЕДМПЦЕОЙС ФПЧБТПЧ Й ХУМХЗ, Й Ф.Д. ЧЩУФТБЙЧБАФУС Ч ФБЛПН РПТСДЛЕ, ЮФПВЩ РПМШЪПЧБФЕМШ ВЕЪ ФТХДБ ОБИПДЙМ ЙОЖПТНБГЙА, ОЕПВИПДЙНХА ЙНЕООП ЕНХ, ЙНЕООП Ч ДБООЩК НПНЕОФ.

пУОПЧОЩЕ ОБРТБЧМЕОЙС ЙУУМЕДПЧБОЙК:
— ЛПММБВПТБФЙЧОБС ЖЙМШФТБГЙС;
— ТБЪТБВПФЛБ ЬЖЖЕЛФЙЧОЩИ БМЗПТЙФНПЧ блу;
— ТЕЫЕОЙЕ ЪБДБЮ РЕТУПОБМЙЪБГЙЙ ЛПОФЕОФБ;
— Й ДТХЗЙИ РТЙЛМБДОЩИ ЪБДБЮ.

лМАЮЕЧЩЕ УМПЧБ:
collaborative filtering, web usage mining, personalization, client relationship management.

16 бесплатных онлайн-курсов по машинному обучению

Популярная тенденция в сфере онлайн-образования — массовые открытые онлайн-курсы (Massive open online-courses, MOOC). Появились бесплатные курсы по машинному обучению и data science. Они доступны каждому и основаны на образовательных программах от ведущих университетов, например, МФТИ.

Большинство MOOC по машинному обучению доступны на английском языке и представлены на известных платформах онлайн-образования, таких как Coursera, Udacity, World Education University и edX.

Отдельно стоит отметить, что курсы Coursera доступны бесплатно только для прослушивания лекций. Для того, чтобы выполнять задания или получить сертификат по окончании курса, нужно оформить подписку или оплатить курс.

Видео-материалы и лекции курса можно получить бесплатно, для этого на странице курса внизу нужно нажать кнопку «прослушать курс», как показано на картинке:

Как бесплатно прослушать курсы по машинному обучению

В этой статье собраны бесплатные курсы по машинному обучению и Data Science на русском языке или с русскими субтитрами.

Введение в машинное обучение

Авторы: ВШЭ и Яндекс
Платформа: Coursera
Язык: русский

На курсе Константина Воронцова Введение в машинное обучение рассматриваются популярные задачи, решаемые с помощью машинного обучения — классификация, регрессия, кластеризация. Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах, желательно иметь базовые навыки программирования и быть знакомым с python.

Продолжительность: 35 часов

Машинное обучение и анализ данных

Авторы: МФТИ и Яндекс
Платформа: Coursera
Язык: русский

Специализация Машинное обучение и анализ данных включает 6 курсов. Осваиваются основные инструменты, необходимые в работе с большим массивом данных: современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, фундаментальная математика, основы программирования на python.

Продолжительность: 8 месяцев (7 часов в неделю)

Python для анализа данных

Авторы: МФТИ, ФРОО, Mail.ru Group
Платформа: Coursera
Язык: русский

Курс Python для анализа данных ориентирован на решение практических задач. Студенты будут применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями.

Продолжительность: 25 часов

Введение в науку о данных

Автор: СПбГУ
Платформа: Coursera
Язык: русский

Курс Введение в науку о данных рассматривает постановку и решение типичных задач, с которыми может столкнуться в своей работе data scientist, подходы к сбору, анализу, обработке и визуализации массивов данных.

Продолжительность: 17 часов

Глубокое обучение в творчестве с TensorFlow

Автор: Google Magenta
Платформа: Kadenze
Язык: английский, русские субтитры

MOOC Использование глубокого обучения в творчестве с помощью TensorFlow расскажет о том, как строить алгоритмы глубокого обучения на основе сверточных, рекуррентных, генеративных нейросетей и применять их для создания творческих приложений.

Продолжительность: 60 часов

Data Science

Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры

В специализацию Data Science университета John Hopkins входят 10 курсов, включая сбор и сортировку данных, программирование на языке R, регрессионные модели, разработку продуктов для обработки данных и другие.

Продолжительность: 8 месяцев (5 часов в неделю)

Data science для руководителей

Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры

Data Science для руководителей — это ускоренная обучающая программа — 5 курсов, которые дают базовое понимание о том, что такое data science и как работать с проектами в этой сфере, собирать и развивать команду и даже лидерские качества.

Продолжительность: 40 часов

Нейронные сети

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

Бесплатный курс Нейронные сети дает основы теории нейронных сетей и практики применения. Детальный разбор процесса создания и применения нейронных сетей. Алгоритмы, лежащие в основе нейросетей и множество практических задач.

Продолжительность: 33 часа

Программирование на Python

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

На курсе Программирование на Python представлены базовые понятия программирования на python и большое количество практических задач. Решения будут проверяться автоматической системой.

Продолжительность: 22 часа

Алгоритмы: теория и практика. Методы

Автор: Computer Science Center
Платформа: Stepic
Язык: русский

Рассматриваются теоретические основы создания алгоритмов и особенности реализации на языках C++, Java и Python.

Продолжительность: 35 часов

Основы программирования на R

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

На курсе Основы программирования на R изучаются основные типы данных и семантические правила, анализ и обработка данных.

Продолжительность: 19 часов

Анализ данных в R

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

Читать еще:  Smm с чего начать обучение

На курсе рассматриваются этапы статистического анализа на R — предварительная обработка данных, применение статистических методов анализа и визуализация данных.

Продолжительность: 21 час

Базы данных

Автор: СПбГУ
Платформа: Coursera
Язык: русский

В основе курса Базы данных изучение и применение языка SQL для создания, модификации объектов и управления данными в реляционных базах данных. Рассматриваются сферы применения NoSQL баз данных и современные подходы к обработке big data.

Продолжительность: 20 часов

От Excel до MySQL: способы анализа бизнес-данных

Автор: Duke University
Платформа: Coursera
Язык: английский, русские субтитры

В специализацию входят 5 курсов, которые демонстрируют, как использовать Excel, Tableau и MySQL для анализа данных, прогнозирования, создания моделей и визуализации данных для решения задач и улучшения бизнес-процессов.

Продолжительность: 8 месяцев (5 часов в неделю)

Линейная регрессия

Автор: СПбГУ
Платформа: Coursera
Язык: русский

В курсе Линейная регрессия разбираются основные методы описания взаимосвязей между количественными признаками, регрессионный анализ и построение моделей. Специальное место отводится операциям с матрицами. Курс ориентирован на людей, которые уже знакомы с базовыми понятиями анализа данных.

Продолжительность: 22 часа

Анализ данных

Автор: НГУ
Платформа: Coursera
Язык: русский

В специализацию Анализ данных Новосибирского государственного Университета входят 4 курса. Курсы содержат материалы по основам теории вероятностей и математической статистики, исследованию связей между признаками, построению прогнозов на основе регрессионных моделей, кластерному и статистическому анализу. Курсы разработаны совместно с 2GIS.

Продолжительность: 4 месяца (3 часа в неделю)

Онлайн-курсы

Если вы только начинаете знакомиться с анализом данных, то мы рекомендуем пройти бесплатный вводный курс в Яндекс.Практикуме. На курсе вы поймёте, что представляет собой анализ данных, какие процессы он в себя включает и чем занимается аналитик. Изучите азы важнейшего инструмента — языка программирования Python.

Даже если вы не учитесь в ШАДе, у вас всегда есть возможность пройти онлайн-курсы на платформе Coursera , созданные при поддержке преподавателей ШАДа.

В курсе разобраны основные типы задач, решаемых с помощью машинного обучения, таких как классификация, регрессия и кластеризация. Преподаватели рассказывают об основных методах и особенностях машинного обучения, учат оценивать качество модели и понимать, подходит ли она для решения конкретной задачи. У вас есть возможность познакомиться с современными библиотеками, в которых реализованы обсуждаемые модели и методы оценки их качества. В курсе используются данные из реальных задач.

Преподаватели показывают полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. На курсах учат пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. Каждый курс включает теорию и практические задания разного уровня сложности. В финале у вас будет возможность заняться разработкой собственных проектов для решения любой актуальной бизнес-задачи. Результатом станет наглядная работающая модель, которую можно применять в работе или демонстрировать на собеседованиях.

Программа предназначена в первую очередь для тех, кто хочет работать с большими объёмами данных: хранить их и строить отказоустойчивые эффективные системы обработки. Однако эта специализация полезна и для интеллектуального анализа данных. Вы получите навыки использования современных платформ и инструментов, выполните четыре проекта и поймёте, как решать самые частые задачи, связанные с большими данными. Пройдя всю программу, вы научитесь обрабатывать данные разными способами, использовать на больших данных методы машинного обучения и внедрять эти методы в продукты.

Программа посвящена глубинному обучению, обучению с подкреплением, автоматической обработке текстов, компьютерному зрению и байесовским методам. Вы получите навыки решения практических задач от победителей соревнований по машинному обучению на платформе Kaggle и учёных, работающих с данными в ЦЕРНе. После окончания семи курсов вы сможете применять современные методы машинного обучения в ваших проектах, поймёте, как обращаться с реальными данными и как эффективнее использовать существующие инструменты.

Программа состоит из пяти курсов, каждый длится пять недель. Преподаватели делятся своим многолетним опытом создания больших проектов на языке C++. Они не пересказывают учебник, а учат решать задачи, с которыми на практике сталкивается большинство разработчиков. Лекции, подаваемые в лёгкой и доступной форме, подкрепляются большим количество задач по программированию. Закончив эту специализацию, вы не только сможете рассуждать о C++, сравнивая его с другими языками, но и получите реальный навык программирования.

Программа включает пять курсов и работу над проектом. Вы познакомитесь с алгоритмами и структурами данных, которые обычно используются для решения задач в компьютерных науках. Во время обучения нужно не только придумывать алгоритмы и оценивать их сложность, но и реализовывать их на выбранном языке программирования. В финале вы поработаете над одним из реальных проектов, предложенных преподавателями: можно будет заняться сборкой генома из миллионов коротких кусочков или научиться строить самый быстрый маршрут между Нью-Йорком и Лос-Анджелесом, анализируя дорожные сети.

Профессия Data Scientist: машинное обучение

Вы научитесь создавать аналитические системы и использовать алгоритмы машинного обучения, освоите работу с нейросетями. Наполните портфолио и получите престижную профессию.

Записаться на курс

  • Длительность 13 месяцев
  • Помощь в трудоустройстве
  • 7 курсов в одной программе
  • Доступ к курсу навсегда

На рынке не хватает специалистов по Data Science

  • 2 300 компаний сейчас ищут специалистов в Data Science & Machine Learning
  • 80 000 рублей зарплата начинающего специалиста

Данные сайта hh.ru

Кому подойдёт этот курс

Новичкам в IT

Вы получите базовые навыки по аналитике, статистике и математике, которые откроют путь к карьере в Data Science и Machine Learning.

Программистам

Вы прокачаете свои знания и навыки в программировании на Python. Научитесь использовать алгоритмы машинного обучения, решать бизнес-задачи — и усилите портфолио мощными проектами.

Менеджерам и владельцам бизнеса

Научитесь использовать данные для построения прогнозов и оптимизации бизнес-процессов и переведёте компанию на новый уровень.

Чему вы научитесь

Программировать на Python

Визуализировать данные

Работать с библиотеками и базами данных

Применять нейронные сети для решения реальных задач

Строить модели машинного обучения

Писать рекомендательные системы

От первого урока к работе мечты

Студенты и выпускники Skillbox получают индивидуальную поддержку от Центра карьеры на протяжении всего обучения — от помощи с выбором профессии до выхода на работу мечты. Вот как это происходит.

Читать еще:  Обучение в инстаграм

С каждым уроком ваш профессиональный уровень растёт и вы можете планировать карьеру уже во время обучения.

Реакция потенциального работодателя зависит от того, как вы подаёте себя в резюме. Мы дадим советы по его составлению и поможем написать резюме, подающее вас лучшим образом.

Выбираете лучшую вакансию

Мы экономим ваше время — подбираем подходящие вакансии и договариваемся об интервью с работодателем. Вам нужно только пройти собеседование.

Начинаете карьеру мечты

Вы успешно проходите собеседование, выходите на работу и сразу начинаете выполнять задачи.

Записаться на курс или получить бесплатную консультацию

Похоже произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

Ваша заявка успешно отправлена

Как проходит обучение

Изучаете тему

В курсе — практические видеоуроки.

Выполняете задания

В том темпе, в котором вам удобно.

Работаете с наставником

Закрепляете знания и исправляете ошибки.

Защищаете дипломную работу

И дополняете ею своё портфолио.

Программа

Вас ждут 7 курсов с разным уровнем сложности, знание которых можно приравнять к году работы.

  1. Аналитика. Начальный уровень
  1. Введение.
  2. Основы Python: базовые структуры данных.
  3. Основы Python: циклы и условия.
  4. Основы Python: функции.
  5. Основы Python: классы и объекты.
  6. Основы Python: исключения.
  7. Библиотека NumPy. Часть 1.
  8. Библиотека NumPy. Часть 2.
  9. Библиотека pandas. Часть 1.
  10. Библиотека pandas. Часть 2.
  11. Визуализация данных с помощью matplotlib.
  12. Чтение и запись данных.
  13. Введение в SQL.
  14. Работа со строками.
  1. Основы статистики и теории вероятностей.
  1. Основные концепции Machine Learning (ML).
  2. Жизненный цикл ML-проекта.
  3. Регрессия.
  4. Классификация.
  5. Кластеризация
  6. Дополнительные техники.
  7. Знакомство с Kaggle.
  1. Базовые математические объекты и SymPy. Дроби и преобразования.
  2. Базовые математические объекты и SymPy. Необходимые функции и некоторые дополнительные объекты.
  3. Функции одной переменной, их свойства и графики.
  4. Интерполяция и полиномы.
  5. Аппроксимация и преобразования функций.
  6. Функции нескольких переменных, их свойства и графики.
  7. Линейные функции.
  8. Матрицы и координаты.
  9. Линейные уравнения.
  10. Производная функции одной переменной.
  11. Производная по направлению и градиент + частные производные.
  12. Линейная регрессия.
  13. Собственные векторы и значения. Определитель.
  14. Разложения матриц.
  1. Введение в нейронные сети.
  2. Обучение нейронных сетей.
  3. Нейронные сети на практике.
  4. Свёрточные нейросети для задачи классификации изображений.
  5. Семантическая сегментация. Часть 1. Слабая локализация и полносвёрточные нейросети (FCN).
  6. Семантическая сегментация. Часть 2. Продвинутые архитектуры FCN для семантической сегментации.
  7. Детектирование объектов.
  8. От дискриминативных моделей к генеративным. Style transfer.
  9. Генеративные состязательные сети.
  10. Введение в NLP.
  11. NLP на нейросетях. Рекуррентные нейросети, классификация текстов.
  12. NLP на нейросетях. Языковые модели, Attention, Transformer.
  13. Обучение с подкреплением. Q-Learning.
  14. Обучение с подкреплением. Deep Q-Learning.
  15. Ускорение и оптимизация нейронных сетей.
  16. Внедрение в DL моделей в Production.
  17. Рекомендательные системы.
  18. Вывод моделей машинного обучения в production, post production и мониторинг.
  1. Как стать первоклассным программистом.
  2. Как искать заказы на разработку.
  3. Личный бренд разработчика.
  4. Photoshop для программиста.
  5. Вёрстка email-рассылок. Советы на реальных примерах.
  6. The state of soft skills.
  7. Как мы создавали карту развития для разработчиков.
  8. Как общаться по email и эффективно работать с почтой.
  9. Повышение своей эффективности.
  10. Спор о первом языке программирования.
  11. Саморазвитие: как я не усидел на двух стульях и нашёл третий.
  12. Data-driven подход к продуктивности — инсайты из данных миллиона людей.
  1. IT Resume and CV.
  2. Job interview: questions and answers.
  3. Teamwork.
  4. Workplace communication.
  5. Business letter.
  6. Software development.
  7. System concept development and SRS.
  8. Design.
  9. Development and Testing.
  10. Deployment and Maintenance.

Уже учились на каком-то курсе из программы?

Скажите об этом менеджеру — за этот курс платить не придётся!

Получить полную программу курса и консультацию

Похоже произошла ошибка. Попробуйте отправить снова или перезагрузите страницу.

8 лекций, которые помогут разобраться в машинном обучении и нейросетях

С работой алгоритмов машинного обучения вы сталкиваетесь каждый день. Это распознавание изображений, поисковая выдача, голосовые помощники, рекомендации контента и, конечно же, реклама. Мы собрали для вас лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться.

Машинное обучение

Вводная лекция от кандидата физико-математических наук Дмитрия Ветрова. Ученый объясняет, как работает машинное обучение, что такое глубинное обучение и как устроены нейросети.

Математические методы прогнозирования объемов продаж

Другая лекция от ПостНауки — член РАН Константин Воронцов показывает частный пример применения методов машинного обучения в бизнесе. Математик объясняет, как его команда построила модель прогнозирования объемов продаж для крупной розничной сети.

Прекрасные и ужасные последствия самообучения компьютеров

Спикер TED, специалист по машинному обучению и CEO компании Enlitic Джереми Говард делает свои прогнозы о том, что произойдет, когда мы научим компьютеры учиться.

Как мы учим компьютеры понимать изображения

Еще одна лекция в рамках TED. Эксперт по компьютерному зрению Фей-Фей Ли описывает последние достижения машинного обучения, включая базу данных, содержащую 15 миллионов фотографий, которую создала её команда, чтобы научить компьютер понимать изображения.

Как мы обучаем технику не смотреть и слушать, а видеть и слышать?

Несмотря на первые 20 минут тишины, довольно бодрая лекция по глубинному обучению от теххаба KL10CH и инженера в области машинного обучения, компьютерного зрения и обработки сигналов в Исследовательского центра Samsung Дмитрия Коробченко. Для самых стойких и продвинутых.

И бонус для тех, кто настроен серьезно:

Recent Developments in Deep Learning

Лекция известного специалиста по искусственным нейросетям Джеффри Хинтона, прочитанная в Торонтском университете. Профессор Хинтон рассказывает об основных достижениях в области глубинного обучения.

Deep Learning, Self-Taught Learning and Unsupervised Feature Learning

Один из основателей Coursera, доцент Стэнфорда и специалист в области машинного обучения и робототехники Эндрю Ын объясняет тонкости обучения «с учителем» и без.

Machine Learning for Video Games

За пять минут на примере Марио вам расскажут, как машинное обучение применяется в разработке видеоигр.

Ссылка на основную публикацию
Adblock
detector