Openbravo-rus.ru

Образование по русски
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Машинное обучение форекс

Что нужно знать о создании стратегий для торговли на бирже: насколько эффективно машинное обучение

В нашем блоге на Хабре мы публиковали адаптированные переводы материалов из блога The Financial Hacker, посвященные вопросам создания стратегий для торговли на бирже. Ранее мы обсудили поиск рыночных неэффективностей , создание моделей торговых стратегий , и принципы их программирования . Сегодня речь пойдет об использовании подходов машинного обучения для повышения эффективности торговых систем.

Первым компьютером, выигравшим мировое первенство по шахматам стал Deep Blue. Это было в 1996 году, и прошло еще двадцать лет, прежде чем другая программа, Alpha Go, сумела победить лучшего игрока в Го. Deep Blue был модель-ориентированной системой с вшитыми правилами игры в шахматы. AplhaGo — это дата-майнинговая система, глубокая нейронная сеть, натренированная с помощью тысяч партий в Го. То есть для того, чтобы сделать шаг от побед над людьми-чемпионами в шахматах, к доминированию над топовыми игроками в Го понадобилась не улучшенная железка, а прорыв в области программного обеспечения.

В текущей статье мы рассмотрим применение подхода дата-майнинга к созданию торговых стратегий. Этот метод не учитывает рыночные механизмы, он просто сканирует ценовые кривые и другие источники данных для поиска предиктивных паттернов. Машинное обучение или «искусственный интеллект» нужны для этого не всегда. Напротив, очень часто, наиболее популярные и прибыльные методы дата-майнинга работают без всяких рюшечек в виде нейронных сетей или поддержки векторных методов.

Принципы машинного обучения

Обучаемому алгоритму «скармливают» образцы данных, обычно каким-то образом выделенных из исторических биржевых цен. Каждый семпл состоит из n переменных x1… xn, которые обычно называют предикторами, функциями, сигналами или, проще, входными данными. Эти предикторы могут быть ценами последних n баров на графике цен или набором значений классических индикаторов, да любыми другими функциями от ценовой кривой (бывают даже случаи, когда в качестве предикторов для нейронной сети используют отдельные пиксели графика цен!). В каждом семпле также обычно содержится некая целевая переменная y, например, результат следующей сделки после анализа семпла или следующее движение цены.

В литературе y часто называют ярлыком или целью (objective). В процессе обучения, алгоритм учится предсказывать целевую y на основе предикторов x1… xn. То, что система «запоминает» в процессе, хранится в структуре данных под названием модель, которая специфична для конкретного алгоритма (тут важно не путать это понятие с финансовой моделью или модель-ориентированной стратегией). Модель машинного обучения может быть функций с правилами предсказаний, записанной с помощью кода на C, сгенерированном процессом обучения. Или это может быть набор связанных весов нейросети:

Обучение: x1… xn, y => модель

Предсказание: x1… xn, модель => y

Предикторы, функции или как вы хотите их назвать, должны содержать информацию, достаточную для генерации предсказаний о значении целевого y с определенной точностью. Также они должны соответствовать двум формальным критериям. Во-первых, все значения предикторов должны находиться в одном диапазоне, например -1… +1 (для большинства алгоритмов на R) или -100… +100 (для алгоритмов на скриптовых языках Zorro или TSSB). Так что перед отправкой данных в систему понадобится их нормализация. Во-вторых, семплы должны быть отбалансированы, то есть равномерно распределены по значениями целевой переменной. То есть у вас должно быть одинаковое число семплов, приводящих к положительному исходу, и проигрышных наборов. Если этим двум требованиям не следовать, то получить хорошие результаты не удастся.

Алгоритмы регрессии генерируют прогнозы о численных значениях, вроде магнитуды или знака следующего ценового движения. Алгоритмы классификации предсказывают количественные классы семплов, например, предшествуют ли они получению прибыли или потере средств. Некоторые алгоритмы, вроде нейронных сетей, деревьев принятия решений или метода опорных векторов могут быть запущены в обоих режимах.

Существуют также алгоритмы, которые могут научиться выделять из семплов класса без необходимости наличия целевого y. Это называется неконтролируемым обучением, в отличие от контролируемого с использованием цели. Где-то между этими двумя методами располагается «подкрепляемое обучение» (reinforcement learning), при котором система тренируется с помощью запуска симуляций с заданными функциями и использует результат в качестве цели. Последователь AlphaGo, система под названием AlphaZero использовала подкрепляемое обучение, играя миллион партий Го сама с собой. В финансах же крайне редко встречаются подобные системы или продукты, использующие неконтролируемое обучение. 99% систем используют контролируемое обучение.

Какие сигналы бы мы не использовали для предикторов в финансах, в большинстве случаев они будут содержать много шума и мало информации, да вдобавок будут нестационарными. Так что предсказания в финансах — одна из сложнейших задач машинного обучения. Более сложные алгоритмы здесь достигают лучших результатов. Выбор предикторов критически важен для успеха. Не обязательно их должно быть много, поскольку это приводит к переобучению и сбоям в работе. Поэтому стратегии дата-майнинга часто применяют заранее отобранный алгоритм, который выделяет небольшое количество предикторов из более широкого пула. Такой предварительный отбор может быть основан на корреляции между предикторами, их значимости, информационной насыщенности или просто успешности/неуспешности использования тестового набора. Практические эксперименты с отбором целей можно найти, например, в блоге Robot Wealth .

Ниже — список самых популярных методов дата-майнинга, используемых в сфере финансов.

1. Суп из индикаторов

Большинство торговых систем не основаны на финансовых моделях. Часто трейдерам нужны лишь торговые сигналы, генерируемые определенными техническими индикаторами, которые фильтруются другими индикаторами в комбинации с дополнительными техническими индикаторами. Когда такого трейдера спросить о том, как такая мешанина из индикаторов может приводить к какой-то прибыли, он обычно отвечает что-то вроде: «Поверьте мне, я так руками торгую, и все работает».

И это правда. По крайней мере иногда. Хотя большинство этих систем не пройдут WFA-тест (а некоторые и простое тестирование на исторических данных), удивительно большое количество таких систем в итоге работает и приносит прибыль. Автор блога Financial Hacker занимается в том числе разработкой торговых систем на заказ, и рассказывает историю одного из клиентов, который систематически экспериментировал с техническими индикаторами до тех пор, пока не нашел их комбинацию, работающую для определенных типов активов. Такой метод проб и ошибок — это классический подход к дата-майнингу, для успеха нужен лишь он, удача и много денег на тесты. В результате иногда можно рассчитывать на получение прибыльной системы.

2. Свечные паттерны

Не путать с паттернами японских свечей, которые существуют сотни лет. Современный эквивалент этому подходу — это торговля на основе движений цен. Вы точно также анализируете показатели open, high, low и close для каждой свечи графика. Но теперь вы используете дата-майнинг для анализа свечей ценовой кривой для выделения паттернов, которые могут быть использованы для генерирования прогнозов о направлении движения цены в будущем.

Существуют целые программные пакеты для этой цели. Они ищут паттерны, которые прибыльны с точки зрения заданных пользователем критериев, и используют их для построения функции детектирования паттернов. Выглядеть все это может примерно так:

int detect(double* sig)
<
if(sig[1]

Коэффициенты — это и есть модель. Они вычисляются для минимизации суммы квадратичных отклонений между реальными значениями y, тренировочными значениями и предсказанными y по формуле:

Машинное обучение в трейдинге

Трейдинг — это ужасно конкурентный мир. И поэтому искусственный интеллект, используемый уже практически как универсальное оружие для чего угодно, не может не найти свое применение и в торговле.

Дисклэймер

ИИ играет важную роль в маркетинге, но, возможно, не такую, какую вы сейчас представляете. К сожалению, он пока еще не способен стать супермашиной и самостоятельно превзойти в продажах по всем рынкам. Даже Renaissance Technologies не способны на это, по крайней мере сейчас.

Читать еще:  Уровни обучения английскому

Почему так?

Если ответить кратко: человеческая конкуренция, но об этом чуть-чуть позже.

Хоть ИИ постепенно и побеждает в конкуренции с человеком, он все равно не сможет стать главным игроком в этой игре. Искусственный интеллект подходит больше в качестве инструмента, нежели полной замены человека.

К примеру, 4 основных применения ИИ на данный момент это:

Анализирование данных

Люди не могут контролировать абсолютно всю информацию в мире — а вот машины способны хотя бы приблизиться к этому. С применением ИИ, машины смогли осуществлять гораздо больше функций — в том числе анализ и понимание текстов.

Теперь они могут понимать такие вещи как предпочтения людей и их интересы: подобно скрепкам они собирают ежедневные новости, твиты и посты из социальных сетей по определенной тематике, а затем, по алгоритмам AI (в частности с помощью обработки естественного языка) анализируют, каких откликов больше — положительных или негативных. Они вправе даже классифицировать тексты по темам и автоматически составлять легко читаемые подборки новости для людей. Таким образом, ИИ способен определять текущие экономические тренды.

Это невероятно ценная функция особенно полезна для трейдеров, которым необходимо всегда оставаться в курсе событий первыми.

Прогнозирование реальных данных

Трейдеры также используют ИИ чтобы проверять различные прогнозы — особенно вещи, которые в реальном мире реально могут помочь им добиться успеха.

  • Прогноз погоды на северо-востоке на следующие пару недель;
  • Потребление солнечной энергии в Европе;
  • Итоги политических выборов.

Данные прогнозы основаны на других алгоритмах, разработанных другими компаниями, однако это не значит, что они не могут не улучшаться.

Один популярный прием: тренировать алгоритм комбинировать несколько прогнозов, чтобы впоследствии усовершенствовать его. Такой метод называется ансамблем, и работает он достаточно хорошо.

Поиск данных

Торговля — это постоянный поиск детальных графиков, которые зачастую ограничены во времени и пространстве, чтобы использовать затем их в своих целях. Процесс поиска данных и графиков сам по себе очень трудоемкий и затратный.

Алгоритмы ИИ — это и есть машины, для поиска данных. Если аналитик сомневается в какой-либо информации, он может сэкономить свое время на поиск ошибки с помощью ИИ.

Нужный график будет легко найден Искусственным Интеллектом, если ему поставлена точная задача. Таким образом, аналитик руководствуясь полученной информацией, уже на основе собственного опыта и знаний, может сделать более качественный вывод. Или можно и вовсе сконструировать автоматизированную машину для продаж? Но об этом читайте дальше.

Настройка машин в высокочастотной торговле

В высокочастотной торговле, — как уже понятно из названия, — машины осуществляют тысячи, если не миллионы, операций за день, получая преимущество в том, что могут воспользоваться эффективностью, которая появляется только на короткие промежутки времени.

Люди не могут совершать такие сделки — их слишком много, однако именно люди определяют правила, по которым работают эти машины.

По той причине, что рынок постоянно меняется, машины тоже необходимо перенастраивать. Это требует много времени и сил. ИИ же способен автоматизировать данный процесс и заменить человека в этой монотонной работе.

! 3 предупреждающих знака! — Что следует понимать

Идея найти чудо-алгоритм, который буквально будет печатать деньги разумеется привлекательна, и настолько, что на нее покупаются много умных людей. Однако вот три вещи, которые следует понимать:

1.ИИ на сегодняшний день НЕ умнее людей

Реально, даже самый современный алгоритм очень примитивен по сравнению с человеческими мозгами.

Когда алгоритм побеждает человека в шахматах или в GO, это выглядит так же, как когда машина сбивает человека в беге на четверть мили. Да, она работает быстрее, но это не делает её лучше. Это просто означает, что мы сумели построить машину, которая способна очень хорошо выполнять очень специфическую задачу в определенных, очень узких, условиях.

Может быть вам и может показаться, что торговля это тоже узко определенная задача, но это отнюдь не так. Почему? Потому что в торговле вы конкурируете с другими людьми. А вот они уже будут использовать весь свой умственный потенциал, пытаясь обойти вас.

2. Опубликованные стратегии по торговле часто не работают в реальной жизни

Существует достаточно много исследований и не меньше публикаций в блогах, которые описывают алгоритм действий на основе ИИ для выгодной торговли. Но эти алгоритмы просто не могут работать в реальной жизни по нескольким причинам.

Неправильная настройка. Удивительное количество публикаций на самом деле делают ошибки из-за того, как они настраивают тренировку и среду для тестирования. Например, они часто используют переменные, которые не будут уже доступны в момент работы ИИ из-за утечки данных или дают оценку продукту, основываясь на актуальной цене, а не на будущей. Удивительные ошибки, однако прогнозирование кривой цен — это действительно сложная штука для человеческого мозга.

Эффект самоотбора

Менеджеры фондов очень часто поддаются критике за то, что они приписывают свои высокие прибыли скорее к собственным суперским знаниям, нежели удаче. Хотя, по большому счету, многие из них просто делают случайные предположения, которые, если выстрелят — потом принесут плоды. Те, кто не вошли в число счастливчиков — банкротятся, и мы ничего не слышим о них позже. И поэтому всем кажется, что фондовых руководителей, которые имеют невероятные знания в области торговли и маркетинга полным полно.

В действительности же, их количество, зависит, по большей мере, от того, насколько они удачливы.

То же самое можно сказать и об исследованиях. Если вы протестируете огромное количество алгоритмов, вы, скорее всего, найдете тот, который покажется вам наиболее прибыльным. Но если вы не расскажите, сколько экспериментов пришлось выполнить, чтобы добиться этого, всем тоже будет казаться, что вы просто натолкнулись на суперский подход.

Тем не менее, нет никакой гарантии, что эта стратегия будет работать вне конкретных данных, которые вы тестировали.

Комиссионные и проскальзывание (слиппедж)

В общем говоря, построенить торговую стратегии, которая опередит рынок не так сложно — ЕСЛИ забыть о реальных расходах на торгах. Комиссии (сборы, которые трейдеры платят за каждую продажу) и проскальзывание (термин обозначающий изменение цены в промежуток между сделкой и актуальной торговлей) съедают большую часть прибыли. И почти в каждом случае, этого достаточно, чтобы не получать то, на что рассчитывали.

Графики меняются со временем

Одна из самых главных концепций машинного обучения является поиск прошлых данных и использование их для составления прогнозов на будущее.

Однако такой подход не работает в трейдинге. Конкурирующие между собой трейдеры стараются найти одни и те же графики, чтобы обойти друг друга. Поэтому очень часто после использования данные исчезают. Это означает, что информация редко бывает доступна длительное время, поэтому постоянно приходится искать новые.

Это требует огромной способности адаптироваться, и на данный момент, люди гораздо лучше справляются с этим, чем машины.

3. Одни алгоритмы никогда не дадут вам преимущества

Легко сконцентрироваться только на одних алгоритмах, как на единственном преимуществе перед другими торговыми стратегиями.

По существу, такие компании как Numerai это и предлагают:

  • Комбинировать хорошие торговые стратегии с целью создать лучшую.
  • Срывать куш.
Читать еще:  Программа excel обучение для начинающих видео бесплатно

Но это не работает. Почему? Да потому что алгоритмы срываются из-за данных. Информация, которая предоставляется алгоритму, оказывает большее влияние на производительность стратегии, нежели на то, насколько хорош алгоритм. Данные Numerai даются вам фиксированными — вы не можете изменить их. Таким образом, прогнозы, которые они делают будут всегда несколько хуже чем у тех, где трейдеры постоянно вносят изменения, где есть доступ к базе данных и где трейдеры могут в процессе тестирования добавлять новые частные значения.

Немного надежды: неэффективные рынки все еще могут быть прибыльными

Рынки с несколькими трейдерами, обладающие высокие барьерами для входа и с ограниченным количеством сделок, могут использовать машинное обучение чтобы получить преимущество в “чистой игре” (занимаясь одним видом деятельности, например, продажей через Интернет).

Использование машинного обучения на рынках автоматической торговли подходит только для начала, и трейдеры, которые строят машины для автоматизированных продаж, по большей мере, получат преимущество только оценивая маржу.

Машинное обучение в трейдинге: теория и практика (торговля и не только)

Добрый день всем,

Знаю, что есть на форуме энтузиасты machine learning и статистики. Предлагаю в этой теме обсуждать (без холиваров), делиться и обогащать собственную копилку знаний в этой интересной сфере.

Для новичков и не только есть хороший теоретичекий ресурс на русском языке: http://www.machinelearning.ru/

Небольшой обзор литературы по методам на тему отбора информативных признаков: /go?link=https://habrahabr.ru/post/264915/

Предлагаю задачу номер один. Позже выложу ее решение. СанСаныч ее уже видел, прошу не говорить ответ.

Введение: для построения алгоритма торговли необходимо знать, какие факторы будут положены в основу предсказания цены, или тренда, или направления открытия сделки. Отбор таких факторов непростая задача, и она бесконечносложная.

Во вложении архив с искуственным набором данных формата csv, который сделал я.

Данные содержат 20 переменных с префиксом input_, и одну крайнуюю правую переменную output.

Переменная output зависит от некоторого поднабора переменных input (поднабор может содержать от 1 до 20 inputs).

Задача: с помощью любых методов (машинного обучения) отобрать переменные input, с помощью которых можно определить состояние переменной output на существующих данных.

Решение можно выложить здесь в виде: input_2, input_19, input_5 (пример). И можно также описать найденную зависимость входов и выходной переменной.

Кто справится, тот молодец ) С меня готовое решение и объяснение.

Deus Ex Machina.

Такими словами открывают перед читателем свои страницы многолетние тома философских трактатов.

Ну, и, никто не хочет машин лёрнинг заниматься?

Deus Ex Machina.

Такими словами открывают перед читателем свои страницы многолетние тома философских трактатов.

Ну, и, никто не хочет машин лёрнинг заниматься?

Точнее, к тому, что было раньше.

И в этом ищет устойчивую зависимость.

Точнее, к тому, что было раньше.

И в этом ищет устойчивую зависимость.

В общем, так. Чтобы немного подстегнуть тему, я обещаю перевести 5 кредитов тому, кто правильно решит поставленную задачку.

Выдать набор информативных входов.

Сообщество мне их начислило за активность на форуме, я их обратно в систему верну, но при это получим некоторую интересную дискуссию.

Заявленная тема «Машинное обучение» важна, сложна и огромна. Судя по первому посту Вы хотите начать с одного из подготовительных и важных этапов — «Оценка и выбор предикторов». Что Вы хотите решить или показать с приведенной задачей? Новый метод, способ или что?

Содержание и тема топика не совпадают.

Конкретизируйте цель, может и будут заинтересованные люди.

Мало кто имеет свободное время для решения задач с непонятными целями.

Всегда учимся на прошлом.

Смотрим столетиями на график. Оба на и видим «три солдата», потом видим «голова и плечи». Сколько уже таких фигур увидели и верим в эти фигуры, торгуем.

А если задачу поставить так:

1. Автоматические найти такие фигуры, причем не вообще ко всем графикам, а к конкретной валютной паре, те которые встречались недавно, а не три века назад у японцев при торговле рисом.

2. А годятся ли у нас те исходные данные, на которых мы автоматически ищем такие фигуры — паттерны.

Для ответа на первый вопрос рассмотрим алгоритм, который называется «лес случайных деревьев» — random forest. Алгоритм в качестве исходных данных для своей работы берет котировку одной или нескольких валют, индикаторы, приращения цен — все, что напридумывал человек. 10-5-100-200 . входных переменных. Затем берет весь набор значений переменных, относящихся к одному моменту времени, соответствующих одному бару и ищет такую комбинацию этих входных переменных, которая бы соответствовала на исторических данных вполне определенному результату, например, ордеру BUY. А другой набор комбинаций другому ордеру — SELL. Каждому такому набору соответствует отдельное дерево. Опыт показывает, что для входного набора часовика из 18000 баров (около 3-х лет) алгоритм находит 200-300 деревьев. Это и есть набор паттернов, почти аналоги «голов и плеч», и целых рот солдатов.

Проблема в этом алгоритме состоит в том, что такие деревья могут ухватить некоторую конкретику, которая не встретится в будущем. Это называется здесь на форуме «сверхподгонка», в машинном обучении «переобучение». Известно, что весь большой набор исходных переменных можно поделить на две части: относящиеся к выходной переменной и не имеющие отношение шум. Вот Бурнаков и пытается отсеять те, которые не имеют отношения к результату.

При построении трендовых ТС (BUY, SELL) любые разновидности машек относятся к шуму!

Судя по первому посту Вы хотите начать с одного из подготовительных и важных этапов — «Оценка и выбор предикторов». Что Вы хотите решить или показать с приведенной задачей? Новый метод, способ или что?

Содержание и тема топика не совпадают.

Конкретизируйте цель, может и будут заинтересованные люди.

Мало кто имеет свободное время для решения задач с непонятными целями.

Если кто-решит или хотя приблизиться к верному решению (то есть, тему будет жива), то я:

выложу правильное решение — алгоритм генерации набора данных

объясню, почему ряд других алгоритмов «Оценки и выбора предикторов» не справились

выложу свой метод, который робастно и чувствительно решает похожие задачи — выдам теорию и выложу код на R.

Это сделано для взаимного обогащения «понималки» задач машинного обучения.

Машинное обучение форекс

Канадская инвестиционная компания опубликовала исследование о том, как методы машинного обучения позволили ей существенно улучшить показатели торговых стратегий.

Финансовые рынки становятся все более сложными и эффективными, что затрудняет работу на них с использованием традиционных методов анализа. И хотя мы еще находится на заре развития новейших технологий, некоторые специалисты уже используют множество доступных данных для применения сложных количественных технологий, таких как машинное обучение (machine learning, ML).

Эти технологии не решат все проблемы, но помогут финансовым управляющим получать близкую к безрисковой доходность в условиях высокой конкуренции.

Большие данные (Big Data) и будущее финансов

Сегодня объемы данных растут в геометрической прогрессии. По оценкам IBM, за последние два года было создано 90% всех мировых данных, которые появляются из трех основных источников: частных лиц, компаний и сенсорных датчиков.

Люди увеличивают потоки информации при каждом посте в Instagram или поездке в Uber, компании генерируют сегодня больше транзакций, чем когда-либо, а датчики уже фиксируют данные почти со всех окружающих нас предметов – от стиральных машин до ветровых турбин. По данным Seagate, в 2017 году объем сгенерированных данных оценивается примерно в 21 ЗеттаБайт (ЗБ, единица измерения информации, 1 ЗБ = 1021 байт), а к 2025 году он может превысит 160 ЗБ.

Читать еще:  Обучение языку python с нуля

Финансовый мир также полон информации: финансовые рынки, экономические показатели и новости обеспечивают ее практически безграничную генерацию. Большинство инвесторов имеют доступ к одним и тем же данным в одно и то же время, что затрудняет успешную игру на рынке при использовании традиционных методов. Поэтому многие управляющие, желая получить преимущество, начинают осваивать альтернативные источники данных.

…Тем не менее в секторе финансов все еще наблюдается относительная отсталость или консервативность по сравнению с другими отраслями. Основная причина тому заключается в дефиците специалистов, которые одинаково хороши как в финансах, так и программировании. При этом активно растет число приложений, использующих машинное обучение, появляются различные виды алгоритмов, которые можно использовать для реализации инвестиционных стратегий.

Применение машинного обучения в трейдинге

Конечно, мы в Richardson GMP не являемся настоящими специалистами по Big Data, но признаем возможности, которые она раскрывает. Поэтому мы нанимаем квантов и внедряем различные технологии в управление инвестиционным портфелем, чтобы оптимизировать все процессы и получать прибыль. Мы считаем, что симбиоз человека и машины в работе гораздо эффективнее, чем их работа по отдельности. И мы твердо убеждены, что поведенческий фактор, предубеждения и субъективность, вызванная эмоциями, заставляет инвесторов действовать иррационально. Это приводит к покупке неправильно оцененных активов. При этом человек, совершив ошибку один раз, может вновь наступить на те же грабли, что в результате приведет к росту числа неправильных решений.

Используя в своей работе количественные беспристрастные «машинные» стратегии в сочетании с человеческим аспектом – нашим поведенческим опытом в области финансов и традиционного управления портфелем, – мы пытаемся выявить неправильно оцененные активы, чтобы на них заработать.

Пример разработки стратегии с применением машинного обучения

Мы решили улучшить базовый поход к нашей стратегии, и первым шагом стало изменение инструментов для скрининга – анализа и сбора данных. Excel был слишком медленным для наших задач, поэтому мы заключили партнерство с квантовой командой Bloomberg, чтобы разработать систему, которая выполняла большую часть работы в облаке. Результатом стал динамический инструмент на основе Python (высокоуровневый язык программирования), который отображает различные индексы для трейдинга. Мы использовали этот инструмент, чтобы составить общую базу данных на 20-летнем промежутке.

Следующим шагом стала автоматизация нашей торговли, установление идеальных уровней для стоп-лосса и трейлинг-стопа (автоматическое перемещение цены ордера стоп-лосс следом за ценой актива с небольшим отставанием на заданную разницу – Прим. ред). Эта оптимизация значительно улучшила результаты нашей стратегии, которая превзошла доходность инвестиций в индекс S&P 1500.

Наконец, третий шаг – применение машинного обучения. Мы решили, что будем использовать в работе «контролируемое машинное обучение», когда мы посылали машине вопросы (Х) и ответы на них (Y). Впоследствии система стала учиться сама, используя данные, полученные в ходе идентификации поставляемых нами шаблонов.

В Richardson GMP мы пробовали использовать различные модели, но остановились на нелинейном методе опорных векторов (Support Vector Machines, SVM), так как именно он постоянно показывал хорошие результаты. SVM – это набор контролируемых алгоритмов обучения, которые хорошо работают в многоразмерных пространствах.

Эти алгоритмы используют разделяющую плоскость (decision boundary) в случае пространств большой размерности и делит данные на несколько классов. Наша цель заключалась в том, чтобы на уровне предиктивной аналитики алгоритмы смогли разделить наши торговые решения на классы Yes и No. Первый класс означает сделки, приносящие гарантированную высокую прибыль, вторые – сделки, которые не являются такими.

В результате три из четырех «новых» стратегий, использовавшие машинное обучение, смогли обогнать нашу базовую стратегию по отношению к бенчмарку (S&P 1500). К слову, для составления нашей базовой стратегии мы использовали все накопленные данные (фундаментальные, исторические, рыночные и т.д.) за 10 лет.

Затем на промежутке с апреля 2010 года по апрель 2018-го мы стали использовать различные варианты алгоритмов, чтобы выяснить, какую выгоду дает «чистое» использование элементов машинного обучения и предиктивной аналитики по сравнению с результатами базовой стратегии, где эти алгоритмы не использовались.

Рост доступности и использования данных уже оказывает влияние на финансы. Пока еще это находится на ранней стадии развития. Однако некоторые специалисты (включая нас) уже используют множество доступных данных для применения сложных методов. Машинное обучение никогда не решит все проблемы рынка, однако может помочь найти преимущества в высококонкурентной среде. Мы оптимистичны в том, что изучение данных поможет повысить ценность наших инвестиций.

Сочетание традиционного управления инвестпортфелями, поведенческой экономики и машинного обучения дадут нам эти преимущества.

Материал подготовлен при поддержке компании «Норд Капитал». Статья основана на отчетах управления по работе с частным капиталом компании Richardson GMP. С полным отчетом «Big Data & Machine Learning» можно ознакомиться по ссылке.

Еще по теме:

Машинное обучение форекс

Технологии искусственного интеллекта (ИИ) и машинного обучения используются на протяжении уже многих лет, но сейчас интенсивность их применения заметно выросла. Например, машинное обучение активно внедряют в сфере телекоммуникаций, в ретейле, маркетинге и электронной коммерции. Но многие до сих пор не до конца понимают, что же это такое.

Машинное обучение подразумевает обработку системой большого числа примеров, в ходе которой она выявляет закономерности и использует, чтобы прогнозировать характеристики новых данных. Другими словами, это процесс наделения ИИ «сознанием», умением запоминать и анализировать.

Сейчас технологии машинного обучения используют ведущие технологические компании мира, например Alibaba, Apple, Facebook, Netflix. Способов применения такого обучения масса:

  • обработка заказов;
  • формирование рекомендаций;
  • оптимизация производства;
  • обучение голосовых помощников и чат-ботов;
  • распознавание образов.

Информация о поведении и предпочтениях каждого из нас круглосуточно собирается в базы крупных магазинов, банков и сотовых операторов. Эти данные позволяют бизнесу находить связи, предсказывать выгодные шаги.

На первый взгляд, механизмы внедрения машинного обучения в большей степени касаются специалистов в сфере ИT. Но в эпоху цифровой трансформации понимать принципы искусственного интеллекта и машинного обучения важно и руководителям проектов, и менеджерам по продукту, и аналитикам, то есть всем, кто работает с данными.

Вне зависимости от того, есть ли у менеджера по продукту техническое образование, он регулярно должен решать две задачи, пишут авторы блога онлайн-школы SkillFactory (34-е место в рейтинге крупнейших EdTech-компаний России):

  • оценивать возможности продукта;
  • определять его суть и контуры.

Чтобы «вариться» в теме, находить интересные идеи и отстаивать со знанием дела перед руководством, менеджер по продукту должен понимать работу ИИ, а значит принципы машинного обучения. Основам менеджмента при помощи анализа данных посвящено несколько курсов SkillFactory (до 9 сентября читатели РБК могут получить скидку 30% на некоторые курсы).

В дальнейшем для освоения принципов машинного обучения подойдут специализированные курсы. Менеджер по продуктам с использованием ИИ в Xerox PARC Марк Крамер рекомендует для начала научиться кодированию (выучить какой-нибудь конкретный язык, к примеру Python), после чего приступать к основам искусственного интеллекта.

Самые полезные из программ, по словам Крамера:

Самостоятельно освоить основы ИИ и машинного обучения помогут также Github и TensorFlow.

Кроме того, у крупных технологических компаний есть инструменты и платформы с открытым исходным кодом (Amazon AI, тот же TensorFlow, первоначально разработанный Google, и многие другие), которые делают машинное обучение доступным практически любой компании.

Ссылка на основную публикацию
Adblock
detector