Openbravo-rus.ru

Образование по русски
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Интерактивное пособие по машинному обучению на python

Автостопом по машинному обучению на Python

Автостопом по машинному обучению на Python

    Переводы , 30 сентября 2017 в 22:18

Машинное обучение на подъеме, этот термин медленно забрался на территорию так называемых модных слов (buzzword). Это в значительной степени связано с тем, что многие до конца не осознают, что же на самом деле означает этот термин. Благодаря анализу Google Trends (статистике по поисковым запросам), мы можем изучить график и понять, как рос интерес к термину «машинное обучение» в течение последних 5 лет:

Но эта статья не о популярности машинного обучения . Здесь кратко описаны восемь главных алгоритмов машинного обучения и их использование на практике. Обратите внимание, что все модели реализованы на Python и у вас должно быть хотя бы минимальное знание этого языка программирования. Подробное объяснение каждого раздела содержится в прикрепленных англоязычных видео. Сразу оговоримся, что полным новичкам этот текст покажется сложным, он скорее подходит для продолжающих и продвинутых разработчиков, но главы материала можно использовать как план для построения обучения: что стоит знать, в чем стоит разобраться в первую очередь.

Классификация

Не стесняйтесь пропускать алгоритм, если чего-то не понимаете. Используйте это руководство так, как пожелаете. Вот список:

  1. Линейная регрессия.
  2. Логистическая регрессия.
  3. Деревья решений.
  4. Метод опорных векторов.
  5. Метод k-ближайших соседей.
  6. Алгоритм случайный лес.
  7. Метод k-средних.
  8. Метод главных компонент.

Наводим порядок

Вы явно расстроитесь, если при попытке запустить чужой код вдруг окажется, что для корректной работы у вас нет трех необходимых пакетов, да еще и код был запущен в старой версии языка. Поэтому, чтобы сохранить драгоценное время, сразу используйте Python 3.6.2 и импортируйте нужные библиотеки из вставки кода ниже. Данные брались из датасетов Diabetes и Iris из UCI Machine Learning Repository . В конце концов, если вы хотите все это пропустить и сразу посмотреть код, то вот вам ссылка на GitHub-репозиторий .

Линейная регрессия

Возможно, это самый популярный алгоритм машинного обучения на данный момент и в то же время самый недооцененный. Многие специалисты по анализу данных забывают, что из двух алгоритмов с одинаковой производительностью лучше выбирать тот, что проще. Линейная регрессия — это алгоритм контролируемого машинного обучения, который прогнозирует результат, основанный на непрерывных функциях. Линейная регрессия универсальна в том смысле, что она имеет возможность запускаться с одной входной переменной (простая линейная регрессия) или с зависимостью от нескольких переменных (множественная регрессия). Суть этого алгоритма заключается в назначении оптимальных весов для переменных, чтобы создать линию (ax + b), которая будет использоваться для прогнозирования вывода. Посмотрите видео с более наглядным объяснением.

Теперь, когда вы поняли суть линейной регрессии, давайте пойдем дальше и реализуем ее на Python.

Начало работы

Визуализация

Реализация

Логистическая регрессия

Логистическая регрессия – алгоритм контролируемой классификации. Она позволяет предсказывать значения непрерывной зависимой переменной на интервале от 0 до 1. Когда начинаешь изучать логистическую регрессию, складывается впечатление, что это своего рода узкоспециализированная вещь, и поэтому не уделяешь ей должного внимания. И лишь позже понимаешь, что очень ошибался. Некоторые из основных аспектов логистической регрессии лежат в основе других важных алгоритмов машинного обучения, например, для повышения точности прогноза нейросетевой модели . Имейте это в виду и смотрите видео ниже.

Теперь попробуем реализовать этот алгоритм на Python.

Начало работы

Визуализация

Реализация

Деревья решений

Метод деревьев решений (decision trees) – это один из наиболее популярных методов решения задач классификации и прогнозирования. Опыт показывает, что чаще всего данный алгоритм используется именно для классификации. На входе модель принимает набор атрибутов, характеризующих некую сущность, а затем спускается по дереву, тестируя их в зависимости от того, какие значения может принимать целевая функция. Таким образом, классификация каждого нового случая происходит при движении вниз до листа, который и укажет нам значение целевой функции в каждом конкретном случае. Деревья принятия решений становятся все более популярными и могут служить очень сильным инструментом для аналитики данных, особенно в сочетании с простыми методами композиции, такими как случайный лес, бустинг и бэггинг. И снова просмотрите видео ниже, чтобы более подробно изучить базовую функциональность деревьев решений.

А теперь по традиции перейдем к практике и реализуем данный алгоритм на Python.

Начало работы

Реализация

Визуализация

Метод опорных векторов

Метод опорных векторов , также известный как SVM, является широко известным алгоритмом классификации, который создает разделительную линию между разными категориями данных. Как этот вектор вычисляется, можно объяснить простым языком — это всего лишь оптимизация линии таким образом, что ближайшие точки в каждой из групп будут наиболее удалены друг от друга.

Этот вектор установлен по умолчанию и часто визуализируется как линейный, однако это не всегда так. Вектор также может принимать нелинейный вид, если тип ядра изменен от типа (по умолчанию) «гауссовского» или линейного. Несколькими предложениями данный алгоритм не опишешь, поэтому просмотрите учебное видео ниже.

И по традиции реализация на Python.

Начало работы

Реализация

Визуализация

Метод k-ближайших соседей

K-Nearest Neighbors , или KNN, представляет собой контролируемый алгоритм обучения, который используется преимущественно для решения задач классификации. Данный алгоритм наблюдает за разными центрами (центроидами) и сравнивает расстояние между ними, используя для этого различные функции (обычно евклидово расстояние). Затем определяется, к какому классу принадлежит большинство ближайших объектов обучающей выборки – к этому классу относится и неизвестный объект. Посмотрите видео для того, чтобы увидеть что происходит за кулисами данного алгоритма.

Теперь, когда вы поняли общую концепцию метода k-ближайших соседей, давайте напишем реализацию на Python.

Начало работы

Визуализация

Реализация

Случайный лес

Случайный лес — популярный алгоритм контролируемого обучения, заключающийся в использовании комитета (ансамбля) решающих деревьев. «Ансамбль» означает, что он берет кучу «слабых учеников» и объединяет их, чтобы сформировать один сильный предиктор. «Слабые ученики» — это все случайные реализации деревьев решений, которые объединяются для формирования сильного предсказателя — случайного леса. Все не объяснить. Смотрите видео ниже.

Теперь мы знаем, что такое случайный лес, пришло время реализации кода на Python.

Начало работы

Реализация

Метод k-средних

Метод k-средних — это популярный алгоритм неконтролируемой классификации обучения, обычно используемый для решения проблемы кластеризации. K обозначает количество введенных пользователем кластеров. Алгоритм начинается со случайно выбранных точек, а затем оптимизирует кластеры при помощи функций (евклидово расстояние и т. д), чтобы найти наилучшую группировку точек данных. В итоге специалистам по большим данным необходимо выбрать правильное значение K. Вы уже знаете, что для полноты картины нужно посмотреть видео.

Теперь, когда вы знаете чуть больше о кластеризации k-средних, давайте реализуем алгоритм на Python.

Начало работы

Реализация

Визуализация

Метод главных компонент

PCA (Principal Component Analysis) — алгоритм сокращения размерности, который может быть очень полезен для аналитиков. Главное — это то, что данный алгоритм может значительно уменьшить размерность данных при работе с сотнями или даже тысячами различных функций. Данный алгоритм не контролируется, но пользователь должен анализировать результаты и следить за тем, чтобы сохранялось 95% или около этой цифры первоначального набора данных. Не забудьте про видео, ведь оно расскажет намного больше об этом интересном алгоритме.

Реализация на Python.

Начало работы

Реализация

Подводим итоги

В данном учебном пособии, мы, не углубляясь, прошлись по всем важным на сегодняшний день алгоритмам машинного обучения. Во время вашего путешествия к мастерству в машинном обучении эта статья поможет вам систематизировать знания в голове.

Читать еще:  Программа икс эль обучение

Библиотеки Python, необходимые для машинного обучения

Перевод статьи Шуби Астаны «Essential libraries for Machine Learning in Python».

Разработчики, которым в их работе нужно применять приемы статистики или анализа данных, часто выбирают Python в качестве своего языка. Также он используется учеными науки о данных – при интеграции их задач с веб-приложениями или производственными средами.

Но в сфере машинного обучения Python просто «звезда». Комбинация последовательного синтаксиса, более короткого времени разработки и гибкости делает этот язык подходящим для разработки замысловатых моделей и предсказательных движков, которые можно напрямую внедрять в продакшен-системы.

Одно из самых больших преимуществ Python – широкий спектр библиотек.

Библиотеки представляют собой наборы подпрограмм и функций, написанных на данном языке. Хороший комплект библиотек может облегчить осуществление сложных задач без необходимости написания многих строк кода.

Машинное обучение во многом основано на математике. В частности, на математической оптимизации, статистике и теории вероятности. Библиотеки Python помогают исследователям / математикам «заниматься машинным обучением», даже не имея значительных познаний в разработке.

Ниже представлены несколько библиотек, которые широко используются в машинном обучении.

Scikit-learn для работы с классическими алгоритмами машинного обучения

Scikit-learn это одна из самых популярных библиотек машинного обучения. Она поддерживает много контролируемых и неконтролируемых алгоритмов обучения. Например, линейные и логистические регрессии, деревья принятия решений, кластеризацию, k-means и т. д.

Она создана на основе двух главных библиотек Python – NumPy и SciPy. В Scikit-learn добавлен набор алгоритмов для распространенных задач машинного обучения и добычи данных, включая кластеризацию, регрессию и классификацию. Даже такие задачи как преобразование данных и выбор функций могут быть реализованы с помощью всего нескольких строк.

Для людей, только начинающих работать в сфере машинного обучения, Scikit-learn является более чем достаточным инструментом. Его вполне будет хватать до того времени, как вы начнете реализовывать более сложные алгоритмы.

Tensorflow для глубокого обучения

Если вы занимаетесь машинным обучением, то наверняка испытывали, реализовывали или хотя бы слышали о некоторых формах алгоритма глубокого обучения. Являются ли они необходимыми? Не всегда. Классные ли они, если сделаны правильно? Да!

Касательно Tensorflow любопытно то, что при написании программы на Python можно компилировать и запускать программу как на CPU, так и на GPU. Таким образом для запуска на GPU вам не приходится писать на C++ или на уровне CUDA.

Библиотека использует систему многоуровневых узлов, которая позволяет вам быстро настраивать, обучать и развертывать искусственные нейронные сети с большими наборами данных. Именно это позволяет Google определять предметы на фотографиях и понимать произносимые слова в приложениях для распознавания устной речи.

Theano – также для глубокого обучения

Theano это еще одна хорошая библиотека Python для алгоритма числового расчета, похожая на NumPy. Она позволяет вам эффективно определять, оптимизировать и вычислять математические выражения, содержащие многомерные массивы.

Выделяет эту библиотеку использование преимуществ GPU компьютера. Это позволяет ей производить вычисления с большими объемами данных в сто раз быстрее, чем при запуске только на CPU. Скорость Theano особенно ценна для глубокого обучения и других задач, связанных со сложными вычислениями.

Последний релиз библиотеки Theano вышел в прошлом, 2017 году. Это версия 1.0.0 со множеством новых функций, изменениями интерфейса и прочими улучшениями.

Pandas для извлечения и подготовки данных

Pandas это очень популярная библиотека, предоставляющая высокоуровневые структуры данных, простые в использовании и интуитивно понятные.

В ней есть много встроенных методов для группировки, комбинирования данных и их фильтрации, а также анализа временных рядов.

Pandas может с легкостью извлекать данные из различных источников, таких как базы данных SQL, файлы CSV, Excel, JSON, и манипулировать этими данными для осуществления операций с ними.

Matplotlib для визуализации данных

Самое лучшее и замысловатое машинное обучение бессмысленно, если вы не можете рассказать о нем другим людям.

Как же извлекать пользу из всех имеющихся у вас данных? Как вдохновлять бизнес-аналитиков и рассказывать им истории, полные «озарений»?

В этом вам поможет Matplotlib. Это стандартная библиотека Python, которую используют для создания графиков все люди, занимающиеся наукой о данных. Она достаточно низкоуровневая, а значит, требует больше команд для генерации хорошо выглядящих графиков и фигур, чем более продвинутые библиотеки.

С другой стороны, она гибкая. Оперируя достаточным количеством команд, вы сможете создать практически любой график. Вы можете строить разнообразные диаграммы, от гистограмм и диаграмм рассеяния до графиков с не-декартовыми координатами.

Эта библиотека поддерживает GUI-бэкенд во всех операционных системах, а также может экспортировать графики в распространенных форматах (PDF, SVG, JPG, PNG, BMP, GIF).

Seaborn – еще одна библиотека для визуализации данных

Seaborn это популярная библиотека визуализации, которая строит графики на основе Matplotlib. Это библиотека более высокого уровня, а значит, с ее помощью проще генерировать определенные виды графиков, в том числе тепловые карты, временные ряды и скрипичные графики.

Заключение

Это коллекция самых важных библиотек Python для машинного обучения. Если вы планируете работать с Python и/или в сфере науки о данных, стоит обратить на них внимание и познакомиться с ними поближе.

Если считаете, что в этом списке должны быть и другие библиотеки – поделитесь в комментариях!

KVERNER

Matlab Simulink Python Java HELP Работы программиста профессионала

8 лучших курсов по изучению Python в 2020 году

Глобальная команда из 50+ экспертов составила список 8 лучших онлайн-курсов по питону в 2020 году. Эти ресурсы помогут вам изучить Python с нуля и подходят для всех уровней учащихся. Более 132 000 профессионалов и студентов уже воспользовались этим сборником.

1. Google’s Python курсы (Google)

Python является одним из ключевых языков, используемых в Google наряду с C ++ и Java. В попытке рассказать большему количеству людей об этом языке, Google создали этот класс для людей с небольшим или нулевым опытом программирования. Начните с понимания терминологии, прежде чем переходить к промежуточным понятиям, таким как работа с текстовыми файлами, настройка соединений HTTP и другое.

Небольшие рекомендации и сведенья о курсе:

  • Настройте среду перед началом лекций.
  • Доступный учебный материал полезен как опытным, так и неопытным людям.
  • Множество упражнений по кодированию для практического обучения,
  • Участвуйте в форуме, задавайте вопросы и делитесь идеями.

Рейтинг: 4.4 из 5

2. Онлайн курс Crash Course (Udemy)

Поиск подходящей программы может быть тяжелым испытанием с множеством вариантов, доступных онлайн. В Udemy вы можете найти подходящий класс Python для вас, пройдя короткий тест. Некоторые из бестселлеров включают полный Bootcamp, ML с практическими уроками, полную разработку стека и финансовый анализ. По окончании уроков у вас есть возможность подать заявку на соответствующую работу, начать свой независимый бизнес или перейти на более продвинутые специальности.

Небольшие рекомендации и сведенья о курсе:

  • Создайте прочную основу понимания в языке.
  • Работайте над примерами, основанными на реальных сценариях, и находите эффективные решения.
  • Научитесь кодировать как профессионал, следуя советам и советам инструктора.
  • Лекции + Упражнения + Задания + Загружаемые ресурсы + Полный доступ к жизни
  • Зарегистрируйтесь для получения сертификатов по номинальной цене.

Рейтинг: 4.5 из 5

3. Бесплатный вводной курс по Python (Datacamp)

Datacamp известен тем, что он предлагает самые ценные курсы программирования для всех типов людей. Этот интерактивный курс по Python познакомит вас с основными понятиями Python, а также познакомит вас с некоторыми продвинутыми понятиями, такими как списки Python, функции и пакеты и т. Д. Он состоит из четырех различных глав, среди которых основы Python самые простые и единственный бесплатный раздел, доступный с курсом. Пройдя этот курс, вы сможете получить глубокие знания о программировании на Python и о том, как его применять для анализа различных данных. Кроме того, вы будете обязаны получить сертификат об окончании после окончания курса.

Читать еще:  Дистанционное обучение международные связи тенденция

Небольшие рекомендации и сведенья о курсе:

  • Один из лучших интерактивных курсов Python, доступных онлайн, которые помогут вам развить свои навыки
  • Узнайте, как использовать Python в интерактивном режиме, с помощью сценария, создать свои первые переменные и познакомиться с основными типами данных Python.
  • Узнайте, как хранить, получать доступ и развертывать данные в списках, что является первым шагом к работе с большими объемами данных.
  • Изучите использование функций, методов и пакетов Python, которые позволяют эффективно использовать программирование на Python
  • получить достаточные знания о NumPy, фундаментальном пакете Python, который позволит вам эффективно практиковать науку о данных

Рейтинг: 4.6 из 5

4. Microsoft Python сертификация (edX)

Фактом является то, что Python является одним из языков программирования, который может использоваться практически во всех современных и новых технологических областях. Так что, если вы беспокоились об изучении языка и не знаете, с чего начать, тогда это место. В этой практической программе вы познакомитесь с деталями уровней и концепций этого языка. Изучив основные типы данных и переменные, вы можете посмотреть на строки, входные данные, тестирование, условия, циклы и форматирование. К концу сертификации вы сможете писать программы, которые взаимодействуют с пользователями, запрашивая их для ввода и предоставляя соответствующие результаты.

Небольшие рекомендации и сведенья о курсе:

  • Не требуется предварительных условий для зачисления на курс.
  • Достаточно практических упражнений и проектов с использованием ноутбуков Jupyter на Azure без необходимости какой-либо установки или настройки.
  • Изучите основы устранения неполадок для вашего кода.
  • Градуированные задания помогут вам отслеживать ваши успехи на протяжении всей программы.
  • Содержание курса доступно бесплатно, и сертификация может быть добавлена за дополнительную плату.

Рейтинг: 4.5 из 5

5. Бесплатные курсы Python и сертификация (edX)

Если вы заинтересованы в прохождении курса Python, созданного высшими предприятиями или колледжами ведущих университетов мира, то edX предлагает для вас огромный список курсов и учебных пособий по Python. Есть несколько курсов на выбор, каждый из которых создан такими университетами, как Гарвард, Массачусетский технологический институт и т.д. От введения в Python до Машинного обучения с помощью Python вы можете изучать каждую тему с помощью этих курсов. Более того, большинство из этих курсов абсолютно бесплатны без каких-либо скрытых платежей. Кроме того, после завершения любого из курсов вы получите сертификат об окончании от edX.

Небольшие рекомендации и сведенья о курсе:

  • Список курсов для самостоятельного изучения, которые предназначены для того, чтобы дать начинающим обзор программирования на Python
  • Изучите основы написания программ на Python, как создавать алгоритмы и как тестировать и отлаживать код Python.
  • Изучите основополагающие принципы написания расширенного анализа данных и машинного обучения скрипту Python.
  • Понимать важность Python в Data Science и как вы можете стать специалистом по данным после изучения передовых концепций Python
  • Получите доступ к нескольким практическим упражнениям, викторинам и практическим проектам на основе выбранного вами курса.
  • Доступ к каждому содержанию курса без градуированных заданий в течение ограниченного периода

Рейтинг: 4.7 из 5

6. Coursera Python сертификаты и курсы (Coursera)

При широком распространении Python неудивительно, что он был признан одним из самых любимых языков программирования в мире. Coursera предлагает серию программ и сертификатов, чтобы начать путешествие или повысить свои навыки в этом языке. Начинающие могут выбрать такие темы, как программирование для всех и статистика с использованием Python, тогда как опытные учащиеся могут использовать свои существующие знания и направлять их в такие области, как ML, AI и визуализация.

Небольшие рекомендации и сведенья о курсе:

  • У программистов для новичков нет предпосылок.
  • Выберите из отдельных курсов, степеней и специализаций.
  • Узнайте о структурах данных, функциях, синтаксисе и семантике.
  • Учитесь где угодно и когда угодно с гибкими классами.
  • Аудит видео бесплатно и получить проверенный сертификат за дополнительную плату.

Рейтинг: 4.6 из 5

7. Полный курс для веб-разработчиков 2.0 включая Python

Если вы не просто хотите освоить Python, но хотите стать экспертом по всему языку, то этот идеально подходит для вас. Более 150 000 студентов уже воспользовались этим учебным пособием по веб-разработке, и он получил высокий рейтинг одобрения 4,6 из 5. Роб Персиваль — ваш увлеченный программист, который также изучал математику в Кембриджском университете! Он предлагает 30 часов высококачественного контента в этом курсе, который, несомненно, оставит вас глубоко удовлетворенным.

Небольшие рекомендации и сведенья о курсе:

  • Все о HTML 5, CSS 3, Javascript, jQuery, Bootstrap 4, WordPress, PHP, MySQL и других платформах
  • Введение в Python
  • Переменные, массивы, циклы, функции, операторы If в Python
  • Как создавать мобильные приложения на основе HTML
  • Разработка интерфейса
  • Торги для внештатных проектов развития
  • Подача заявки на роль младшего разработчика

Рейтинг: 4.6 из 5

8. Изучение Python 3 курс от (Codecademy)

Если вы заинтересованы в изучении самой последней версии одного из самых популярных языков программирования в мире, тогда этот курс стоит проверить. Эти уроки Codecademy предоставляют отличное введение как в фундаментальные концепции программирования, так и в Python. Улучшения, внесенные в эту версию языка, позволяют повысить эффективность и простоту кода.

Небольшие рекомендации и сведенья о курсе:

  • Отличный курс для начала работы с Python без какого-либо предварительного опыта.
  • Изучите синтаксис, типы данных и основные функции языка.
  • Много упражнений по программированию, чтобы отточить навыки программирования.
  • Интерактивные примеры кода делают уроки веселыми и легкими для понимания.
  • Вы также можете записаться на бесплатный курс Python на Codecademy

Рейтинг: 4.8 из 5

Мы надеемся, что вы нашли курсы, соответствующие вашим потребностям. Мы желаем вам всего наилучшего в вашем учебном путешествии 🙂

Полный курс машинного обучения с Python

The Complete Machine Learning Course with Python

Создайте портфель из 12 проектов по машинному обучению с помощью Python, SVM, регрессии, машинного обучения без контроля и многого другого! Благодаря новым разделам, а также обновленному и улучшенному контенту, вы получаете все, что нужно для освоения машинного обучения в одном курсе! Сфера машинного обучения постоянно развивается, и мы хотим, чтобы студенты имели самую свежую информацию и практические навыки, доступные для них:

Новые разделы включают в себя:

  • Основы глубокого обучения, охватывающие такие темы, как различие между классическим программированием и машинным обучением, различают машинное и глубокое обучение, строительные блоки нейронных сетей, описания тензорных операций, категории машинного обучения и передовые концепции, такие как избыточное и недостаточное оснащение, регуляризация, отсев, проверки и тестирования и многое другое.
  • Computer Vision в форме сверточных нейронных сетей, охватывающих построение слоев, понимание фильтров / ядер, а также сложные темы, такие как перенос обучения и расширение возможностей.

И следующие разделы были улучшены и добавлены:

  • Ввесь код был обновлен для работы с Python 3.6 и 3.7
  • Код был реорганизован для работы с Google Colab
  • Глубокое обучение и НЛП
  • Бинарные и мультиклассовые классификации с глубоким обучением
  • Получите самую актуальную информацию о машинном обучении, и получите ее за один курс!

Средняя зарплата инженера по машинному обучению в США составляет 166 000 долларов! К концу этого курса у вас будет Портфолио из 12 проектов по машинному обучению, которые помогут вам найти работу своей мечты или разрешить реальные проблемы в бизнесе, на работе или в личной жизни с помощью алгоритмов машинного обучения.

Читать еще:  Обучение в альфа банке

Приходите изучать машинное обучение с Python. Этот увлекательный курс с Anthony NG, старшим преподавателем в Сингапуре.

Создание мощных моделей машинного обучения для решения любых проблем

Вы пройдете от новичка до чрезвычайно высокого уровня, и ваш инструктор будет шаг за шагом строить каждый алгоритм вместе с вами.

К концу курса у вас будут обученные алгоритмы машинного обучения, чтобы классифицировать цветы, прогнозировать цену дома, определять почерк или цифры, определять персонал, который, скорее всего, уйдет преждевременно, обнаруживать раковые клетки и многое другое!

В рамках курса вы научитесь:

  • Настройте среду разработки Python правильно
  • Получите полный набор инструментов машинного обучения для решения большинства реальных проблем
  • Понимать различные метрики производительности регрессионных, классификационных и других мл алгоритмов, такие как R-квадрат, MSE, точность, матрица путаницы, предвидение, отзыв и т. д. И когда их использовать.
  • Объедините несколько моделей с помощью упаковки, повышения или укладки
  • Используйте неконтролируемые алгоритмы машинного обучения (ML), такие как иерархическая кластеризация, кластеризация k-средних и т. д., Чтобы понять ваши данные
  • Разработка в Jupyter (IPython), Spyder и различных IDE
  • Общайтесь визуально и эффективно с Matplotlib и Seaborn
  • Использование SVM для распознавания рукописного ввода и задач классификации в целом
  • Используйте деревья решений для прогнозирования истощения персонала
  • Применить правило ассоциации к наборам данных розничных магазинов
  • И многое, многое другое!

13 лучших библиотек глубокого машинного обучения для Python

Когда дело касается задач машинного обучения, искусственного интеллекта, Deep Learning и данных, Python безусловно продолжает лидировать. Согласно builtwith.com , 45% технологических компаний предпочитают использовать Python для реализации ИИ и машинного обучения.

Ниже приведен список 13 самых популярных библиотек Python, используемых при решении многочисленных задач глубокого машинного обучения Конечно, список этот субъективен. Многие библиотеки могут быть легко отнесены к нескольких категориям искусственного интеллекта. Например, TensorFlow включен в наш список, а Keras, наоборот, считается библиотекой Machine Learning. Связано это с тем, что Keras скорее библиотека для «конечного пользователя», такая как SKLearn. Что отличает её от TensorFlow, которая больше привлекает исследователей и «инженеров-машинистов».

Рисунок 1: 13 лучших библиотек Deep Learning на Python, Commits и Contributors . Размер метки пропорционален количеству звезд.

Теперь давайте перейдем непосредственно к списку (цифры с GitHub получены 23 октября 2018 года):

1. TensorFlow

( Contributors — 1 700, Commits — 42 256, ✬✬✬ — 112 591)

TensorFlow — библиотека с открытым исходным кодом для численного расчета с использованием графов потока данных. Узлы графа представляют собой математические операции, а ребра — многомерные массивы данных (тензоры), которые текут между ними. Такая гибкая архитектура позволяет развернуть вычисления на одном или нескольких процессорах или графических процессорах на рабочем столе, сервере или мобильном устройстве без переписывания кода.

2. PyTorch

( Contributors — 806, Commits — 14 022, ✬✬✬ — 20 243)

PyTorch — это пакет Python, который обеспечивает две функции высокого уровня:

  1. Расчет тензора (например, NumPy) с сильным ускорением GPU
  2. Глубокие нейронные сети, построенные на ленточной автоградной системе

Вы можете использовать свои любимые пакеты Python, такие как NumPy, SciPy и Cython для расширения PyTorch при необходимости.

3. Apache MXNet

( Contributors — 628, Commits — 8 723, ✬✬✬ — 15 447)

Apache MXNet (инкубация) — база Deep Learning, ориеннтрованная на эффективность и гибкость. Это позволяет сочетать символическое и императивное программирование для увеличения эффективности и производительности. По своей сути MXNet содержит динамический планировщик зависимостей, который «на лету» автоматически распараллеливает как символические, так и императивные операции.

4. Theano

( Contributors — 329, Commits — 28 033, ✬✬✬ — 8 536)

Theano — библиотека Python, которая позволяет эффективно определять, оптимизировать и оценивать математические выражения, содержащие многомерные массивы. Она может использовать графические процессоры и выполнять эффективную символическую дифференциацию.

5. Caffe

( Contributors — 270, Commits — 4 152, ✬✬✬ — 25 927)

Caffe — база Deep Learning, разработанная с учетом выраженности, скорости и модульности. Разработана в Berkeley AI Research (BAIR) / The Berkeley Vision and Learning Center (BVLC) и их сообществами.

6. fast.ai

( Contributors — 226, Commits — 2 237, ✬✬✬ — 8 872)

Библиотека fastai упрощает обучение быстрым и точным нейронным сетям, используя современные передовые методы. Для начала ознакомьтесь с сайтом fast.ai . Библиотека основана на исследованиях в области передовых методов Deep Learning, проводимых на fast.ai, и включает в себя «из коробки» поддержку моделей видения, текста, таблиц и коллабов (совместная фильтрация).

7. CNTK>/a>

( Contributors — 189, Commits — 15 979, ✬✬✬ — 15 281)

Инструментарий Microsoft Cognitive Toolkit ( https://cntk.ai ) — унифицированный инструментарий Deep Learning, который описывает нейронные сети как серию вычислительных шагов через ориентированный граф. В этом ориентированном графе листовые узлы представляют входные значения или сетевые параметры, тогда как другие узлы представляют собой матричные операции на своих входах. CNTK позволяет пользователям легко реализовывать и комбинировать популярные типы моделей, такие как DNN прямой линии связи, сверточные сети (CNN) и свёрточные сети (RNNs / LSTM).

8. TFLearn

( Contributors — 118, Commits — 599, ✬✬✬ — 8 632)

TFlearn — модульная и прозрачная библиотека Deep Learning, построенная на основе Tensorflow. Она был разработана для предоставления API для TensorFlow более высокого уровня, облегчающий и ускоряющий эксперименты, оставаясь полностью прозрачным и совместимым.

9. Lasagne

( Contributors — 64, Commits — 1 157, ✬✬✬ — 3 534)

Lasagne — легкая библиотека для создания и обучения нейронных сетей в Теано. Она поддерживает сети передачи данных, такие как сверточные нейронные сети (CNN), свёрточные сети, включая Long Short-Term Memory (LSTM) и любую их комбинацию.

10. nolearn

( Contributors — 14, Commits — 389, ✬✬✬ — 909)

Nolearn содержит множество оберток и абстракций вокруг существующих нейронных сетевых библиотек, в первую очередь Lasagne, а также несколько модулей для машинного обучения. Весь код написан для совместимости с scikit-learn.

11. Elephas

( Contributors — 13, Commits — 249, ✬✬✬ — 1 046)

Elephas — это расширение Keras, которое позволяет вам запускать распределенные модели Deep Learning в масштабе с помощью Spark. В настоящее время Elephas поддерживает ряд приложений, в том числе:

  1. Параллельная подготовка моделей Deep Learning
  2. Распределенная оптимизация гиперпараметров
  3. Распределенное обучение ансамблевым моделям

12. spark-deep-learning

( Contributors — 12, Commits — 83, ✬✬✬ — 1 131)

Deep Learning Pipelines предоставляет высокоуровневые API для масштабируемого Deep Learning на Python с Apache Spark. Библиотека исходит от Databricks и использует Spark для двух самых сильных аспектов:

  1. В духе Spark и Spark MLlib он предоставляет простые в использовании API, которые позволяют осуществлять глубокое обучение в очень немногих строках кода.
  2. Он использует мощный распределенный движок Spark для глубокого изучения массивных наборов данных.

13. Distributed Keras

( Contributors — 5, Commits — 1 125, ✬✬✬ — 523)

Распределенная Keras — это распределенная система Deep Learning, построенная поверх Apache Spark и Keras, с упором на« современные »распределенные алгоритмы оптимизации. Мы разработали структуру таким образом, чтобы новый распределенный оптимизатор мог быть реализован с легкостью, что позволило человеку сосредоточиться на исследованиях.

Следите за следующей частью этой серии, в которой основное внимание уделяется Укреплению знаний и библиотекам эволюционных вычислений, которые будут опубликованы в течение следующих нескольких недель!


13 лучших библиотек глубокого машинного обучения для Python , опубликовано К ВВ, лицензия — Creative Commons Attribution-NonCommercial 4.0 International.

Добавить комментарий Отменить ответ

Для отправки комментария вам необходимо авторизоваться.

Ссылка на основную публикацию
Adblock
detector