ЛУЧШИЙ САЙТ ДЛЯ ВЕБ-РАЗРАБОТЧИКОВ

Python Учебник

Python СТАРТ Python Интро Python Установка Python Синтаксис Python Комментарии Python Переменные Python Типы данных Python Числа Python Кастинг Python Строки Python Булевы Python Операторы Python Списки Python Кортежи Python Сеты (Наборы) Python Словари Python If...Else Python Циклы While Python Циклы For Python Функции Python Лямбда Python Массивы Python Классы/Объекты Python Наследование Python Итераторы Python Область действия (видимости) Python Модули Python Даты Python Математика Python JSON Python RegEx Python PIP Python Try...Except Python Пользовательский ввод Python Форматирование строки

Обработка файлов

Python Обработка файлов Python Чтение файлов Python Запись/Создание файлов Python Удаление файлов

Python Модули

NumPy Учебник Pandas Учебник SciPy Учебник

Python Matplotlib

Matplotlib Интро Matplotlib Начало работы Matplotlib Pyplot Matplotlib Составление графика Matplotlib Маркеры Matplotlib Линия Matplotlib Лейблы Matplotlib Сетка Matplotlib Subplots Matplotlib Scatter Matplotlib Бары Matplotlib Гистограммы Matplotlib Круговые диаграммы

Машинное обучение

Начало работы Средний режим Стандартное отклонение Перцентиль Распределение данных Обычное распределение данных Диаграмма разброса Линейная регрессия Полиномиальная регрессия Множественная регрессия Шкала Тренировка/Тест Дерево решений

Python MySQL

MySQL Начало работы MySQL CREATE DATABASE MySQL CREATE TABLE MySQL INSERT INTO MySQL SELECT MySQL WHERE MySQL ORDER BY MySQL DELETE FROM MySQL DROP TABLE MySQL UPDATE MySQL LIMIT MySQL JOIN

Python MongoDB

MongoDB Начало работы MongoDB Создание базы данных MongoDB Создать коллекцию MongoDB Вставить MongoDB Найти MongoDB Запрос MongoDB Сортировать MongoDB Удалить MongoDB Drop коллекция MongoDB Обновление MongoDB Лимит

Python Справочник

Python Обзор Python Встроенные функции Python Строковые методы Python Методы списка Python Словарные методы Python Кортежные методы Python Set методы Python Файловые методы Python Ключевые слова Python Исключения Python Глоссарий

Справочник модулей

Модуль Random Модуль Запросов Модуль Статистики Модуль Math Модуль cMath

Python Как сделать?

Удалить копии списков Повернуть строку Добавить два числа

Python Примеры

Python Примеры Python Компилятор Python Упражнения Python Викторина Python Сертификат

Python. Уроки для начинающих

Машинное обучение

Машинное обучение заставляет компьютер учиться на изучении данных и статистики.

Машинное обучение - это шаг в сторону искусственного интеллекта (ИИ).

Машинное обучение - это программа, которая анализирует данные и учится предсказывать результат.

С чего начать?

В этом учебнике мы вернёмся к математике и изучим статистику, а также к тому, как вычислять важные числа на основе наборов данных.

Мы также узнаем, как использовать различные модули Python, чтобы получить нужные нам ответы.

И мы узнаем, как создавать функции, способные предсказывать результат на основе того, что мы узнали.


Набор данных

В компьютерном понимании набор данных - это любая совокупность данных. Это может быть что угодно, от массива до полной базы данных.

Пример массива:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

Пример базы данных:

CarnameColorAgeSpeedAutoPass
BMWred599Y
Volvoblack786Y
VWgray887N
VWwhite788Y
Fordwhite2111Y
VWwhite1786Y
Teslared2103Y
BMWblack987Y
Volvogray494N
Fordwhite1178N
Toyotagray1277N
VWwhite985N
Toyotablue686Y

Посмотрев на массив, мы можем предположить, что среднее значение, вероятно, составляет около 80 или 90, и мы также можем определить максимальное и минимальное значение, но что ещё мы можем сделать?

И, посмотрев на базу данных, мы можем увидеть, что самый популярный цвет - белый, а самому старому автомобилю 17 лет, но что, если бы мы могли предсказать, есть ли у автомобиля AutoPass, просто взглянув на другие значения?

Для этого и предназначено машинное обучение! Анализируем данные и прогнозируем результат!

В машинном обучении обычно работают с очень большими наборами данных. В этом учебнике мы постараемся максимально упростить понимание различных концепций машинного обучения и будем работать с небольшими, простыми для понимания наборами данных.


Типы данных

Для анализа данных важно знать, с какими типами данных мы имеем дело.

Мы можем разделить типы данных на три основные категории:

  • Числовой
  • Категориальный
  • Порядковый

Числовые данные представляют собой числа, и их можно разделить на две числовые категории:

  • Дискретные данные
    - числа, ограниченные целыми числами. Пример: количество проезжающих автомобилей.
  • Непрерывные данные
    - числа, которые имеют бесконечное значение. Пример: цена товара или размер товара.

Категориальные данные - это значения, которые нельзя сравнивать друг с другом. Пример: значение цвета или любые значения да / нет.

Порядковые данные похожи на категориальные данные, но их можно сравнивать друг с другом. Пример: школьные оценки, в которых A лучше, чем B, и т.д.

Зная тип данных вашего источника данных, вы сможете узнать, какой метод использовать при их анализе.

Вы узнаете больше о статистике и анализе данных в следующих разделах учебника на нашем сайте W3Schools на русском.