Системы искусственного интеллекта и машинное обучение
Искусственный интеллект (ИИ) - это комплекс методик математики, биологии, психологии, кибернетики и других наук, с помощью которого создаются технологии для написания
«интеллектуальных» программ и обучения компьютеров самостоятельному решению задач. Главная задача искусственного интеллекта - это моделирование человеческого разума.
ВИДЫ И ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
На сегодняшний день существует четыре основных вида ИИ:
- реактивные машины - системы ИИ, не имеющие памяти и решающие только определенные задачи. Они не способны формировать воспоминания и использовать полученный ранее опыт для выполнения своих функций;
- ограниченная память - системы с памятью, основанной на прошлом опыте. Однако этот опыт не сохраняется и не компилируется в библиотеке информации ИИ;
- теория разума - системы, понимающие человеческие эмоции и намерения, обладающие социальным интеллектом и участвующие в командной работе;
- самосознание - у систем ИИ этого типа формируется представление о себе, благодаря чему они полностью имитируют интеллект человека.
При создании ИИ чаще всего используются технологии:
- Машинного обучения. - это способность компьютера с системой ИИ принимать решения по результатам обработки данных, не придерживаясь четких схем и правил. Иными словами, машина становится способна к поиску закономерностей в сложных для человека задачах с большим числом параметров, к обнаружению точных ответов и верному прогнозированию;
- глубокого обучения - подраздела машинного обучения, позволяющего обнаруживать закономерности в огромным массивах информации (Big Data). Обработкой данных в технологии глубокого обучения занимаются искусственные нейронные сети (ИНС), созданные по аналогии с биологическими нейронными сетями. ИНС предназначаются для моделирования и обработки нелинейных отношений между входными и выходными сигналами. В ИНС применяется алгоритм самообучения, позволяющий им решать определенные задачи с учетом предыдущего опыта и минимальным числом ошибок;
- обработки и генерации естественного языка - составления программного обеспечения для трансформации любых данных в естественный язык, понятный компьютеру и используемый им для ответов человеку. Также в ИИ применяются технологии компьютерного зрения (для нахождения, распознавания и классификации объектов, извлечения данных из изображений, аналитики полученной информации) и анализа данных для выявления в них закономерностей и прогнозирования событий по его результатам.
ТЕХНОЛОГИИ МАШИННОГО ОБУЧЕНИЯ
Машинное обучение (machine learning, ML) - это одно из направлений разработки ИИ, основанное на выполнении компьютером множества сходных задач без использования прямых инструкций.
Машинное обучение базируется на трех основных понятиях:
- алгоритмы - специальные программы, «подсказывающие» компьютеру, каким источником данных необходимо воспользоваться. Для каждой задачи подбираются отдельные алгоритмы, составленные с расчетом на ускорение обработки данных и получение точного результата;
- наборы данных (датасеты) - информация (выборки данных) в виде текстовых, графических, видеофайлов, которую машина использует для накопления опыта при обучении. При этом для решения каждого конкретного типа задач в систему должны загружаться уникальные данные;
- признаки (свойства, метрики, фичи, features) - индивидуальные измеримые параметры наблюдаемых явлений, от правильности подбора которых зависит успешность и скорость machine learning.
Оптимальными для правильного проведения машинного обучения считаются выборки данных, составленные вручную и содержащие максимум информации разного качества - это позволяет компьютеру выявлять неочевидные взаимосвязи между данными и делать по ним полезные выводы.
Машинное обучение используется для решения задач по категориям:
- регрессии - составления прогнозов на основе выборки данных с отличающимися признаками;
- классификации - получения конкретного ответа на основании набора признаков;
- кластеризации - разбивки данных на несколько групп;
- уменьшения размерности - сокращения большого количества признаков для удобства их дальнейшей визуализации;
- выявления аномалий - поиска отличий в наборах данных от стандартной информации.
- обучение с учителем, которое предполагает использование полного набора снабженных признаками данных (размеченного датасета) для тренировки системы ИИ на всех стадиях ее создания; обучение без учителя, при котором машина самостоятельно выявляет закономерности, определяет признаки и классифицирует полученные данные;
- обучение с подкреплением - когда машине требуется правильно решить поставленные перед ней задачи во внешней среде, располагая несколькими возможными вариантами действия.
В зависимости от того, по какому принципу осуществляется ML, оно делится на:
Сегодня чаще всего для создания программ машинного обучения используются языки R, Python, Scala и Julia. Они поддерживаются многими интегрированными средами разработки, в частности, R-Studio, R-Brain, Visual Studio, Eclipse, PyCharm, Spyder, IntelliJ IDEA, Jupyter Notebooks, Juno.