Вы узнаете, как создать диалогового робота, автоматизировать и ускорить поиск нужной информации в больших массивах данных. Поймёте, как написать программу, умеющую различать интонацию, с которой написаны сообщения в соцсетях.
Сможете научить компьютер понимать естественные языки и извлекать из этого пользу.
- Как передать текст компьютеру?
Какие признаки бывают у объектов?Стемминг: как отсекать лишнее?Лемматизация: что делать с морфологическими омонимами?Токенизация и лемматизация русских текстов с помощью библиотеки spaCy. Практика.Ищем устойчивые сочетания слов. Статистика VS лингвистика.Выбор значимых элементов из «мешка слов» на основе критерия χ2.Векторизация текстов на основе TF-IDF и сокращение «мешка слов» на основе критерия χ2. Практика.Применение коллокатора для «умного» выявления наиболее частотных словосочетаний. Практика.
- Как научить компьютер понимать тексты?
Методы обучения с учителем. Логистическая регрессия.Как обучать логистическую регрессию?Что делать, если компьютер переучился?Как оценить качество логистической регрессии?Точность, полнота и F-мера для оценки качества классификации.Регуляризация и подбор гиперпараметров логистической регрессии.Применение библиотеки scikit-learn для анализа тональности твитов методом логистической регрессии. Практика.Оценка качества алгоритма классификации. Практика.Как улучшить качество классификатора? Практика.Как выбрать оптимальные гиперпараметры? Практика.
- Что такое разговорный искусственный интеллект?
О чём этот курс?Машинное обучение. Когда оно бывает вредным?Виды машинного обучения.История развития искусственного интеллекта.Умеет ли искусственный интеллект общаться?Как анализировать целые тексты?Обучение с учителем. Классификация и регрессия.
- Как вырастить деревья решений?
Для чего нужны деревья решений?Базовый алгоритм.Алгоритм ID3.Как бороться с переобучением деревьев?Дискретизация количественных признаков.Выращиваем деревья решений для анализа тональности сообщений. Практика.Выращиваем деревья решений без ограничений по глубине. Практика.
- Вместе мы сила! Коллективы решающих алгоритмов
Теоретические основы ансамблирования.Бэггинг. Как повысить разнообразие алгоритмов в коллективе?Бэггинг и дилемма смещения-разброса.Построение ансамбля алгоритмов для задачи анализа тональности сообщений. Практика.Использование бэггинга для логистической регрессии. Практика.Бустинг.Градиентный бустинг.Градиентное усиление деревьев решений. Практика.Смесь экспертов.Многоярусное обобщение. Стекинг.Иерархический ансамбль. Стекинг. Практика.
- Проблема объяснимости: почему алгоритм такой?
Интерпретируемость машинного обучения.Значимость признаков на основе перестановок.Вектор Шепли.Значимость слов для классификации текстов: «белый ящик» и «чёрный ящик». Практика.Вероятностная тематическая модель.Вероятностный латентно-семантический анализ.Латентное размещение Дирихле.Использование вероятностных тематических моделей для анализа текстового корпуса. Практика.Подводим итоги.
- Вместе мы сила! Коллективы решающих алгоритмов
Теоретические основы ансамблирования.Бэггинг. Как повысить разнообразие алгоритмов в коллективе?Бэггинг и дилемма смещения-разброса.Построение ансамбля алгоритмов для задачи анализа тональности сообщений. Практика.Использование бэггинга для логистической регрессии. Практика.Бустинг.Градиентный бустинг.Градиентное усиление деревьев решений. Практика.Смесь экспертов.Многоярусное обобщение. Стекинг.Иерархический ансамбль. Стекинг. Практика.
- Что такое разговорный искусственный интеллект?
О чём этот курс?Машинное обучение. Когда оно бывает вредным?Виды машинного обучения.История развития искусственного интеллекта.Умеет ли искусственный интеллект общаться?Как анализировать целые тексты?Обучение с учителем. Классификация и регрессия.
- Как передать текст компьютеру?
Какие признаки бывают у объектов?Стемминг: как отсекать лишнее?Лемматизация: что делать с морфологическими омонимами?Токенизация и лемматизация русских текстов с помощью библиотеки spaCy. Практика.Ищем устойчивые сочетания слов. Статистика VS лингвистика.Выбор значимых элементов из «мешка слов» на основе критерия χ2.Векторизация текстов на основе TF-IDF и сокращение «мешка слов» на основе критерия χ2. Практика.Применение коллокатора для «умного» выявления наиболее частотных словосочетаний. Практика.
- Проблема объяснимости: почему алгоритм такой?
Интерпретируемость машинного обучения.Значимость признаков на основе перестановок.Вектор Шепли.Значимость слов для классификации текстов: «белый ящик» и «чёрный ящик». Практика.Вероятностная тематическая модель.Вероятностный латентно-семантический анализ.Латентное размещение Дирихле.Использование вероятностных тематических моделей для анализа текстового корпуса. Практика.Подводим итоги.
- Как научить компьютер понимать тексты?
Методы обучения с учителем. Логистическая регрессия.Как обучать логистическую регрессию?Что делать, если компьютер переучился?Как оценить качество логистической регрессии?Точность, полнота и F-мера для оценки качества классификации.Регуляризация и подбор гиперпараметров логистической регрессии.Применение библиотеки scikit-learn для анализа тональности твитов методом логистической регрессии. Практика.Оценка качества алгоритма классификации. Практика.Как улучшить качество классификатора? Практика.Как выбрать оптимальные гиперпараметры? Практика.
- Как вырастить деревья решений?
Для чего нужны деревья решений?Базовый алгоритм.Алгоритм ID3.Как бороться с переобучением деревьев?Дискретизация количественных признаков.Выращиваем деревья решений для анализа тональности сообщений. Практика.Выращиваем деревья решений без ограничений по глубине. Практика.