Обработка естественного языка с помощью глубокого обучения на Python [Udemy] [Lazy Programmer Inc.]

Admin · 2 Авг 2024

Вы когда-нибудь задумывались, как на самом деле работают такие технологии искусственного интеллекта, как OpenAI ChatGPT, GPT-4, DALL-E, Midjourney и Stable Diffusion? В этом курсе вы узнаете об основах этих революционных приложений.
В этом курсе мы рассмотрим НЛП (обработку естественного языка) с помощью глубокого обучения.

Ранее вы узнали о некоторых основах, например о том, что многие проблемы НЛП - это обычные проблемы машинного обучения и науки о данных, а также о таких простых и практичных методах, как пакет слов и матрицы "термин-документ".

С их помощью мы можем делать довольно крутые вещи, например, обнаруживать спам в электронной почте, писать стихи, верстать статьи и группировать похожие слова.

В этом курсе я покажу вам, как делать еще более удивительные вещи. В этом курсе мы изучим не 1, а 4 новые архитектуры.

Первая - word2vec.

В этом курсе я покажу вам, как именно работает word2vec, от теории до реализации, и вы увидите, что это всего лишь применение уже известных вам навыков.

Word2vec интересен тем, что он волшебным образом отображает слова в векторное пространство, в котором можно найти аналогии, например:

король - мужчина = королева - женщина
Франция - Париж = Англия - ЛондонДекабрь - ноябрь = июль - июнь

Для новичков, которым алгоритмы кажутся сложными и которые просто хотят использовать библиотеку, мы продемонстрируем использование библиотеки Gensim для получения предварительно обученных векторов слов, вычисления сходства и аналогий и применения этих векторов слов для построения текстовых классификаторов.
Мы также рассмотрим метод GloVe, который также находит векторы слов, но использует технику, называемую матричной факторизацией, которая является популярным алгоритмом для рекомендательных систем.

Удивительно, но векторы слов, полученные GLoVe, не уступают векторам, полученным с помощью word2vec, а обучать его гораздо проще.

Мы также рассмотрим некоторые классические проблемы НЛП, такие как тегирование частей речи и распознавание именованных сущностей, и используем рекуррентные нейронные сети для их решения. Вы увидите, что практически любая задача может быть решена с помощью нейронных сетей, но также узнаете об опасностях, связанных с чрезмерной сложностью.

Наконец, вы узнаете о рекуррентных нейронных сетях, которые в итоге помогут нам решить проблему отрицания в анализе настроения. Рекурсивные нейронные сети используют тот факт, что предложения имеют древовидную структуру, и мы наконец-то можем отказаться от наивного использования мешков слов.

Все материалы, необходимые для этого курса, можно скачать и установить БЕСПЛАТНО. Большую часть работы мы будем выполнять в Numpy, Matplotlib и Theano. Я всегда готов ответить на ваши вопросы и помочь вам на пути к науке о данных.

Этот курс посвящен тому, как создавать и понимать, а не только тому, как использовать. Любой может научиться использовать API за 15 минут после прочтения документации. Речь идет не о том, чтобы "запомнить факты", а о том, чтобы "увидеть все своими глазами", экспериментируя. Это научит вас визуализировать то, что происходит в модели изнутри. Если вы хотите получить не просто поверхностный взгляд на модели машинного обучения, этот курс для вас.

Увидимся на занятиях!

Для просмотра скрытого содержимого необходимо Войти или Зарегистрироваться.

Поиск

Поиск

Обработка естественного языка с помощью глубокого обучения на Python [Udemy] [Lazy Programmer Inc.]

Admin

Администратор