Складчина: Работа с данными на языке R [Специалист] [Александр Кораблин]
Обучение проходит на R 4.4
Целевое предназначение языка программирования R – это статистический анализ данных. Язык содержит широчайший спектр инструментов анализа данных, средств визуализации, создания документов и веб-приложений.
Что удобнее делать в R? В основном отмечают четыре вещи:
- статистический анализ данных;
- создание высококачественной визуализации данных;
- документирование статистических обсчетов;
- cоздание интерактивных веб-приложений.
Курс предназначен для всех специалистов, связанных с анализом данных.
Вы научитесь:
- работать с текстовыми файлами и файлами в формате Excel;
- использовать таблицы баз данных;
- используя R Markdown создавать динамические отчёты;
- включать в отчёты таблицы и графики;
- работать с библиотекой ggplot2 и создавать различные варианты визуализации данных;
- создавать и настраивать уровни (Layers) в ggplot2;
- работать с интерактивной графикой;
- создавать Web Shiny приложения для интерактивной работы с данными через Веб;
- выполнять отладку Web Shiny приложений.
Обучение по мировым стандартам позволяет нашим выпускникам работать в ведущих компаниях России и других стран. Они делают успешную карьеру и пользуются уважением работодателей.
Программа:
Модуль 1. Ввод/вывод данных (4 ак. ч.)
- Ввод/вывод данный в текстовый файл
- Работа с файлами Excel
- Чтение и запись таблиц баз данных
- Практика: Работа с СУБД MSSQL
- Введение в R Markdown
- Основы синтаксиса
- Включение кода на R в отчёт
- Использование фигур/графиков и таблиц в отчёте
- Создание параметризованных отчётов
- Практика: Создание отчёта R Markdown на примере задачи регрессионного анализа данных
- ДЗ: Создать отчёт по анализу данных из набора ggplot2::diamonds
- Введение в многоуровневую визуализацию данных (Layered Grammar)
- Использование атрибутов (координат X, Y, цвета, размера и формы) для создания пятимерных графиков
- Виды графиков: распределения, гистограммы, круговые диаграммы, временные ряды и т.д.
- Уровни (Layers) их задание и настройка в ggplot2
- Задание масштабов, координатных осей и легенды
- Группировка и разбиение данных на подмножества при визуализации (Facetting)
- Создание интерактивных графиков
- Практика: Использование библиотеки ggplot2 и ggvis для анализа и визуализации данных
- ДЗ: Создать графический отчёт по анализу данных из набора ggplot2::diamonds
- Обзор архитектуры Web Shiny приложения
- Элементы пользовательского ввода-вывода
- Управление внешним видом страницы
- Реактивное программирование и его поддержка в Shiny
- Интерактивная графика
- Реализация обратной связи с пользователем (user feedback)
- Отладка Shiny приложений
- Практика: Создание Web Shiny приложения на примере задачи построения классификатора
- ДЗ: Создать Web Shiny приложение для анализа данных из набора ggplot2::diamonds
Скрытая ссылка