Date Редакция Категория edu Теги курсы

Программа курса

Часть 1. ОСНОВЫ РАБОТЫ С R

1. Введение в R

02.09.2015 История R. Краткий обзор возможностей. Литература. Установка. Арифметические операции. Имена объектов. Типы данных. Векторы, матрицы и массивы. Установка и запуск пакетов расширений. Последовательные операции (magrittr). Справка (?, виньетки, rdocumentation.org). Лабораторная работа №1.

2. Векторизация и управляющие структуры языка. Простейшее рисование

09.09.2015 Логическая индексация. Векторизация вычислений. Циклы и условные операторы. Функция plot. Параметры графика (par). Работа в среде (рабочее пространство, история команд, setwd, getwd). Функции, созданные пользователем. Строки: конкатенация (paste, paste0), разделение. Лабораторная работа №2.

3. Списки и таблицы

16.09.2015 Списки. Создание списков. Изучение содержимого (class, str). Доступ к элементам. Групповые операции (lapply, sapply). Списки как основа для таблиц. Таблицы. Создание. Объединение таблиц. Имена строк и столбцов. Выбор элементов. Наборы данных, поставляемые с R. Лабораторная работа №3.

4. Ввод и вывод данных. Продолжение графики

23.09.2015 Чтение строк из текстовых файлов (readLines). Чтение таблиц (read.table) и файлов специального вида (csv). Запись таблиц данных (write.table). Запись данных в текстовый файл (write). Запись и сохранения состояния произвольного объекта (save, load). Несколько графиков в общих осях и в разных осях. Графики в отдельных окнах. Графические устройства. Сохранение результатов рисования в файл. Строки: выделение, поиск и замена подстроки. Лабораторная работа №4.

5. КОНТРОЛЬНАЯ РАБОТА №1

07.10.2015

Часть 2. ИЗВЛЕЧЕНИЕ ДАННЫХ

6. Постановка задачи. Основные проблемы

30.09.2015 Примеры задач с Upwork.com. Необходимые навыки для их решения. Использование структуры документа. Виды задач по степени структурированности. Дальнейшая программа лекций. Литература по извлечению данных. HTTP-запрос. Динамическая генерация страниц. Основы HTML.

7. XPath и rvest

21.10.2015 Поиск информации по XPath. Абсолютный и относительный пути. Класс и идентификатор элемента. Пакет rvest. Основные функции. Пример работы. Лабораторная работа №5.

8. CSS-селекторы

28.10.2015 CSS. Элементы div и span. СSS-селекторы. Поиск их в браузере (Firefox, Firebug, Firepath). Пакет rvest - поиск по CSS-селекторам. Основы языков поисковых сервисов Google и Яндекс. Лабораторная работа №6.

9. Аутентификация. Регулярные выражения.

04.11.2015 Аутентификация в rvest. Регулярные выражения (base). Лабораторная работа №7.

10. Отображение данных на карте. Анализ текстов

11.11.2015 Пакет leaflet. Геокодирование (ggmap). Анализ текста (пакет tm). Стемминг. Создание простейшей поисковой системы. Лабораторная работа №8.

11. Управление браузером. Получение данных через API интернет-сервисов

25.11.2015 Управление браузером с помощью RSelenium. Авторизация с помощью OAuth. Создание приложения. Анализ твитов.

12. КОНТРОЛЬНАЯ РАБОТА №2

02.12.2015

Часть 3. ХВОСТЫ

13. Подведение итогов курса. Пересдача контрольной работы

09.12.2015

14. ЭКЗАМЕН

16.12.2015



Комментарии

comments powered by Disqus