01.11.2022 | 10 недель | Открытое образование |
О курсе
В течение 10 недель в формате кратких мини-лекций на примере задач компьютерной и теоретической лингвистики старший преподаватель Школы лингвистики НИУ ВШЭ Георгий Алексеевич Мороз расскажет слушателям про методы статистического анализа, а также про основы языка программирования R.
Привычные курсы по языкам программирования для лингвистов обычно основаны преимущественно на статистической обработке данных и их визуализации. Отличительной чертой данного онлайн-курса является то, что в него были дополнительно интегрированы все необходимые для лингвистов разделы, направленные на обработку и работу со строками естественного языка. Учебная программа не предполагает наличия у слушателя предварительных знаний по математике, программированию и лингвистике – при понимании базовых элементов пройти обучение можно буквально с нуля.
Содержательная часть программы помогает изучить основы статистического анализа данных. Также слушатели познакомятся со способами построения кластеризации и регрессий. Эти знания помогут в создании надежного фундамента для последующего расширенного обучения на занятиях, предназначенных для продвинутого статистического анализа и машинного обучения.
Для выполнения практических заданий вам потребуется установить программы R и RStudio. Пакеты необходимые для установки, будут перечислены в ходе лекций.
Результат
- Готовность использовать основные законы научных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования в лингвистике.
Умения
-
Умение осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач.
Знания
- Язык программирования R.
- Основы статистики.
Навыки
- Способность самостоятельно работать на компьютере с использованием современного общего и профессионального прикладного ПО.
- Способность использовать для решения аналитических и исследовательских задач современные технические средства и информационные технологии.
Формируемые компетенции
О преподавателях

Входные требования
Содержание курса
- Введение в R: основные элементы, функции, циклы.
- Продвинутая обработка данных: пакеты tidyr и dplyr.
- Работа со строками: строки в R, регулярные выражения.
- Визуализация данных: base R vs. ggplot2.
- Интерактивная визуализация: rmarkdown, plotly, lingtypology.
- Работа с текстами: пакет tidytext.
- Введение в статистику: основы фриквентисткой статистики, формулировка гипотез.
- Корреляция и линейная регрессия.
- Кластеризация.
- Логистическая регрессия.
Профессии, специальности и направления подготовки | 45.03.03 Фундаментальная и прикладная лингвистика
|
Область деятельности | Гуманитарные науки
|
Дата окончания записи | 01.01.2030 |
Трудоёмкость в з.е. | 3.0 |
Количество лекций | 10 |
Дата ближайшего старта | 01.11.2022 |
Дата окончания | 01.01.2030 |
ID курса | 6f1e3d4fa20c4b83afce50949fd97d3d |
К-во обучающихся на версии курса | 13049 |
Язык | Русский |
Длительность | 10 недель |
Сертификат | Есть |
Версия | 12 |