Главная » Статьи » Студентам » Бизнес-аналитика |
В категории материалов: 11 Показано материалов: 1-10 |
Страницы: 1 2 » |
Сортировать по: Дате · Названию · Рейтингу · Комментариям · Просмотрам
Статистическая разведка (EDA) и интерактивная визуализация данных о проектах, принимавших участие на краудфандинговой платформе Kickstarter. Для анализа использована база данных по состоянию на янв. 2018 года. При этом сведения о проектах Kickstarter собраны с 2009 г. |
Рассматриваются основные шаги разведочного анализа данных (Exploratory Data Analysis - EDA) и их реализация средствами языка программирования R и программы R-Studio. В качестве набора данных используется csv файл, содержащий более 5000 записей с 28 характеристиками кинофильмов, включенных в интернет-базу кинофильмов (IMDb). |
Публикация о том, как с помощью языка программирования R (и программы R-Studio) можно найти короткие сообщения (твиты) в Twitter по интересующих Вас ключевым словам и фразам. Далее, рассматриваются широко распространенные способы обработки и анализа полученного текста, а также построение облака слов (word cloud). |
Учебный материал содержит методические указания к разработке модели множественной регрессии в R, начиная от подготовки данных, и заканчивая графиками частичных остатков. Для модели определяются доверительные интервалы, применяется тест Дарбина-Утсона на проверку наличия или остутствия автокорреляции. |
Сравнение несколько регрессий на основе одних и тех же данных. Корреляция. Графическое представление нескольких регрессий. Матрица Создание таблиц данных и построение моделей с категориальными переменными. Модели с и без взаимодействия категориальной переменной (фактора) и предиктора. |
Регрессионный анализ с помощью R. Определение линейной модели парной регрессии в R. Построение графика регрессионной линии. Интерпретация отчета: коэффициенты, F-критерий, P-значение, детерминация. |
Учебный материал показывает, как в R построить графики плотности вероятностей и интегральной функции распределения случайной величины, а также t-критерий Стьюдента для определения статистической значимости различий средних величин. |
Работа с табличными данными на языке программирования R. Во 2-й части изложены такие действия, как: импортирование данных из файлов; идентификация и смена текущей рабочей папки (директории); добавление в таблицу столбцов и строк; сортировка. |
Работа с табличными данными на языке программирования R. В 1-й части изложены такие действия, как: создание таблицы данных (Data Frame); переименование столбцов-переменных; выбор числа, строк и столбцов в качестве списков и подмножеств, в том числе и в соответствии с условиями; получение сведений о таблице. |
Материал о том, что такое вектор, и как создавать числовые, текстовые и логические векторы на языке программирования R. Операции над ними, индексирование. |