Развертывание программного окружения анализа данных и машинного обучения на базе отечественной ОС Astra Linux 1.7
Введение
Язык программирования R – мощное средство анализа данных и организации машинного обучения, в том числе используя глубокое обучение с популярными фреймворками TensorFlow и Keras. Проблема заключается в том, что в родном репозитории Astra Linux 1.7 на момент написания этого поста содержится интерпретатор языка R версии 3.5.1, что сильно ограничивает использование современных пакетов и паттернов программирования.
Развертвание программного окружения предусматривает несколько этапов: 1. Установка интерпретатора языка программирования R 2. Установка интегрированной среды разработки RStudio IDE 3. Установка необходимых нам пакетов R
Установку будем проводить на ОС Astra Linux 1.7 Базовая (версия 1.7.2)
Установка интерпретатора языка программирования R
Специализированных инструкций по Astra Linux в Интернете не много, однако учитывая что Astra Linux версии 1.7 основана на дистрибутиве Debian 10 (“buster”), будем руководствоваться инструкциями под эту ОС.
Для начала включим возможность подключения сторонних репозиториев для Debian в нашем Astra Linux.
Обновим список доступных для установки пакетов:
sudo apt update
Установим пакеты apt-transport-https
и ca-certificates
командой:
sudo apt install apt-transport-https ca-certificates
Установим пакет debian-archive-keyring
:
sudo apt install debian-archive-keyring
Теперь идем на сайт R CRAN и следуем инструкциям для Debian 10 Buster
- Редактируем
/etc/apt/sources.list
:
sudo nano /etc/apt/sources.list
- добавляем внизу конфигурационного файла строку
deb http://cloud.r-project.org/bin/linux/debian buster-cran40/
- Импортируем ключи, которыми подписываются пакеты в добавленном нами репозитории
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-key '95C0FAF38DB3CCAD0C080A7BDC78B2DDEABC47B7'
- Устанавливаем R 4.2.1
sudo apt update
sudo apt install -t buster-cran40 r-base
Установка интегрированной среды разработки RStudio IDE
- Переходим на сайт компании разработчика и скачиваем установочный
deb
пакет
https://www.rstudio.com/products/rstudio/download/#download
Нас интересует версия для Ubuntu 18+/Debian 10+
.
- Устанавливаем скачанный пакет:
sudo dpkg -i <имя пакета>
например
sudo dpkg -i ./rstudio-2022.07.1-554-amd64.deb
Скорее всего, установка завершится с ошибками из-за отсутсвия зависимостей пакета в системе. Установим их командой
sudo apt --fix-broken install
Установка необходимых нам пакетов R
- Установим системные библиотеки, от которых скорее всего будут зависеть используемые нами пакеты (имеется в виду
tideverse
)
sudo apt install libssl-dev libxml2-dev libcurl4-openssl-dev
- Заходим в RStudio IDE и устанавливаем пакеты либо через консоль R
install.packages("tidyverse")
либо через графическое окно управления пакетами (“Packages”) в Rstudio IDE.
Готово!