В рамках платформы Mail.Ru Cloud Solutions можно создать рабочее место data scientists.
Рабочее место data scientists — это образ виртуальной машины, включающий в себя популярные среды и инструменты для работы с машинным обучением.
Подключение сервиса
Для подключения рабочего места в личном кабинете нужно включить сервис Машинное обучение.
После подключения нажмите «Создать среду».
Откроется окно создания инстанса с готовым образом. О настройках остальных параметров инстанса читайте в статье «Быстрый запуск инстанса»
Состав продукта
CS а: Ubuntu 18.04 «Machine Learning»
Предустановленные компоненты:
- GPU драйвера NVIDIA
- NVIDIA CUDA
- NVIDIA CUDA Deep Neural Network Librayr (cuDNN)
- NVIDIA Docker
- Пакетный менеджер Anaconda
- Средства разработки C/C++ (gcc, g++, clang, gdb, make, cmake и д.р.)
- Системы контроля версий (git, svn, mercurial)
Работа с conda
Conda - кросс-платформенный пакетный менеджер для Python, R, Ruby, Lua, Scala, Java, JavaScript, C/C++, FORTRAN. Conda является продвинутым аналогом pip + virtualenv.
Репозитории conda содержат все популярные инструменты и фреймворки для машинного обучения, такие как pandas, scikit-learn, Matplotlib, XGBoost, LightGBM, PyTorch, TensorFlow и д.р.
Для начала работы с conda наберите "conda info":
conda info
Получение списка виртуальных окружений:
conda env list
Создание нового виртуального окружения с установленным пакетом tensorflow и Python версии 3.6:
conda create --name <НАЗВАНИЕ> python=3.6 tensorflow-gpu
Активация виртуального окружения:
source activate <НАЗВАНИЕ>
Поиск пакета:
conda search <НАЗВАНИЕ ПАКЕТА>
Установка пакета в текущее виртуальное окружение:
conda install <НАЗВАНИЕ ПАКЕТА>
Деактивация текущего виртуального окружения:
source deactivate
За более подробной информацией по работе с Conda обратитесь в официальную документацию. Для удобства рекомендуем воспользоваться шпаргалкой по работе с Conda.
Работа с Jupyter Notebooks
Образ содержит предустановленный Jupyter Notebooks. Для запуска сервера введите следующую команду:
jupyter-notebook --ip '*'
Далее перейдите по ссылке, указанной на экране. Вместо 'localhost' или имени следует использовать внешний плавающий IP адрес машины.