“通過速石平臺,我們不僅獲得了足夠數量的GPU,操作方式也符合每個人的使用習慣,大部分人都能快速上手。”
1本地資源有限,需要給研究員合理分配GPU資源;
2使用工作站無法滿足一些規模較大的模型訓練的算力需求;
3實驗室沒有專人負責基礎架構,需要進行管理并提供基本的運維監控;
4研究員希望保持GPU資源的接入方式不變。
機器人控制
Pytorch、TensorFlow、MXNet
1平臺可統一管理所有算力資源,并根據管理員配置和用戶申請分配資源;
2用戶可在算力集群中申請多機多卡資源以滿足大規模模型訓練需求;
3速石將平臺的管理運維操作進行了大幅簡化,絕大部分操作可通過平臺界面完成,簡單易用;
4在GPU資源的接入上,速石提供了開箱即用的SSH和Jupyter接入,最大程度保證用戶像使用工作站一樣使用集群算力資源。
1對計算資源進行統一管理、監控和調度;
2平臺在GPU調度上提供了非常完善的資源隔離機制和豐富的調度策略,滿足了不同場景下的資源分配需求;
3在MLOps領域提供的開箱即用的環境接入能夠大幅提高研究效率;
4專業服務幫助用戶解決從基礎架構到中間件到應用框架層的使用問題。
在線咨詢
公眾號
掃碼關注我們
微信咨詢
添加小F@速石科技
說出你的應用
我們就有故事
免費試用