“推理平臺(tái)重構(gòu)之后,業(yè)務(wù)變動(dòng)更加靈活,GPU也形成了一個(gè)大的資源池供我們靈活調(diào)配。同時(shí),后臺(tái)的監(jiān)控?cái)?shù)據(jù)幫我們確認(rèn)了不同類型業(yè)務(wù)的資源需求,便于我們未來(lái)業(yè)務(wù)擴(kuò)展的時(shí)候進(jìn)行規(guī)劃。”
1GPU資源有限且資源利用率不高,難以支撐快速增長(zhǎng)的業(yè)務(wù)需求;
2缺乏IT人員,難以針對(duì)所有GPU資源、任務(wù)進(jìn)行監(jiān)控和告警;
3現(xiàn)有推理平臺(tái)較為陳舊,無(wú)法根據(jù)模型規(guī)模自動(dòng)分配資源,導(dǎo)致大量珍貴的GPU資源浪費(fèi)。
實(shí)時(shí)推理
基于Yolo v5的圖形檢測(cè)應(yīng)用
1重構(gòu)實(shí)時(shí)推理平臺(tái),相同規(guī)模的GPU集群所支撐的業(yè)務(wù)規(guī)模提升40%;
2提供基于任務(wù)的監(jiān)控告警功能,故障響應(yīng)及排查效率從小時(shí)級(jí)提升到分鐘級(jí)。
1平臺(tái)可面向模型提供可伸縮的推理服務(wù);
2GPU資源池化,可更靈活地根據(jù)業(yè)務(wù)分配資源;
3平臺(tái)可支持在單個(gè)檢測(cè)任務(wù)中并發(fā)多個(gè)推理子任務(wù)。
在線咨詢
公眾號(hào)
掃碼關(guān)注我們
微信咨詢
添加小F@速石科技
說(shuō)出你的應(yīng)用
我們就有故事
免費(fèi)試用