您現在的位置是:熱點 >>正文
GMI Cloud 發布“ AI 應用構建成本計算器”,宣布降低海外 IT 成本超40%
熱點2人已圍觀
簡介新浪科技訊 7月29日晚間消息,今日閉幕的2025世界人工智能大會展覽)上,GMI Cloud 發布自研“ AI 應用構建成本計算器”,宣布通過實時量化不同場景下的算力成本、時間損耗與供應商性價比,可 ...

新浪科技訊 7月29日晚間消息,發布今日閉幕的應用2025世界人工智能大會(展覽)上,GMI Cloud 發布自研“ AI 應用構建成本計算器”,構建宣布通過實時量化不同場景下的成本T成算力成本、時間損耗與供應商性價比,計算可為開發者提供成本規劃支持。器宣
典型場景評估顯示,布降本超使用 GMI Cloud 方案可使海外 IT 成本降低 40% 以上,低海回本周期縮短至行業平均水平的發布 1/3。
Token作為AI文本處理的應用基本單位,其消耗成本直接決定商業可行性。構建據行業數據顯示,成本T成GPT-4 Turbo處理單次多步驟Agent任務消耗可達200萬Token(成本約2美元),計算而工程化部署周期普遍被低估60%。器宣
據介紹,布降本超GMI Cloud “ AI 應用構建成本計算器”可基于Token數量與單價(區分輸入 / 輸出), 核算AI應用/AI Agent 構建總花費;結合Token吞吐量(輸入 / 輸出速度),計算處理總請求的耗時。同時,該工具還能實時對比OpenAI、Anthropic等15家供應商的Token單價,自動標記Inference Engine等低成本替代方案。
此外,GMI Cloud Inference Engine 的底層調用GMI Cloud 全棧能力,可直接調用英偉達 H200、B200芯片,從硬件到軟件進行了端到端的優化,極致優化單位時間內的Token吞吐量,確保其具備最佳的推理性能以及最低的成本,最大限度地幫助客戶提升大規模工作時的負載速度以及帶寬。同時,其讓企業以及用戶進行快速部署,選擇好模型后即刻擴展,幾分鐘之后就可以啟動模型,并用這個模型進行 Serving。(文猛)

責任編輯:何俊熹
Tags:
相關文章
阿里AI四連發,宣布開源電影級視頻模型Wan2.2
熱點新浪科技訊 7月28日晚間消息,繼上周阿里AI三連發后,阿里又扔出新的開源模型——電影級視頻生成模型通義萬相Wan2.2。Wan2.2可將光影、色彩、鏡頭語言三大電影美學元素裝進模型,隨意組合60多個 ...
【熱點】
閱讀更多美團:年內將為10萬家餐飲小店發放最高5萬元助力金
熱點8月7日晚,美團外賣官方微博發文宣布今年“秋天的第一杯奶茶”活動如期結束。文章稱,今年立秋,美團共請客300萬名騎手提前喝上了秋天第一杯奶茶,邀請了超過2萬名奶茶店員按摩,同時,還聯合了100家茶飲品 ...
【熱點】
閱讀更多直擊WAIC丨科大訊飛副總裁趙翔:讓AI像水和電一樣服務每一個場景
熱點專題:2025世界人工智能大會新浪科技訊 7月27日下午消息,日前,2025世界人工智能大會WAIC 2025)人工智能終端產業發展論壇在上海世博中心舉行。科大訊飛副總裁趙翔受邀出席論壇并發表主題演講 ...
【熱點】
閱讀更多