NVIDIA在2017年公布基於Volta架構的Tesla V100 GPU,如今已是問世超過8年、並已更迭超過4個世代的老產品,不過卻是NVIDIA首次在加速GPU導入Tensor Core與HBM記憶體的產品;也由於Tesla V100並非如H100般引領AI世代,如今在eBay甚至僅需100美金即可購入功能正常的2手SXM2模組,Hardware Haven決定挑戰這款8年前老產品在當代大型語言模型的潛力,結果意外的是在230美金的總建置成本,仍可擊敗價格相近的Radeon 7800XT與NVIDIA RTX 3060。
從1萬美金變100美金的V100 SXM2模組

Tesla V100有兩種版本,當今以100美金落入市場的是採用為高性能伺服器DGX-1設計的SXM2模組,最大的特色是搭載16GB HBM記憶體;不過要在消費級PC使用SXM2模組需解決轉接PCIe介面與散熱問題,故除了購入模組的100美金以外,還需要添購轉接板與散熱器改裝的成本,總成本約略在230美金左右。
仍領先價格相近的新款消費級顯示卡

雖然架構較舊,但由於具備5,120個CUDA核心與頻寬高達898GB/s的16GB HBM記憶體,在預設的250W功率設定下,Hardware Heaven以20B參數的GPT-OSS進行測試,作為對照組的Radeon RX7800 XT約達到90 Token/s的性能,而Tesla V100則達到130 Token/s的表現。

另外把對照組換成(最近即將死灰復燃的)GeForce RTX 3060 12GB,在進行Gemma4:e4b(ollama+openwebui)的測試,RTX 3060的性能約為76 Token/s,而V100則可達到108 Token/s,單看能源效率領先12%,且把兩款產品限制在170W功率,V100的的性能仍高於235W下的RTX 3060,並在170W限制的能源效率大幅領先40%。
有趣、但仍受制架構不見得合乎經濟效益

雖然從結果來看,以相同的200美金等級價格,Tesla V100確實性能對比消費級產品出色,但即便撇除對一般人不確定是否能如法炮製的轉接與軟體設置,由於當前的AI模型不斷推陳出新,且也因應新一代架構支援更具效率的參數,倘若考慮的是性能的最大化,使用Tesla V100不見得完全符合經濟效益,尤其許多流行的模型需要更大容量的記憶體,而32GB版的V100價格則達到400至500美金,整體評量也不見得那麼划算。