據(jù)外媒報道,12月1日,英偉達發(fā)布多款開源人工智能(AI)模型,其中包括面向自動駕駛汽車的Alpamayo-R1,以及面向機器人技術與仿真領域的Cosmos工具。英偉達正以一項大膽舉措,不斷拓展AI研究的邊界。

圖片來源:英偉達
Alpamayo-R1軟件旨在借助AI領域部分最新的“推理”技術,加速自動駕駛汽車的研發(fā)進程。據(jù)悉,這款軟件屬于“視覺-語言-動作”AI模型,也就是說,自動駕駛汽車能夠將其傳感器組捕捉到的道路路況,轉化為自然語言描述。
Alpamayo這一名稱源于秘魯一座攀登難度極大的山峰,該軟件的突破性在于,車輛在規(guī)劃行駛路線時會“自言自語”地進行思考。舉個例子,當汽車探測到自行車道時,這款軟件會記錄下這一路況信息,并說明正在調整行駛路線。
以往的大多數(shù)自動駕駛汽車軟件,在解釋車輛為何選擇某一行駛路線時存在局限,這使得工程師難以判斷需要改進哪些環(huán)節(jié)來提升汽車的安全性。
英偉達汽車業(yè)務高級營銷經(jīng)理Katie Washabaugh向路透社表示:“推出這款開源軟件的核心目的之一,就是讓開發(fā)者和研究人員能夠了解這些模型的運作機制,從而推動整個行業(yè)制定出評估其性能的標準方法?!?/p>
AR1模型已在GitHub與Hugging Face開放獲取,同時英偉達物理AI開放數(shù)據(jù)集中亦包含其部分訓練數(shù)據(jù)。研究人員還可借助AlpaSim框架對模型性能進行評估。
除AR1外,英偉達的Cosmos平臺還提供一套面向物理AI開發(fā)的工具集;其中包括為自動駕駛仿真生成激光雷達數(shù)據(jù)的LidarGen、用于優(yōu)化神經(jīng)重建結果的Omniverse NuRec Fixer、用于制定機器人行為規(guī)則的Cosmos Policy,以及能在高逼真度仿真環(huán)境中訓練人形機器人的ProtoMotions3。
目前,全球開發(fā)者與研究人員已開始對這些模型展開測試。英偉達生態(tài)合作伙伴如Voxel51、1X、Figure AI、Foretellix、Gatik、Oxa、PlusAI和X-Humanoid等,正將Cosmos基礎模型應用于自動駕駛及機器人技術項目中。
在數(shù)字領域,英偉達正升級其Nemotron工具包。該工具包的亮點包括多說話人自動語音識別模型“MultiTalker Parakeet”,以及可實現(xiàn)實時說話人分離的Sortformer模型。
Nemotron還推出了基于推理技術的AI安全模型,同時提供適用于強化學習和特定領域AI開發(fā)的合成數(shù)據(jù)集。
其他值得關注的更新包括Audio Flamingo 3——這是一款可對語音、音樂及各類聲音進行跨模態(tài)推理的大型音頻語言模型,還有Minitron-SSM——該模型能夠在不損失性能的前提下對混合模型進行壓縮。
英偉達研究人員還展示了Jet-Nemotron和Nemotron-Flash兩款模型,它們均經(jīng)過優(yōu)化,可實現(xiàn)高效的語言模型推理并降低延遲。
通過此次發(fā)布的一系列成果,英偉達持續(xù)將開源AI推向新高度,提供的這些工具為研究人員、開發(fā)者以及自主系統(tǒng)創(chuàng)新者均賦予了強大能力。
英偉達憑借其芯片成為AI研發(fā)的核心支撐,已然躋身全球市值最高的公司之列。與此同時,該公司還設有規(guī)模龐大的軟件研究部門,負責發(fā)布AI開源代碼,以供Palantir Technologies等企業(yè)采用。
