日韩欧美亚洲一区二区_精品亚洲国产成人av制服丝袜_91精品在线免费_中文字幕日韩精品在线

“賣鏟人”也坐不住了!英偉達發布視頻AI大模型論文 有望深度賦能自動駕駛|全球快看

來源:科創板日報 發布:2023-04-22 14:18:45

近日,英偉達與慕尼黑大學等院校的研究人員聯合發布了一篇有關視頻潛在擴散模型(VideoLDM,Latent Diffusion Model)的論文,該模型能夠將文本轉換成視頻,實現高分辨率的長視頻合成。相關論文已經發表在預印本網站arXiv上。

研究人員給出“一個泰迪熊正在彈電吉他、高清、4K”等文本提示詞后,運用VideoLDM,成功生成了相關視頻(已轉為GIF格式):

目前,VideoLDM生成視頻的最高分辨率可達2048×1280、24幀。研究團隊僅公布了論文和一些成品視頻案例,暫未開放試用。


(資料圖片僅供參考)

據介紹,相對來說,該模型對于訓練和計算的要求較低。在文字大模型、文生圖大模型發展迅速的當下,受限于視頻訓練數據的計算成本高昂以及缺乏大規模公開可用的數據集等原因,視頻大模型的發展相對較慢。VideoLDM則成功解決了這個關鍵問題。

從原理上來分析,VideoLDM基于圖像數據集預訓練,并在此基礎上加入時間維度以形成視頻框架,最后在編碼的視頻序列上進行微調,得到視頻生成器。

為進一步提高分辨率,研究人員從時間維度將其與擴散模型upsamplers對齊,并與真實視頻對比驗證,從而將其轉換為時間一致的視頻超分辨率模型。

此外,研究人員還微調了Stable Diffusion,將其轉換為視頻生成器。他們通過對Stable Diffusion的空間層進行簡單微調,然后插入時間對齊層,從而實現了視頻的生成。

落實到應用層面,研究人員給出了兩大具有潛力的應用領域:一是駕駛數據的高分辨率視頻合成,能夠模擬特定駕駛場景,在自動駕駛領域中具有巨大的應用潛力;二是創意內容的生成。

在論文中,團隊給出了幾個駕駛場景視頻的生成案例:

目前,在自動駕駛領域,AI大模型被認為能夠賦能感知標注、決策推理等環節。

華泰證券分析師黃樂平、陳旭東等于4月13日發布研報指出,AI大模型有望解決行業數據標注準確率及成本困境。該機構以DriveGPT為例進行分析,大模型能夠將交通場景圖像的標注費用從行業平均約5元/張降至約0.5元/張。

與此同時,機構還認為大模型將賦能場景生成、軌跡預測、推理決策等環節,能夠根據駕駛場景序列數據,生成未來可能發生的多種駕駛環境并預測每種情況下車輛行駛軌跡。國泰君安亦指出AIGC將有助于自動駕駛的推進落地。

關鍵詞:
相關新聞
主站蜘蛛池模板: 国产人妻互换一区二区| 日本最新高清不卡中文字幕V| 日韩福利在线| 久久精品国产电影| 日本黄网免费一区二区精品| 日韩精品一区二区三区外面| 亚洲综合在线播放| 日韩中文字幕在线视频| 欧洲精品久久| 国产精品免费久久久久久| 久久国内精品一国内精品| 久久这里精品国产99丫e6| 7777在线视频| 99视频精品免费| 黄色片免费在线观看视频| 国产精品麻豆免费版| 国产日韩欧美成人| 亚洲综合在线做性V| 国产精品香蕉国产| 日本久久久网站| 久久亚洲精品网站| 欧美亚洲另类激情另类| 国产精品久久久久久av| 久久久免费精品| av久久久久久| 国产精品欧美日韩| 日本久久亚洲电影| 99久久精品免费看国产四区| 99视频在线| 日本不卡一区二区三区四区| 精品中文字幕在线2019| 亚洲国产精品久久久久婷婷老年| 久久亚洲免费| 日韩精品欧美在线| 亚洲在线观看视频网站| 激情五月六月婷婷| 亚洲国产高清国产精品| 久久久久国产精品免费网站| 国产高潮呻吟久久久| 国产精品美女午夜av| 日韩在线一级片|