比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads
首頁 > BTC > Info

DET:完全基于Transformer的目標檢測器,ICLR匿名論文視覺、檢測統一

Author:

Time:1900/1/1 0:00:00

機器之心報道

編輯:陳萍

一種新的集成視覺和檢測Transformer的目標檢測器ViDT。

Transformer在NLP任務中取得不錯的發展,許多研究將其引入到計算機視覺任務中。毫不夸張的說,Transformer正在改變計算機視覺的格局,尤其是在識別任務方面。例如Detectiontransformer是第一個用于目標檢測的、端到端的學習系統,而visiontransformer是第一個完全基于transformer的圖像分類架構。在本文中,一篇被ICLR2022接收的匿名論文集成了視覺和檢測Transformer(VisionandDetectionTransformer,ViDT)來構建有效且高效的目標檢測器。

ViDT引入了一個重新配置的注意力模塊,將SwinTransformer擴展為一個獨立的目標檢測器,之后是一個計算高效的Transformer解碼器,該解碼器利用多尺度特征和輔助技術,在不增加計算負載的情況下提高檢測性能。

美聯儲利率掉期幾乎完全定價美聯儲本周將加息25個基點:金色財經報道,美聯儲利率掉期幾乎完全定價美聯儲本周將加息25個基點。[2023/5/1 14:37:24]

在MicrosoftCOCO基準數據集上的評估表明,ViDT在現有的完全基于transformer的目標檢測器中獲得了最佳的AP和延遲權衡,其對大型模型的高可擴展性,可達49.2AP。

論文地址:https://openreview.net/pdf?id=w4cXZDDib1H

ViDT:視覺與檢測Transformer

ViDT架構如下圖2(c)所示:

首先,ViDT引入了一種改進的注意力機制,名為ReconfiguredAttentionModule(RAM),該模塊有助于ViT變體處理附加的和token以進行目標檢測。因此,ViDT可以將最新的帶有RAM的SwinTransformer主干修改為目標檢測器,并利用其具有線性復雜度的局部注意力機制獲得高可擴展性;

外媒:曼城足球俱樂部已完全終止與加密公司3KeyTechnologies的合作:1月13日消息,最近幾個月,圍繞曼城足球俱樂部與加密貨幣公司3KeyTechnologies合作的報道不斷。去年11月,TheTimes報道稱,曼城已經終止了與該公司的合作關系,原因是涉及該公司高管身份的問題。3KeyTechnologies據稱是在塞舌爾注冊的,但塞舌爾的公司數據庫中沒有它存在的證據。現在,DailyMail報道稱,曼城已經完全結束了與3KeyTechnologies的關系,并再次暗示不清楚該公司的高管是誰。據悉,與3KeyTechnologies的短暫關系并不是曼城第一次涉足加密領域。曼城只是最近轉向加密行業的眾多世界足球俱樂部之一。(Decrypt)[2022/1/13 8:46:47]

其次,ViDT采用輕量級的無編碼器neck架構來減少計算開銷,同時仍然在neck模塊上啟用額外的優化技術。請注意,neck編碼器是不必要的,因為RAM直接提取用于目標檢測的細粒度表示,即token。結果,ViDT獲得了比neck-free對應物更好的性能;

Jason:行業趨勢變好,2021年公鏈爆發完全有可能:12月24日消息,HPB芯鏈合伙人 Jason在做客《HyperPay焦點》欄目時提及:行業不斷迭代,傳統機構資金進場,監管政策更加明晰,整個行業趨勢在不斷變好,我們應該相信2021年,整個區塊鏈行業會迎來更好的爆發,當然,公鏈賽道爆發也是完全有可能的。

2021年HPB將重點推進HPB2.0的升級迭代,基于軟硬件結合的特有屬性,利用硬件加速和硬件安全的信任機制,推出面向隱私數據的區塊鏈計算平臺。[2020/12/24 16:23:16]

最后,該研究引入了用于知識蒸餾的token匹配新概念,它可以在不影響檢測效率的情況下從大型模型到小型模型帶來額外的性能提升。

RAM模塊

該研究引入了RAM模塊,它將與和token相關的單個全局注意力分解為三個不同的注意力,即×、×和×注意力。如圖3所示,通過共享和token的投影層,全部復用SwinTransformer的所有參數,并執行三種不同的注意力操作:

俄羅斯加密社區就完全禁止加密交易的法案草案發起抗議:金色財經報道,就俄羅斯國家杜馬正考慮發布完全禁止加密交易的法案草案,俄羅斯加密社區已經提交了許多抗議信。加密游說組織RAKIB在給該法案發起人、俄羅斯國家杜馬金融市場委員會主席Anatoly Aksakov的信中表示,如果該法案獲得通過,俄羅斯經濟每年將損失高達100億美元的稅收,而如果加密行業能夠合法運營,則將能夠支付這些稅收。RAKIB還指出,其中一項法案禁止使用位于俄羅斯的服務器和在該國注冊的網絡域名發行加密貨幣,這意味著本地加密業務將不得不轉移到其他司法管轄區。俄羅斯將失去保持技術領先地位的機會,并將建立新的“鐵幕”,切斷與全球科技基礎設施的聯系,迫使年輕的科技人才到國外工作。[2020/5/30]

ENCODER-FREEneck結構

為了利用多尺度特征圖,ViDT結合了多層可變形transformer解碼器。在DETR家族中,其neck部分需要一個transformer編碼器,用于將從骨干中提取的用于圖像分類的特征轉換為適合目標檢測的特征;編碼器通常在計算上很昂貴,因為它涉及×注意力。然而,ViDT只保留了一個Transformer解碼器作為其neck,因為帶有RAM的SwinTransformer直接提取適合目標檢測的細粒度特征作為獨立的目標檢測器。因此,ViDT的neck結構在計算上是高效的。

動態 | 新第三方審計報告顯示USDC完全由美元支持:Circle在其官方博客發布了最新的由獨立會計師事務所Grant Thornton(致同會計師事務所)審計的USDC儲備報告。報告指出,截至2019年3月31日11:59(UTC),已發行及流通246586876 USDC,托管賬戶中持有246590714美元,截至報告發布時,已發行和未發行的USDC代幣總額不超過托管賬戶中所持有的美元余額。[2019/4/20]

解碼器從帶有RAM的SwinTransformer接收兩個輸入:從每個階段生成的token從最后階段生成的token,如圖2(c)的Neck所示。在每個可變形的transformer層中,首先執行×注意力。對于每個token,應用多尺度可變形注意力以生成一個新的token,聚合從多尺度特征圖

中采樣的一小組關鍵內容:

用于目標檢測的token匹配知識蒸餾

雖然大型模型具有實現高性能的高容量,但在實際使用中它的計算成本可能很高。因此,該研究還提出了一種簡單的知識蒸餾方法,可以通過token匹配從大型ViDT模型中遷移知識。

匹配每一層的所有token在訓練中非常低效,因此,該研究只匹配對預測貢獻最大的token。兩組token直接相關:P:用作多尺度特征圖的token集合,由body中的每個階段生成,D:token的集合,它們是從neck的每個解碼層生成的。因此,基于token匹配的蒸餾損失公式為:

評估

表2將ViDT與DETR(ViT)和YOLOS的AP、FPS等進行了比較,其中DETR(ViT)有兩個變體:DETR和DeformableDETR。

實驗結果表明:ViDT實現了AP和FPS之間的最佳權衡。憑借其高可擴展性,其性能優于1億個參數的Swin-base,在相似的AP的下,FPS比DeformableDETR快2倍。此外,ViDT參數為16M,得到40.4AP,比DETR(swin-nano)和DETR(swin-tiny)高分別高6.3AP、12.6AP。

表3對比了不同空間位置編碼與ViDT的結果。結果表明:pre-addition比post-addition帶來的性能提升更高,即sinusoidalencoding優于learnable編碼;因此,正弦空間編碼的2D歸納偏置在目標檢測中更有幫助。特別是,與不使用任何編碼相比,使用正弦編碼的預加法將AP增加了5.0。

表4總結了使用不同選擇策略進行交叉注意力時的AP和FPS,其中SwinTransformer總共包含四個階段。有趣的是,只要在最后階段激活交叉注意力,所有策略都表現出相似的AP。由于在各個階段中以自下而上的方式提取特征,因此在低級別階段很難直接獲得有關目標對象的有用信息。因此,研究者想要獲得較高的AP和FPS,只使用最后階段是最好的設計選擇,因為token的數量最少。

為了徹底驗證輔助解碼損失和迭代框細化的有效性,該研究甚至對YOLOS等neck-free檢測器進行了擴展。表5顯示了兩種neck-free檢測器YOLOS和ViDT(w.o.Neck)性能。實驗結果證明在ViDT中使用Neck解碼器來提高目標檢測性能是合理的。

下圖表明:教師模型的規模越大,學生模型的收益越大。從系數來看,系數值越大,性能越好。模型蒸餾將AP提高了1.0-1.7,而不會影響學生模型的推理速度。

研究者將所有提議的組件結合起來,以實現目標檢測的高精度和速度。如表8所示,有四個組件:(1)RAM將SwinTransformer擴展為獨立的目標檢測器,(2)neck解碼器利用多尺度特征和兩種輔助技術,(3)從大模型中獲益知識蒸餾,(4)解碼層drop進一步加快推理速度。結果表明:當使用Swin-nano作為其主干時,它僅使用13M參數就達到了41.7AP和合理的FPS。此外,當使用Swin-tiny時,它僅損失了2.7FPS而表現出46.4AP。

Tags:DETETRRAMDET幣是什么幣ETR價格ETR幣RAM幣RAM價格

BTC
WRX:2.4T+275馬力,斯巴魯在日本正式發布WRX S4,起價合人民幣22.2萬

經過長時間的宣傳活動,斯巴魯正式發布了面向日本市場的WRXS4,這與9月份在美國亮相的斯巴魯WRX并沒有太大區別.

1900/1/1 0:00:00
比特幣:比特幣的價格如何確定,會受互聯網影響嗎?

比特幣的出現,給金融市場帶來了很多有趣的新現象,究竟數字貨幣是否具有價值,還是只是純粹投機商品,它的交易者具有什么特征,成為了眾人關注的重點.

1900/1/1 0:00:00
比特幣:比特幣一路暴跌,“數字黃金”遭質疑,加密貨幣泡沫要破了?

一向被幣圈人士看作“數字黃金”“避險資產”的比特幣,在近期的動蕩中一路暴跌。自2021年11月達到近69000美元的歷史高點后,比特幣價格連月走低.

1900/1/1 0:00:00
比特幣:傳奇投資者放大招!曾抄底比特幣大賺100倍……

中國基金報記者金宥智 2022年一開年,比特幣就崩了,年內一度暴跌14%,創下最差年度開局。而就在這個敏感時刻,竟然有大佬自爆稱;已經把自己的一半身家都砸到了加密貨幣里.

1900/1/1 0:00:00
NFT:周杰倫稱經典歌曲的Demo將制成NFT,NFT成為娛樂圈的新潮玩

記者|司林威 1月30日,此前一直對NFT多有關注的華語流行樂歌手周杰倫稱新專輯雖然不會做成限量版NFT,但會考慮將經典歌曲的Demo制成NFT.

1900/1/1 0:00:00
比特幣:TMT時報|字節跳動去世員工家屬稱獲賠2000萬是“假的”;螞蟻集團第三財季凈利潤9.12億美元;受俄烏克局勢影響,比特幣大跌9.89%

《科創板日報》2月24日訊今日財聯社TMT要聞精選主要內容有:網傳字節跳動去世員工家屬獲賠2000萬,逝者母親回應是“假的”;阿里巴巴第三財季凈利同比下降75%.

1900/1/1 0:00:00
ads