2022年11月30日 星期三

AI趨勢周報第167期:臉書新模型融合自監督和Transformer,不需標註資料還能揪出複製圖


臉書最近發表一款新演算法DINO,結合了自監督學習、不需標註訓練資料的優點,以及Transformer架構的自我注意力機制優勢。用DINO訓練出來的模型,不需任何標註資料,就能辨識圖片和影片中的物件,也能進行語意分割。特別的是,模型還能揪出複製圖,準確率達96.4%。


圖片來源: 

臉書


重點新聞(0430~0506)


臉書     自監督學習     Transformer  


臉書新模型融合自監督和Transformer,不需標註資料還能揪出複製圖


臉書聯手法國國家電腦科學研究院Inria,共同設計一套新訓練方法DINO,融合了自監督學習(Self-supervised learning)和Transformer的注意力機制優點,來訓練電腦視覺模型Vision Transformer(ViT),不需要標註資料就能完成訓練。用這個方法訓練出來的模型,能準確辨識圖片和影片中的物件,也能進行語意分割,完全不需標註資料。


臉書指出,近幾年AI突破性的成就來自兩大技術,也就是自監督學習和Transformer。自監督學習的好處是,AI模型能從未標註的資料中學習,省下標註所需的人力和時間成本。而Transformer的優點是,AI模型可從輸入值中,將注意力聚焦於所選的區域,來更有效率地推論。


於是,臉書結合這兩大技術,設計出DINO演算法。他們將自監督學習的兩大優點:老師網路(Momentum teacher)和多剪裁訓練(Multicrop training)整合到DINO框架中,來搭配ViT的自我注意力優勢。團隊發現,融合自監督學習和Transformer的DINO,對視覺世界的理解和人類很像,能辨識出物件的部分組成和圖片中的共同特徵;他們以ImageNet不同類別的影像來測試,發現DINO會以人能理解的方式,來分類影像,將相似的類別擺在一起。


這個方法,能讓模型快速執行k-NN分類任務,且不需要繁瑣的微調或學習分類器。在ImageNet的測試中,團隊也發現DINO比其他自監督學習模型還要好,而且,DINO還有能力識破複製圖和本尊的差異,未來可用於版權保護的偵測器上。



 AWS    DeepRacer    迷你賽車 


擴大推廣AI賽車活動,AWS決定開源迷你賽車DeepRacer模擬器


AWS宣布要開源迷你賽車DeepRacer的裝置軟體,開發者可進一步擴展DeepRacer功能,讓賽車裝置可執行更多行為。DeepRacer是一個雲端虛擬賽車模擬器,開發者可在雲端上訓練、調校ML模型,並載入到1/18大小的迷你自駕車,讓它在設計好的軌道中行駛,克服各種轉彎與直線道路組合。


DeepRacer所使用的機器作業系統ROS是用Ubuntu開發,而開源DeepRacer程式碼,可讓有Linux程式開發能力的開發者,創造出新的車輛用途,實現更多創意。開發者也可在社群媒體中,用#deepracerproject標籤分享自己的開發專案,AWS會將這些專案收集到DeepRacer GitHub Organization中,並在之後的部落格介紹。


  MIT    電腦視覺      材料壓力 


MIT新材料分析AI工具,靠一張外觀照片就能估算出材料壓力


麻省理工學院(MIT)開發一套AI,可用電腦視覺辨識材料內部結構圖,來快速計算材料部份特性,像是應力(Stress)與應變(Strain)值,省下繁瑣的物理計算。


MIT指出,一般來說,工程師需耗費大量時間來計算材料內力,就算有電腦輔助,還是會遇到長達數天甚至數月的模擬問題。為解決問題,研究團隊看上生成對抗網路(GAN),先使用上萬組圖像訓練網路,這些圖組由兩張圖組成,一張描繪材料內部在機械作用下的微觀結構,另一張則以顏色編碼標示該材料的應力和應變數值,讓AI網路反覆迭代,算出材料的幾何形狀和其所產生應力之間的關係。這個方法,讓AI只要看一張圖片,就能預測材質的內力,解決過去需要撰寫程式碼,求解偏微分方程式的麻煩。



  美國衛生部     AI策略     資料共享  


美國衛生部揭露未來醫療AI布局


美國衛生部AI長Oki Mek日前揭露美國衛生部未來醫療AI佈局,要執行今年1月提出的AI策略,共有4大目標,包括成立AI委員會和AI實踐社群、做好AI治理和法遵,以及建立沙盒,來衡量AI成效和成本。


進一步來說,美國衛生部一年有1.3兆美金預算,若以GDP排名來看,相當於全球第13大國。這個資金雄厚的衛生部,還有8萬多名職員來維持運作。在4大目標中,成立AI委員會的用意是做好AI發展所需的團隊合作。」再來,建立AI實踐社群是要交換AI實作心得、制定醫療AI規則,還要以此克服醫療AI的兩大難題,也就是資料取得和資料準備。


而第3個目標是要確保醫療AI不違背法規,比如資料隱私、資安、程式碼偏差等。最後一個目標則是建立研發能力R&D,除了要建立沙盒實驗環境,還要藉機集中化管理一些作業,比如AI工作管線(Pipeline)和框架,並將一些該去中心化的作業去中心化。Oki Mek更強調,衛生部也想藉AI策略,來改變人們不想分享資料的心態。「沒有資料,就沒有AI,」衛生部希望在合法的前提下,來與相關組織共享資料。



 商之器     UDE App     醫療影像  


商之器UDE App讓iPad Pro化身行動醫療影像伺服器,離線也能判讀影像


國內從事醫療影像儲存與傳輸及雲端醫療平臺開發的商之器,近期展示一款UDE App,能將iPad Pro平板電腦當成行動醫療影像伺服器,可在離線狀態下檢視乳房攝影影像,並由AI模型來輔助揪出乳房腫瘤。這個做法,可將原本需要2周以上的篩檢流程縮短為1周左右,目前已有一家北部醫學中心準備採用。


這套UDE App不僅獲得美國FDA第二級認證,也通過臺灣TFDA認證。商之器解釋,這款乳癌判讀AI是去年與資策會聯手開發,結合iPad Pro內建的CoreML技術,即使不連網,也能即時進行AI判讀,商之器表示,今年不只在國內落地UDE App,還要推廣到國外。



甲骨文  分析雲    機器學習  


甲骨文推出分析雲,強化ML可解釋性和自然語言搜尋資料特色


甲骨文日前推出分析雲服務( Oracle Analytics Cloud),強化了機器學習(ML)模型的可解釋性,使用者可查看影響模型決策的原因說明,比如,銀行拒絕給特定對象申請貸款,使用者可查看占比最重的原因。此外,使用者也能手動微調模型,來查看產出結果和變化。


而且,甲骨文分析雲也採用自然語言處理(NLP)技術,讓使用者用說的或打字就能查找所需的資訊,分析雲也會以自然語言方式回答。這是因為,甲骨文自建一套自然語言生成(NLG)引擎,可根據問題來掃描資料、圖表等,再組成答案給使用者。目前,該功能支援28種語言。


除此之外,甲骨文分析雲還有其他特點,包括自動化資料前處理、文本分析、關聯分析、圖表分析和客製化的地圖分析。其中,自動化資料前處理的意思是,由內建的資料分析引擎來對使用者資料掃描、取樣,找出潛在的資料質量問題,並主動通知使用者,比如對信用卡資訊等敏感訊息進行混淆處理等。除了這些特點,甲骨文分析雲也推出行動版應用程式,使用者也能在行動版上使用這些功能。



攝影/蘇文彬


圖片來源/MIT、AW、臉書、Nvidia、商之器、甲骨文


 AI趨勢近期新聞 


1. 疫情升溫!AI Labs社交距離App告訴你防疫最佳距離


2. 臉書發表半監督式學習新模型,影像辨識表現再突破


資料來源:iThome整理,2021年5月

https://www.ithome.com.tw/news/144208



Orignal From: AI趨勢周報第167期:臉書新模型融合自監督和Transformer,不需標註資料還能揪出複製圖

沒有留言:

張貼留言