2021年4月20日 —— 實時3D內容創作和運營平臺Unity (NYSE: U) 今日宣布發布Unity計算機視覺數據集。該數據集將有效降低計算機視覺應用的開發成本,加快為制造業、零售業和安防行業訓練人工智能(AI)的速度。計算機視覺方案提供商現在可以為其AI訓練需求購買定制化的數據集,同時保證符合嚴格的隱私和監管標準。
由Unity引擎合成的逼真圖像可以描繪自動駕駛場景中可能發生的各種低概率事件,從而改善自動駕駛系統的訓練效果
對于人工智能訓練來說合成數據非常重要,因為往往現實世界所收集的真實數據無法滿足特定的條件或需求。比如隱私規定限制了真實數據的可用性,或規定了數據只能以何種方式被使用。合成數據的一種常見用途是用于預發布的產品測試,此時現實數據可能不存在或無法被測試人員獲取。此外,機器學習需要大量的數據用于訓練算法,這也有賴于合成數據。因為在現實生活中,尤其是在自動駕駛汽車行業,生成能夠用于算法訓練的數據非常昂貴。如今Unity已經推出了計算機視覺數據集,未來在獲取用于人工智能和機器學習訓練的高質量合成數據集上,成本將不再是障礙。
Unity人工智能和機器學習高級副總裁Danny Lange博士表示:“通過提供符合隱私規定且如實反映真實世界的合成數據,我們能夠讓這些具有開創性的數據集為更多創新者所用。根本上來說,這些數據集能幫助企業規劃和模擬尚未出現過的場景,甚至能夠模擬真實世界的用戶增長來不斷調整訓練數據。因此,隨著客戶應用領域的擴展,我們將能看到更智能的室內環境,比如全自助無人零售店等等。”
Unity使用“域隨機化”(domain randomization)技術來創建各種計算機視覺數據集,以此來提高數據質量并控制實際應用中的偏差值。在合成數據的過程中,該技術將對目標物體的位置和朝向進行各種排列組合,還有光照和攝像機角度的變化,以及可能實現的Unity環境的無數變量配置等。而且,Unity的合成數據集還可以避免真實數據獲取過程中可能存在的隱私違規或不可控的人工偏差。比如有些包含真實的人或地點的圖像是直接從互聯網上非法抓取的,或是花費大量人力從真實世界中拍攝獲得。
各類帶標簽的合成圖像數據
對于真實世界的數據,標注的價格隨著標注類型的復雜性而增加。Unity則提供了一個適用于任何標簽類型的較低價格,客戶無論是為簡單還是復雜的行業標準都將支付相同的標簽價格,如2D和3D邊界框、類細分或實例細分。合成數據集是按等級定價模型收費的,客戶所需合成的圖像數量越多,每幅圖像的價格越低。
Lange博士補充道:“合成數據正在徹底改變機器學習模型的訓練方式,它彌補了人工收集和標記真實世界數據的許多不足之處。我們正在探索一切可能性,幫助創作者們獲取他們決策所需、并且負擔的起的數據,推動Unity技術在各個領域的應用。這也是為什么我們推出這些數據集,并竭力幫助客戶滿足他們的需求。“
關于Unity
Unity (NYSE: U) 是全球領先的實時3D互動內容創作和運營平臺。包括游戲開發、美術、建筑、汽車設計、影視動畫在內的所有創作者,都能借助Unity將他們的創意變成現實。Unity平臺提供一整套完善的軟件解決方案,可用于創作、運營和變現任何實時互動的2D和3D內容,支持平臺包括手機、平板電腦、PC、游戲主機、增強現實和虛擬現實設備。公司超過1800人規模的研發團隊讓Unity的技術始終保持在世界前沿,同時緊跟合作伙伴迭代,確保在最新的版本和平臺上提供優化支持服務。2020年,基于Unity開發的游戲和體驗在全球范圍內月均下載量超過50億次。