凌云光技術(shù)股份有限公司深度學(xué)習(xí)算法部負(fù)責(zé)人 朱中洋博士
1 背景
2012年,神經(jīng)網(wǎng)絡(luò)之父Geoffrey Hinton的學(xué)生Alex Krizhevsky,通過(guò)改進(jìn)的LeNet在視覺(jué)領(lǐng)域競(jìng)賽ILSVRC 2012中摘下桂冠。在百萬(wàn)量級(jí)的ImageNet數(shù)據(jù)集合上,改進(jìn)的LeNet效果大幅度超過(guò)傳統(tǒng)方法,從此引爆深度學(xué)習(xí)在各個(gè)場(chǎng)景中的應(yīng)用。
此后,Google、Facebook和NVIDIA等強(qiáng)ToC背景企業(yè),逐步引領(lǐng)深度學(xué)習(xí)在ToC領(lǐng)域落地實(shí)施并率先取得成功。深度學(xué)習(xí)在購(gòu)物推薦、廣告推薦、路徑規(guī)劃和喜好挖掘等領(lǐng)域得到廣泛應(yīng)用,更通過(guò)植入到手機(jī)等終端設(shè)備的方式走到每個(gè)人身邊。
2 深度學(xué)習(xí)與工業(yè)場(chǎng)景之間的“語(yǔ)義鴻溝”
既然深度學(xué)習(xí)性能這么好,能不能把它應(yīng)用在工業(yè)場(chǎng)景,重復(fù)、有效、可靠地解決問(wèn)題?能否應(yīng)用在瑕疵檢測(cè)、缺陷分級(jí)和根因分析上?如果簡(jiǎn)單地把它移植過(guò)來(lái),會(huì)出現(xiàn)哪些鴻溝和問(wèn)題?
第一個(gè)鴻溝:深度學(xué)習(xí)平臺(tái)
大家熟知的AI頭部公司多有自己的深度學(xué)習(xí)平臺(tái),包含整合的算力、存儲(chǔ)、數(shù)據(jù)、數(shù)據(jù)標(biāo)注、模型訓(xùn)練和模型部署等功能。這類平臺(tái)只適合于具有少高效應(yīng)(項(xiàng)目數(shù)量少、樣本量大且算力需求大)的公司,如互聯(lián)網(wǎng)企業(yè)。而工業(yè)場(chǎng)景中的項(xiàng)目卻以長(zhǎng)尾效應(yīng)(項(xiàng)目數(shù)量多、樣本量小且算力需求小)為主,如工業(yè)質(zhì)檢行業(yè)。云模式是否適用于工業(yè)質(zhì)檢行業(yè)?將花費(fèi)高代價(jià)整合出來(lái)的算力和存儲(chǔ)根據(jù)項(xiàng)目分割,是否是最優(yōu)選擇?
第二個(gè)鴻溝:預(yù)訓(xùn)練
做工業(yè)質(zhì)檢時(shí),即使在算法層面上開(kāi)發(fā)相應(yīng)的框架形成自己的平臺(tái),最常用的基本上還是一些非常頂尖的ToC企業(yè)發(fā)布的框架網(wǎng)絡(luò),如ImageNet的預(yù)訓(xùn)練權(quán)重。但在實(shí)踐過(guò)程中我們發(fā)現(xiàn),雖然ImageNet的圖片和工業(yè)圖片之間的鴻溝非常大,但仍然可以提升模型的性能。這樣就引出了第二個(gè)鴻溝,是不是可以有屬于自己、圖片完全來(lái)源于工業(yè)領(lǐng)域的預(yù)訓(xùn)練模型?
第三個(gè)鴻溝:小樣本
在工業(yè)人工智能領(lǐng)域,隨著產(chǎn)品良率和產(chǎn)能的提升,缺陷瑕疵的數(shù)量必然會(huì)越來(lái)越少,深度學(xué)習(xí)在工業(yè)中的使用場(chǎng)景會(huì)逐漸收斂為小樣本的場(chǎng)景,小樣本深度學(xué)習(xí)未來(lái)是工業(yè)人工智能核心。2018年之后,出現(xiàn)了很多小樣本相關(guān)的論文,但不難發(fā)現(xiàn),這些頂尖的小樣本深度學(xué)習(xí)算法并不是為工業(yè)量身打造,將學(xué)術(shù)界提出的小樣本識(shí)別方法直接應(yīng)用在工業(yè)中,往往是不能立刻見(jiàn)效的。
3 凌云光深度學(xué)習(xí)平臺(tái)
深度學(xué)習(xí)有三個(gè)很重要的因素,即平臺(tái)、數(shù)據(jù)和算法。凌云光大膽創(chuàng)新,提出了全新的深度學(xué)習(xí)平臺(tái)、數(shù)據(jù)預(yù)訓(xùn)練及改進(jìn)算法,從而使深度學(xué)習(xí)契合工業(yè)界的發(fā)展和需求。
(1)建立統(tǒng)一規(guī)格的多維度深度學(xué)習(xí)平臺(tái)
凌云光深度學(xué)習(xí)平臺(tái)包含三個(gè)維度,分別是超輕型的深度學(xué)習(xí)平臺(tái)、服務(wù)器的深度學(xué)習(xí)平臺(tái)、云端的深度學(xué)習(xí)平臺(tái)。超輕型的深度學(xué)習(xí)平臺(tái)針對(duì)的是邊端保密項(xiàng)目,這類項(xiàng)目往往數(shù)量少,邊端無(wú)法聯(lián)網(wǎng),這種情況下,超輕型的便攜式深度學(xué)習(xí)算力平臺(tái)就十分有優(yōu)勢(shì)。對(duì)于各個(gè)邊端可以進(jìn)行聯(lián)網(wǎng)互聯(lián),數(shù)據(jù)量在服務(wù)器算力承受范圍之內(nèi)的產(chǎn)線級(jí)客戶來(lái)說(shuō),服務(wù)器的深度學(xué)習(xí)平臺(tái)才是最佳選擇。而針對(duì)數(shù)據(jù)量大,沒(méi)有保密需求的客戶,需要云級(jí)別的算力,則可以使用云端的算力平臺(tái)。凌云光以多維度算力平臺(tái),滿足不同的客戶需求,提升客戶服務(wù)能力。
(2)數(shù)據(jù)層
充分利用扎根工業(yè)領(lǐng)域多年的優(yōu)勢(shì),凌云光收集大量的缺陷樣本數(shù)據(jù),并對(duì)樣本進(jìn)行清洗和標(biāo)注,形成數(shù)據(jù)資源。此外,還對(duì)過(guò)往樣本的缺陷和根因也進(jìn)行標(biāo)注,便于在未來(lái)進(jìn)行數(shù)據(jù)挖掘和根因分析,從而從根本上提高工廠的檢測(cè)效率,進(jìn)而提高工廠產(chǎn)品良率。
(3)算法層
凌云光深度剖析開(kāi)源深度學(xué)習(xí)算法,構(gòu)建屬于工業(yè)人工智能深度學(xué)習(xí)的頂尖算法研究方向,包括小樣本、超低耗時(shí)的模型研發(fā)等。比如在印刷質(zhì)量檢測(cè)領(lǐng)域,幅寬一米的印刷品,速度要達(dá)到120米/分鐘,常規(guī)的深度學(xué)習(xí)模型是行不通的。此外,我們還深入研究了深度預(yù)適應(yīng)算法、Open Set Learning、零樣本學(xué)習(xí)方法、細(xì)粒度圖像的分類方法、工業(yè)的知識(shí)圖譜等。
4 小結(jié)
小樣本深度學(xué)習(xí)未來(lái)將成為一個(gè)體系,會(huì)有多種多樣的方法。例如,可以使用模型微調(diào)的方法、數(shù)據(jù)增強(qiáng)的方法、遷移學(xué)習(xí)的方法等。凌云光正在研發(fā)的下一代真正適用于工業(yè)的小樣本深度學(xué)習(xí)就融合了這些方法。
回顧工業(yè)人工智能的發(fā)展過(guò)程不難發(fā)現(xiàn),直接套用國(guó)外已有的開(kāi)源模型,很難滿足實(shí)際需求,在前人的基礎(chǔ)上,必須有所創(chuàng)新,去適應(yīng)工業(yè)中的小而多的應(yīng)用場(chǎng)景。我們?cè)诠I(yè)人工智能領(lǐng)域,必須通過(guò)自主研發(fā),成為行業(yè)參與者、引領(lǐng)者,進(jìn)而構(gòu)建真正的智慧工廠。
摘自《自動(dòng)化博覽》2021年12月刊