訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?——第二部分
作者:Ole Dreessen,現(xiàn)場(chǎng)應(yīng)用工程師
摘要本文是系列文章的第二部分,重點(diǎn)介紹卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特性和應(yīng)用。CNN主要用于模式識(shí)別和對(duì)象分類。在第一部分文章《卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介:什么是機(jī)器學(xué)習(xí)?——第一部分》中,我們比較了在微控制器中運(yùn)行經(jīng)典線性規(guī)劃程序與運(yùn)行CNN的區(qū)別,并展示了CNN的優(yōu)勢(shì)。我們還探討了CIFAR網(wǎng)絡(luò),該網(wǎng)絡(luò)可以對(duì)圖像中的貓、房子或自行車等對(duì)象進(jìn)行分類,還可以執(zhí)行簡(jiǎn)單的語音識(shí)別。本文重點(diǎn)解釋如何訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)以解決實(shí)際問題。
(資料圖片)
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程本系列文章的第一部分討論的CIFAR網(wǎng)絡(luò)由不同層的神經(jīng)元組成。如圖1所示,32 × 32像素的圖像數(shù)據(jù)被呈現(xiàn)給網(wǎng)絡(luò)并通過網(wǎng)絡(luò)層傳遞。CNN處理過程的第一步就是提取待區(qū)分對(duì)象的特性和結(jié)構(gòu),這需要借助濾波器矩陣實(shí)現(xiàn)。設(shè)計(jì)人員對(duì)CIFAR網(wǎng)絡(luò)進(jìn)行建模后,由于最初無法確定這些濾波器矩陣,因此這個(gè)階段的網(wǎng)絡(luò)無法檢測(cè)模式和對(duì)象。
為此,首先需要確定濾波器矩陣的所有參數(shù),以最大限度地提高檢測(cè)對(duì)象的精度或最大限度地減少損失函數(shù)。這個(gè)過程就稱為神經(jīng)網(wǎng)絡(luò)訓(xùn)練。本系列文章的第一部分所描述的常見應(yīng)用在開發(fā)和測(cè)試期間只需對(duì)網(wǎng)絡(luò)進(jìn)行一次訓(xùn)練就可以使用,無需再調(diào)整參數(shù)。如果系統(tǒng)對(duì)熟悉的對(duì)象進(jìn)行分類,則無需額外訓(xùn)練;當(dāng)系統(tǒng)需要對(duì)全新的對(duì)象進(jìn)行分類時(shí),才需要額外進(jìn)行訓(xùn)練。
進(jìn)行網(wǎng)絡(luò)訓(xùn)練需要使用訓(xùn)練數(shù)據(jù)集,并使用類似的一組測(cè)試數(shù)據(jù)集來測(cè)試網(wǎng)絡(luò)的精度。例如CIFAR-10網(wǎng)絡(luò)數(shù)據(jù)集為十個(gè)對(duì)象類的圖像集合:飛機(jī)、汽車、鳥、貓、鹿、狗、青蛙、馬、輪船和卡車。我們必須在訓(xùn)練CNN之前對(duì)這些圖像進(jìn)行命名,這也是人工智能應(yīng)用開發(fā)過程中最為復(fù)雜的部分。本文討論的訓(xùn)練過程采用反向傳播的原理,即向網(wǎng)絡(luò)連續(xù)展示大量圖像,并且每次都同時(shí)傳送一個(gè)目標(biāo)值。本例的目標(biāo)值為圖像中相關(guān)的對(duì)象類。在每次顯示圖像時(shí),濾波器矩陣都會(huì)被優(yōu)化,這樣對(duì)象類的目標(biāo)值就會(huì)和實(shí)際值相匹配。完成此過程的網(wǎng)絡(luò)就能夠檢測(cè)出訓(xùn)練期間從未看到過的圖像中的對(duì)象。
圖1.CIFAR CNN架構(gòu)。
圖2.由前向傳播和反向傳播組成的訓(xùn)練循環(huán)。
過擬合和欠擬合在神經(jīng)網(wǎng)絡(luò)的建模過程中經(jīng)常會(huì)出現(xiàn)的問題是:神經(jīng)網(wǎng)絡(luò)應(yīng)該有多少層,或者是神經(jīng)網(wǎng)絡(luò)的濾波器矩陣應(yīng)該有多大?;卮疬@個(gè)問題并非易事,因此討論網(wǎng)絡(luò)的過擬合和欠擬合至關(guān)重要。過擬合由模型過于復(fù)雜以及參數(shù)過多而導(dǎo)致。我們可以通過比較訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的損失來確定預(yù)測(cè)模型與訓(xùn)練數(shù)據(jù)集的擬合程度。如果訓(xùn)練期間損失較低并且在向網(wǎng)絡(luò)呈現(xiàn)從未顯示過的測(cè)試數(shù)據(jù)時(shí)損失過度增加,這就強(qiáng)烈表明網(wǎng)絡(luò)已經(jīng)記住了訓(xùn)練數(shù)據(jù)而不是在實(shí)施模式識(shí)別。此類情況主要發(fā)生在網(wǎng)絡(luò)的參數(shù)存儲(chǔ)空間過大或者網(wǎng)絡(luò)的卷積層過多的時(shí)候。這種情況下應(yīng)當(dāng)縮小網(wǎng)絡(luò)規(guī)模。
損失函數(shù)和訓(xùn)練算法學(xué)習(xí)分兩個(gè)步驟進(jìn)行。第一步,向網(wǎng)絡(luò)展示圖像,然后由神經(jīng)元網(wǎng)絡(luò)處理這些圖像生成一個(gè)輸出矢量。輸出矢量的最大值表示檢測(cè)到的對(duì)象類,例如示例中的“狗”,該值不一定是正確的。這一步稱為前向傳播。
目標(biāo)值與輸出時(shí)產(chǎn)生的實(shí)際值之間的差值稱為損失,相關(guān)函數(shù)則稱為損失函數(shù)。網(wǎng)絡(luò)的所有要素和參數(shù)均包含在損失函數(shù)中。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程旨在以最小化損失函數(shù)的方式定義這些參數(shù)。這種最小化可通過反向傳播的過程實(shí)現(xiàn)。在反向傳播的過程中,輸出產(chǎn)生的偏置(損失 = 目標(biāo)值-實(shí)際值)通過網(wǎng)絡(luò)的各層反饋,直至達(dá)到網(wǎng)絡(luò)的起始層。
因此,前向傳播和反向傳播在訓(xùn)練過程中產(chǎn)生了一個(gè)可以逐步確定濾波器矩陣參數(shù)的循環(huán)。這種循環(huán)過程會(huì)不斷重復(fù),直至損失值降至一定程度以下。
優(yōu)化算法、梯度和梯度下降法為說明訓(xùn)練過程,圖3顯示了一個(gè)包含x和y兩個(gè)參數(shù)的損失函數(shù)的示例,這里z軸對(duì)應(yīng)于損失。如果我們仔細(xì)查看該損失函數(shù)的三維函數(shù)圖,我們就會(huì)發(fā)現(xiàn)這個(gè)函數(shù)有一個(gè)全局最小值和一個(gè)局部最小值。
目前,有大量數(shù)值優(yōu)化算法可用于確定權(quán)重和偏置。其中,梯度下降法最為簡(jiǎn)單。梯度下降法的理念是使用梯度算子在逐步訓(xùn)練的過程中找到一條通向全局最小值的路徑,該路徑的起點(diǎn)從損失函數(shù)中隨機(jī)選擇。梯度算子是一個(gè)數(shù)學(xué)運(yùn)算符,它會(huì)在損失函數(shù)的每個(gè)點(diǎn)生成一個(gè)梯度矢量。該矢量的方向指向函數(shù)值變化最大的方向,幅度對(duì)應(yīng)于函數(shù)值的變化程度。在圖3的函數(shù)中,右下角(紅色箭頭處)由于表面平坦,因此梯度矢量的幅度較小。而接近峰值時(shí)的情況則完全不同。此處矢量(綠色箭頭)的方向急劇向下,并且由于此處高低差明顯,梯度矢量的幅度也較大。
圖3.使用梯度下降法確定到最小值的不同路徑。
因此我們可以利用梯度下降法從任意選定的起點(diǎn)開始以迭代的方式尋找下降至山谷的最陡峭路徑。這意味著優(yōu)化算法會(huì)在起點(diǎn)計(jì)算梯度,并沿最陡峭的下降方向前進(jìn)一小步。之后算法會(huì)重新計(jì)算該點(diǎn)的梯度,繼續(xù)尋找創(chuàng)建一條從起點(diǎn)到山谷的路徑。這種方法的問題在于起點(diǎn)并非是提前定義的,而是隨機(jī)選擇的。在我們的三維地圖中,某些細(xì)心的讀者會(huì)將起點(diǎn)置于函數(shù)圖左側(cè)的某個(gè)位置,以確保路徑的終點(diǎn)為全局最小值(如藍(lán)色路徑所示)。其他兩個(gè)路徑(黃色和橙色)要么非常長(zhǎng),要么終點(diǎn)位于局部最小值。但是,算法必須對(duì)成千上萬個(gè)參數(shù)進(jìn)行優(yōu)化,顯然起點(diǎn)的選擇不可能每次都碰巧正確。在具體實(shí)踐中,這種方法用處不大。因?yàn)樗x擇的起點(diǎn)可能會(huì)導(dǎo)致路徑(即訓(xùn)練時(shí)間)較長(zhǎng),或者目標(biāo)點(diǎn)并不位于全局最小值,導(dǎo)致網(wǎng)絡(luò)的精度下降。
因此,為避免上述問題,過去幾年已開發(fā)出大量可作為替代的優(yōu)化算法。一些替代的方法包括隨機(jī)梯度下降法、動(dòng)量法、AdaGrad方法、RMSProp方法、Adam方法等。鑒于每種算法都有其特定的優(yōu)缺點(diǎn),實(shí)踐中具體使用的算法將由網(wǎng)絡(luò)開發(fā)人員決定。
訓(xùn)練數(shù)據(jù)在訓(xùn)練過程中,我們會(huì)向網(wǎng)絡(luò)提供標(biāo)有正確對(duì)象類的圖像,如汽車、輪船等。本例使用了已有的CIFAR-10數(shù)據(jù)集。當(dāng)然,在具體實(shí)踐中,人工智能可能會(huì)用于識(shí)別貓、狗和汽車之外的領(lǐng)域。這可能需要開發(fā)新應(yīng)用,例如檢測(cè)制造過程中螺釘?shù)馁|(zhì)量必須使用能夠區(qū)分好壞螺釘?shù)挠?xùn)練數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。創(chuàng)建此類數(shù)據(jù)集極其耗時(shí)費(fèi)力,往往是開發(fā)人工智能應(yīng)用過程中成本最高的一步。編譯完成的數(shù)據(jù)集分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用于訓(xùn)練,而測(cè)試數(shù)據(jù)則用于在開發(fā)過程的最后檢查訓(xùn)練好的網(wǎng)絡(luò)的功能。
結(jié)論本系列文章的第一部分《人工智能簡(jiǎn)介:什么是機(jī)器學(xué)習(xí)?——第一部分》介紹了神經(jīng)網(wǎng)絡(luò)并對(duì)其設(shè)計(jì)和功能進(jìn)行了詳細(xì)探討。本文則定義了函數(shù)所需的所有權(quán)重和偏置,因此現(xiàn)在可以假定網(wǎng)絡(luò)能夠正常運(yùn)行。在后續(xù)第三部分的文章中,我們將通過硬件運(yùn)行神經(jīng)網(wǎng)絡(luò)以測(cè)試其識(shí)別貓的能力。這里我們將使用ADI公司開發(fā)的帶硬件CNN加速器的MAX78000人工智能微控制器來進(jìn)行演示。
關(guān)于ADI公司Analog Devices, Inc. (NASDAQ: ADI)是全球領(lǐng)先的半導(dǎo)體公司,致力于在現(xiàn)實(shí)世界與數(shù)字世界之間架起橋梁,以實(shí)現(xiàn)智能邊緣領(lǐng)域的突破性創(chuàng)新。ADI提供結(jié)合模擬、數(shù)字和軟件技術(shù)的解決方案,推動(dòng)數(shù)字化工廠、汽車和數(shù)字醫(yī)療等領(lǐng)域的持續(xù)發(fā)展,應(yīng)對(duì)氣候變化挑戰(zhàn),并建立人與世界萬物的可靠互聯(lián)。ADI公司2022財(cái)年收入超過120億美元,全球員工2.4萬余人。攜手全球12.5萬家客戶,ADI助力創(chuàng)新者不斷超越一切可能。更多信息,請(qǐng)?jiān)L問www.analog.com/cn。
關(guān)于作者Ole Dreessen是ADI公司的現(xiàn)場(chǎng)應(yīng)用工程師,于2014年加入ADI公司,此前曾在Avnet Memec和Macnica任職,負(fù)責(zé)支持通信產(chǎn)品和高性能微處理器。Ole在微控制器和安全方面擁有廣泛的專業(yè)知識(shí),擁有豐富的會(huì)議主講經(jīng)驗(yàn)。在業(yè)余時(shí)間,他是混沌計(jì)算機(jī)俱樂部的活躍成員,主要研究逆向工程和嵌入式安全等概念。
關(guān)鍵詞:
您可能也感興趣:
- 當(dāng)前看點(diǎn)!高通推出先進(jìn)物聯(lián)網(wǎng)解決方案,...
- 最新消息:氮化鎵 (GaN) 帶來電源管理...
- 訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?—...
- TDK 推出用于高速電機(jī)應(yīng)用場(chǎng)景的抗雜散...
- 浪潮海岳低代碼平臺(tái)inBuilder開源社區(qū)版...
- 環(huán)球今日訊!Guidewire任命Michael How...
- Virgin Media O2 選擇 Mavenir 部署其開放式 RAN
- 【時(shí)快訊】Snapmaker Artisan和J1榮獲2...
今日熱點(diǎn)
為您推薦
機(jī)票里面包含保險(xiǎn)嗎?飛機(jī)保險(xiǎn)有必要買嗎?
遼寧擴(kuò)大緩繳社保費(fèi)政策實(shí)施范圍 補(bǔ)繳期間免收滯納金
更多
- 當(dāng)前看點(diǎn)!高通推出先進(jìn)物聯(lián)網(wǎng)解決方案,賦能全新行業(yè)應(yīng)用并助...
- 最新消息:氮化鎵 (GaN) 帶來電源管理變革的 3 大原因
- 訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?——第二部分
- TDK 推出用于高速電機(jī)應(yīng)用場(chǎng)景的抗雜散磁場(chǎng) ASIL C 級(jí)霍...
- 浪潮海岳低代碼平臺(tái)inBuilder開源社區(qū)版正式發(fā)布
- 環(huán)球今日訊!Guidewire任命Michael Howe為首席產(chǎn)品官
- Virgin Media O2 選擇 Mavenir 部署其開放式 RAN
- 【時(shí)快訊】Snapmaker Artisan和J1榮獲2023年紅點(diǎn)獎(jiǎng)和2023年iF設(shè)計(jì)獎(jiǎng)
更多
- 全球快資訊丨《大空頭》原型:硅谷銀行危機(jī)或許很快就能解除
- 當(dāng)前熱訊:蕪湖宜居投資20億元小公募債券狀態(tài)更新為“已反饋”
- Kaiko:3月份Coinbase的市場(chǎng)深度腰斬,幣安下降13%
- 環(huán)球快資訊:汪濤:2月信貸增速再超預(yù)期
- 世界今日?qǐng)?bào)丨武漢地鐵發(fā)行10億元公司債 票面利率3.38%
- 利率下調(diào)仍受熱捧 年內(nèi)首批儲(chǔ)蓄國(guó)債開售即告罄
- 全球滾動(dòng):北京城建集團(tuán)10億短期融資券即將兌付 利率1.76%
- 全球即時(shí):美的置業(yè)9.84億公司債將付年息 票面利率4.20%
排行
- 最新消息:氮化鎵 (GaN) 帶來電源管理變革的 3 大原因
- 科技智庫需要進(jìn)一步加快智庫成果轉(zhuǎn)化
- 雄安設(shè)立兩年 290家京企“搶灘登陸”
- 女子拽男友公交車方向盤受審 涉嫌危害公共安全罪
- 成都實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略,將挖掘培養(yǎng)高素質(zhì)職工人才
- “人造雪粉”接觸眼睛或被誤食可能有危險(xiǎn)
- 這一年,我們?yōu)榭萍肌俺尺^的架”真不少
- “四成人不知電商法”該如何破題
- 監(jiān)督搭平臺(tái)信息都上網(wǎng) 打通精準(zhǔn)監(jiān)督‘最后一公里’
- 智能烹飪機(jī),選購有講究
最近更新
- 訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?——第二部分
- 最新消息:氮化鎵 (GaN) 帶來電源管理變革的 3 大原因
- 當(dāng)前看點(diǎn)!高通推出先進(jìn)物聯(lián)網(wǎng)解決方案,賦能全新行業(yè)應(yīng)用并助...
- TDK 推出用于高速電機(jī)應(yīng)用場(chǎng)景的抗雜散磁場(chǎng) ASIL C 級(jí)霍...
- 歐暇·地中海酒店 以特色產(chǎn)品成就品牌發(fā)展
- 怎么預(yù)防甲流?甲流一定要吃奧司他韋嗎?
- 甲型流感癥狀有哪些?甲型流感一般幾天能好?
- 入秋后掉頭發(fā)特別嚴(yán)重是怎么回事?掉頭發(fā)要怎么治?
- 今日快訊:又有高校請(qǐng)師生免費(fèi)吃魚!網(wǎng)友:微笑中透露著眼紅
- 風(fēng)濕病最佳治療方法是什么?類風(fēng)濕能徹底治愈嗎?
- 母乳期減肥方法有哪些?哺乳期怎么吃可以減肥?
- 脆滑肉是哪個(gè)地方的菜?比較脆的菜有哪些?
- 燕麥三杯骨是什么地方的菜?燕麥菜怎么做好吃?
- 歐暇·地中海 以多元收益模式獲得高質(zhì)量發(fā)展
- 如何治療青春痘疤痕?痤瘡引起的疤痕疙瘩怎么治療?
- 如何去雞皮疙瘩?雞皮膚會(huì)自己消失嗎?
- 腳外翻矯正方法有哪些?扁平足能矯正過來嗎?
- 你們平時(shí)熱身嗎?都有做哪些熱身動(dòng)作?
- 世界熱點(diǎn)!深蹲前怎么熱身,鍛煉完后怎么拉伸?
- 體能訓(xùn)練(一):運(yùn)動(dòng)前如何正確的熱身?
- 每日簡(jiǎn)訊:有什么熱身的好方法?
- 當(dāng)前觀點(diǎn):健身前為什么要熱身?
- 什么是梨子減肥法?減肥最快效果最好的方法有哪些?
- 天天動(dòng)態(tài):高盛將VS工具功能擴(kuò)展到加密貨幣等領(lǐng)域
- 小心!雞蛋生吃,嚴(yán)重可致命!挑選時(shí)需注意→
- 血友病傳男不傳女?血友病患者不能做手術(shù)?一起關(guān)注“玻璃人”
- 重醫(yī)附二院·寬仁好醫(yī)生丨40歲后長(zhǎng)高10厘米是好事嗎?小心是...
- 【環(huán)球時(shí)快訊】7月1日起,這些品種將列入麻醉和精神藥品目錄
- 【全球新視野】重慶醫(yī)專結(jié)核病防治志愿者宣講團(tuán):微光成炬 ...
- 認(rèn)準(zhǔn)差異化賽道 歐暇·地中海酒店投資人的生意經(jīng)
今日要聞
- 歐暇·地中海酒店 以特色產(chǎn)品成就品牌發(fā)展
- 當(dāng)前看點(diǎn)!高通推出先進(jìn)物聯(lián)網(wǎng)解決方案,賦能全新行業(yè)應(yīng)用并助力擴(kuò)展物聯(lián)網(wǎng)生態(tài)系統(tǒng)
- 最新消息:氮化鎵 (GaN) 帶來電源管理變革的 3 大原因
- 訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò):什么是機(jī)器學(xué)習(xí)?——第二部分
- TDK 推出用于高速電機(jī)應(yīng)用場(chǎng)景的抗雜散磁場(chǎng) ASIL C 級(jí)霍爾效應(yīng)位置傳感器系列
- 歐暇·地中海 以多元收益模式獲得高質(zhì)量發(fā)展
- 認(rèn)準(zhǔn)差異化賽道 歐暇·地中海酒店投資人的生意經(jīng)
- 夯實(shí)產(chǎn)品+服務(wù) 歐暇·地中海酒店以基本功制勝
- 天天動(dòng)態(tài):高盛將VS工具功能擴(kuò)展到加密貨幣等領(lǐng)域
- 以實(shí)力彰顯品牌價(jià)值,福熙防盜門榮獲十大品牌稱號(hào)