硅谷巨頭如谷歌、蘋果和臉譜都在通過訓練模擬人腦的神經網絡模型來發展人工智能技術。據美國電氣和電子工程師協會《光譜》網站報道,美國田納西州的數字推理公司近日宣布,已建成一個包含1600億參數的神經網絡模型——比之前的至少大10倍。
這一神經網絡模型輕而易舉地刷新了之前的紀錄:谷歌和美國勞倫斯?利弗莫爾國家實驗室的神經網絡模型分別包含112億參數和150億參數。此外,數字推理公司的神經網絡模型在應對含有2萬個詞語類比的行業標準數據集時,也表現出更好的精確性:86%的正確率,遠高于谷歌神經網絡模型創下的76%正確率的紀錄。
數字推理公司首席技術官馬修?拉塞爾在新聞發布會上表示:“我們對這一神經網絡模型創造的成績和對人工智能深度學習所做的貢獻感到非常驕傲。”
近幾年,由于機器學習技術取得眾多突破性進展,人工智能領域正在經歷一輪“復興”。其中備受重視的機器學習策略是增強學習。運用這種策略,電腦程序通過反復試錯可以得知什么樣的行為可以獲得獎勵,但是電腦程序在處理接近現實世界難度的數據時往往力不從心。為了對其進行升級,研發人員將增強學習與卷積神經網絡技術結合起來,這就是所謂的深度學習策略。
深度學習涉及對機器人構建五層或更多層的人工神經網絡,這里的深度指的是神經網絡的層數而不是知識的深度。在神經網絡模型中,所有人工神經元都會接入數據庫并共同解決問題,例如閱讀書寫筆跡或辨認講話內容。神經網絡模型可以通過改變神經元之間的連接方式來調整它們之間的互動并繼續解決下一個問題。通過訓練,神經網絡模型可以學會哪種模式是處理問題的最佳途徑。臉譜人工智能研究實驗室負責人雅恩?樂昆曾把深度學習描述為“讓機器人學習表達世界”。
數字推理公司為了讓其神經網絡模型在處理詞語類比數據集時達到一定的精確性,使用了三臺多核電腦對其進行訓練。該公司計劃在近期使用更大的數據集和詞匯量對其神經網絡模型進行測試。
摘自 中國科技網