您的位置：首頁(yè) >熱點(diǎn) > 正文

大語(yǔ)言模型中的涌現現象是不是偽科學(xué)？-前沿資訊

來(lái)源：程序員客棧時(shí)間：2023-04-22 10:40:26

Datawhale干貨

作者：平凡@知乎，諾桑比亞大學(xué)，在讀博士

【資料圖】

今天晚上，花了一點(diǎn)兒時(shí)間看了兩篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現現象。

大規模神經(jīng)網(wǎng)絡(luò )下的涌現現象

在機器學(xué)習中使用大規模神經(jīng)網(wǎng)絡(luò )時(shí)，由于增加了參數數量、訓練數據或訓練步驟等因素，出現了定性上的新能力和性質(zhì)，這些能力和性質(zhì)在小規模神經(jīng)網(wǎng)絡(luò )中往往是不存在的。

第一篇文章舉了這個(gè)例子，每個(gè)圖都可以理解為一個(gè)任務(wù)，橫軸是神經(jīng)網(wǎng)絡(luò )的規模，而縱軸是準確率，可以理解為模型的性能。

我們拿圖一來(lái)看，在10的22次方前，這些模型基本上的性能基本上都很穩定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個(gè)任務(wù)上都表現出類(lèi)似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評論引用在這里：

作者發(fā)現，當我們訓練用網(wǎng)絡(luò )計算同余加法 a+b = ? (mod c) 時(shí)，網(wǎng)絡(luò )在某個(gè)時(shí)間突然獲得了 100% 準確率。分析發(fā)現，神經(jīng)網(wǎng)絡(luò )實(shí)際上“頓悟”了使用傅立葉變換來(lái)計算同余加法！這個(gè)算法可以證明是正確的，反人類(lèi)直覺(jué)的。

從這倆例子里面我的感受是，只要數據量足夠且真實(shí)，且模型沒(méi)有硬錯誤的前提下，不斷的訓練說(shuō)不定真的能夠產(chǎn)生一些意想不到的效果。

還有就是我覺(jué)得人類(lèi)現在積累的知識并不少，但是系統的少，零星的多，如果類(lèi)似ChatGPT這樣的大模型可以拿所有的人類(lèi)已有知識進(jìn)行不斷學(xué)習的話(huà)，我覺(jué)得有很大概率會(huì )讓它涌現出意想不到的能力。

甚至可能把人類(lèi)的生產(chǎn)力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

免責聲明：本文不構成任何商業(yè)建議，投資有風(fēng)險，選擇需謹慎！本站發(fā)布的圖文一切為分享交流，傳播正能量，此文不保證數據的準確性，內容僅供參考

關(guān)鍵詞：

相關(guān)內容

大語(yǔ)言模型中的涌現現象是不是偽科學(xué)？-前沿資訊

四川任免楊治剛、曾華俊、陳波等職務(wù)

全面注冊制落地滿(mǎn)兩個(gè)交易周：首批主板注冊制新股表現平穩一二級市場(chǎng)估值差進(jìn)一步縮小_全球最資訊

全球熱推薦：這是一根命運相連的線(xiàn)

世界百事通！“五一”旅游熱度持續高漲預訂火爆

活力夜中國丨點(diǎn)亮經(jīng)濟新“夜”態(tài) 探訪(fǎng)熱鬧繁忙的港口之夜全球球精選

這個(gè)論壇，重點(diǎn)關(guān)注“Z世代”

媒體：跟風(fēng)漲價(jià)往往得不償失是什么情況媒體：跟風(fēng)漲價(jià)往往得不償失具體來(lái)龍去脈是怎么樣

今日聚焦!當日快訊：中國民航中性電子運單系統在貴陽(yáng)機場(chǎng)上線(xiàn)運行

金融力量助推西部陸海新通道“加速跑”

股票行情快報：新勁剛（300629）4月21日主力資金凈賣(mài)出389.23萬(wàn)元|今頭條

每體：巴薩高層與熱刺進(jìn)行了溝通，提醒后者很多球隊關(guān)注朗格萊|天天滾動(dòng)

一季度客運量同比增長(cháng)近七成民航運輸顯著(zhù)恢復

搭好知識產(chǎn)權保護平臺焦點(diǎn)日報

馬云被聘為香港大學(xué)榮譽(yù)教授是什么情況馬云被聘為香港大學(xué)榮譽(yù)教授具體來(lái)龍去脈是怎么樣_資訊推薦

全球快消息！當日快訊：責任準備金評估利率或下調，監管部門(mén)指導險企儲備新產(chǎn)品

鐵路回應軟臥能否按性別分配是什么情況鐵路回應軟臥能否按性別分配具體來(lái)龍去脈是怎么樣|當前簡(jiǎn)訊

天天觀(guān)天下！湛江徐聞菠蘿切開(kāi)賣(mài) 切出一個(gè)“土特產(chǎn)”大市場(chǎng)

高質(zhì)量發(fā)展縣域行 | 公主嶺市：按下項目建設“快進(jìn)鍵”，激活高質(zhì)量發(fā)展新動(dòng)能最新快訊

SMM分析：3月進(jìn)口窗口關(guān)閉大量精煉鋅流入保稅區

熱門(mén)資訊

這個(gè)論壇，重點(diǎn)關(guān)注“Z世代” 作為伴隨互聯(lián)網(wǎng)發(fā)展而長(cháng)大的一代，...
全球熱推薦：這是一根命運相連的線(xiàn) 4月22日是世界地球日，今年的主題...
四川任免楊治剛、曾華俊、陳波等職務(wù) 中國經(jīng)濟網(wǎng)成都4月22日綜合報道四...
世界百事通！“五一”旅游熱度持續高漲預訂火爆 目前，多個(gè)熱門(mén)旅游城市的酒店預訂...
全面注冊制落地滿(mǎn)兩個(gè)交易周：首批主板注冊制新股表現平穩一二級市場(chǎng)估值差進(jìn)一... 4月10日，首批10只主板注冊制新股...
活力夜中國丨點(diǎn)亮經(jīng)濟新“夜”態(tài) 探訪(fǎng)熱鬧繁忙的港口之夜全球球精選 今年以來(lái)，我國經(jīng)濟增長(cháng)企穩回升，...
搭好知識產(chǎn)權保護平臺焦點(diǎn)日報 筆者日前在廣東珠海、中山等地參觀(guān)...
一季度客運量同比增長(cháng)近七成民航運輸顯著(zhù)恢復 記者日前從民航局獲悉：一季度，民...
蘇丹武裝部隊宣布奪回陸軍司令部控制權 新華社喀土穆4月21日電（記者王丙...
天天熱消息：江西公示：蔣文定擬提名為設區市市長(cháng)候選人 中國經(jīng)濟網(wǎng)南昌4月22日綜合報道21...
重慶奉節培育主導產(chǎn)業(yè)——“一棵樹(shù)”致富30萬(wàn)人天天時(shí)訊 最近一段時(shí)間，在重慶市奉節縣永樂(lè )...
當前快看：真正把“黑臭水”變成“幸福河” 日前，為深入貫徹落實(shí)黨的二十大精...
意大利小伙羅密歐：與中國“有約”發(fā)現中國之美期待共創(chuàng )中國故事！ “沒(méi)有體驗就沒(méi)有發(fā)言權，我的責任...
奧地利籍代表艾嘉德：中國地域文化的多樣性“令人驚嘆” “與1992年我第一次來(lái)到北京相比，...
今日快看!2023中國網(wǎng)絡(luò )媒體論壇“青春律動(dòng)·Z世代網(wǎng)絡(luò )空間新表達”平行論壇在南京舉辦 4月21日，2023年中國網(wǎng)絡(luò )媒體論壇...

文章排行

最新圖文

杭州推公共交通出行優(yōu)惠：學(xué)生半價(jià) 地鐵公交換乘再優(yōu)惠 【杭州推公共交通出行優(yōu)惠：學(xué)生半...
金寨一中官網(wǎng)登錄-金寨一中官網(wǎng) 1、簡(jiǎn)介：安徽省金寨第一中學(xué)，簡(jiǎn)...
夜夜笙歌的意思是什么_夜夜笙歌的含義_全球焦點(diǎn) 解答：1、夜夜笙歌：中國成語(yǔ)，拼...
國家外匯局：1-3月銀行累計結匯37362億元、售匯38417億元人民幣 央視網(wǎng)消息：4月21日，國家外匯管...

国产福利萌白酱精品一区|国产成人久久精品流白浆|国产一级A级免费视频|久久综合亚洲鲁鲁五月天欧|欧美黑人巨大视频HD