20230529期ChatGPT的语言方式引发思考:人类如何习得语言(PDF版Word版音频) Johnson:Thelanguageinstinct ChatGPT’swaywithwordsraisesquestionsabouthowhumansacquirelanguage 【1】Whendeepblue,achesscomputer,defeatedGarryKasparov,aworldchampion,in1997manygaspedinfearofmachinestriumphingovermankind。Intheinterveningyears,artificialintelligencehasdonesomeastonishingthings,butnonehasmanagedtocapturethepublicimaginationinquitethesameway。Now,though,theastonishmentoftheDeepBluemomentisback,becausecomputersareemployingsomethingthathumansconsidertheirdefiningability:language。 【2】Orarethey?Certainly,largelanguagemodels(LLMS),ofwhichthemostfamousisChatGPT,producewhatlookslikeimpeccablehumanwriting。Butadebatehasensuedaboutwhatthemachinesareactuallydoinginternally,whatitisthathumans,inturn,dowhentheyspeakand,insidetheacademy,aboutthetheoriesoftheworld’smostfamouslinguist,NoamChomsky。 【3】AlthoughProfessorChomsky’sideashavechangedconsiderablysinceherosetoprominenceinthe1950s,severalelementshaveremainedfairlyconstant。Heandhisfollowersarguethathumanlanguageisdifferentinkind(notjustdegreeofexpressiveness)fromallotherkindsofcommunication。Allhumanlanguagesaremoresimilartoeachotherthantheyareto,say,whalesongorcomputercode。ProfessorChomskyhasfrequentlysaidaMartianvisitorwouldconcludethatallhumansspeakthesamelanguage,withsurfacevariation。 【4】Perhapsmostnotably,Chomskyantheoriesholdthatchildrenlearntheirnativelanguageswithastonishingspeedandeasedespite“thepovertyofthestimulus”:thesloppyandoccasionallanguagetheyhearinchildhood。Theonlyexplanationforthiscanbethatsomekindofpredispositionforlanguageisbuiltintothehumanbrain。 【5】Chomskyanideashavedominatedthelinguisticfieldofsyntaxsincetheirbirth。ButmanylinguistsarestridentantiChomskyans。AndsomearenowseizingonthecapacitiesofllmstoattackChomskyantheoriesanew。 【6】Grammarhasahierarchical,nestedstructureinvolvingunitswithinotherunits。Wordsformphrases,whichformclauses,whichformsentencesandsoon。Chomskyantheorypositsamentaloperation,“Merge”,whichgluessmallerunitstogethertoformlargeronesthatcanthenbeoperatedonfurther(andsoon)。InarecentNewYorkTimesoped,themanhimself(now94)andtwocoauthorssaid“weknow”thatcomputersdonotthinkoruselanguageashumansdo,referringimplicitlytothiskindofcognition。LLMS,ineffect,merelypredictthenextwordinastringofwords。 【7】Yetitishard,forseveralreasons,tofathomwhatLLMS“think”。DetailsoftheprogrammingandtrainingdataofcommercialoneslikeChatGPTareproprietary。Andnoteventheprogrammersknowexactlywhatisgoingoninside。 【8】linguistshave,however,foundcleverwaystotestLLMS’underlyingknowledge,ineffecttrickingthemwithprobingtests。Andindeed,LLMSseemtolearnnested,hierarchicalgrammaticalstructures,eventhoughtheyareexposedtoonlylinearinput,ie,stringsoftext。Theycanhandlenovelwordsandgrasppartsofspeech。TellChatGPTthat“dax”isaverbmeaningtoeatasliceofpizzabyfoldingit,andthesystemdeploysiteasily:“Afteralongdayatwork,IliketorelaxanddaxonasliceofpizzawhilewatchingmyfavouriteTVshow。”(Theimitativeelementcanbeseenin“daxon”,whichChatGPTprobablypatternedonthelikesof“chewon”or“munchon”。) 【9】Whataboutthe“povertyofthestimulus”?Afterall,GPT3(theLLMunderlyingChatGPTuntiltherecentreleaseofGPT4)isestimatedtobetrainedonabout1,000timesthedataahumantenyearoldisexposedto。Thatleavesopenthepossibilitythatchildrenhaveaninborntendencytogrammar,makingthemfarmoreproficientthananyLLM。InaforthcomingpaperinlinguisticInquiry,researchersclaimtohavetrainedanLLMonnomoretextthanahumanchildisexposedto,findingthatitcanuseevenrarebitsofgrammar。ButotherresearchershavetriedtotrainanLLMonadatabaseofonlychilddirectedlanguage(thatis,oftranscriptsofcarersspeakingtochildren)。HereLLMSfarefarworse。Perhapsthebrainreallyisbuiltforlanguage,asProfessorChomskysays。 【10】Itisdifficulttojudge。BothsidesoftheargumentaremarshallingLLMStomaketheircase。Theeponymousfounderofhisschooloflinguisticshasofferedonlyabrusqueriposte。Forhistheoriestosurvivethischallenge,hiscampwillhavetoputupastrongerdefence。 短语:1。原文:Whendeepblue,achesscomputer,defeatedGarryKasparov,aworldchampion,in1997manygaspedinfearofmachinestriumphingovermankind。 词典:infearof害怕;担忧 triumphover打败;战胜 例句:Welivedinconstantfearoflosingourjobs。 我们一直生活在担心失去工作的阴影里。 Workingsidebyside,wehavetheabilitytosolvethemostinsurmountableproblemsandtotriumphoverthegreatestofadversities。 只要携手合作,我们就有能力解决最难以克服的问题,战胜最大的逆境。 2。原文:AlthoughProfessorChomsky’sideashavechangedconsiderablysinceherosetoprominenceinthe1950s,severalelementshaveremainedfairlyconstant。 词典:risetoprominence崛起;声名鹊起 例句:Assherisestoprominenceintheinternationalworldofchess,shestruggleswithalcoholismandaddiction。 随着她在国际象棋界崭露头角,她与酗酒和毒瘾作斗争。 3。原文:AndsomearenowseizingonthecapacitiesofllmstoattackChomskyantheoriesanew。 词典:seizeon对大为关注;抓住(可利用的事物) 例句:Newspapersseizedontheresultsasproofthatglobalwarmingwasntreallyhappening。 各报纸纷纷以此结果为证据来证明全球变暖并没有真正发生。 4。原文:Theimitativeelementcanbeseenin“daxon”,whichChatGPTprobablypatternedonthelikesof“chewon”or“munchon”。 词典:pattern。。。on。。。模仿;仿效(被动形式:bepatternedon) 例句:Theclothingispatternedonathleteswear。 这些衣服是仿照运动员的穿着制作的。 长难句 1。原文:Now,though,theastonishmentoftheDeepBluemomentisback,becausecomputersareemployingsomethingthathumansconsidertheirdefiningability:language。 分析:本句包含一个原因状语从句和一个定语从句。主句为“theastonishmentoftheDeepBluemomentisback”;though在本句中为副词,表示“然而”;because为连词,引导原因状语从句“computersareemployingsomething”;“thathumansconsidertheirdefiningability:language”为限制性定语从句,修饰something。 译文:但现在,“深蓝”那样震撼的时刻又回来了,因为计算机正在运用人类认为是其决定性能力的东西:语言。 2。原文:Certainly,largelanguagemodels(LLMS),ofwhichthemostfamousisChatGPT,producewhatlookslikeimpeccablehumanwriting。 分析:本句包含一个非限制性定语从句和一个宾语从句。主句为“largelanguagemodelsproduce。。。”;“ofwhichthemostfamousisChatGPT”为非限制性定语从句,which指代LLMS;“whatlookslikeimpeccablehumanwriting”为宾语从句。 译文:当然,大型语言模型(LLMS)能像人类一样写作且无可挑剔,其中最有名的就是ChatGPT。 写作技巧: HereLLMSfarefarworse。 在这种情况下,大型语言模型表现要差得多。 生词:faren。旅费;路费;车费v。进展;进行 fare这个词常见的意思是“费用”,在本文中为熟词僻义,表示“情况如何;表现如何”,可以替换perform。fare常和wellbadly搭配,表示“情况好情况不好”,其比较级为farebetterworst。 例句:Itishardtocategorizeabouthowmanyhoursshouldbespentoneverydaylearning。Whatsufficesforablestudentsmaybeinadequateforthosewhofareworse。 很难准确地说每天需要学习多少小时。同样的学习时间,对于聪明的学生来说够了,对于成绩落后的学生来说可能不够。 背景知识: 1。DeepBlue:深蓝是一台专门为国际象棋比赛打造的超级计算机,美国IBM公司的研究小组从1989年就开始对其进行开发,并经历了多次升级和改良。深蓝的主要特色在于它能在每秒钟内运算超过两亿种走法,并从中筛选出最优解。同时,它也能利用大量的国际象棋数据库,吸收并学习人类大师的经验和技巧。1997年5月11日,那是一场人类智慧与机械智力之间较量的终场之日,落锤之地在美国纽约。深蓝超级电脑在一场六局的对决中,以3。5:2。5的总分战胜了国际象棋大师世界冠军加里卡斯帕罗夫,此战成为了人工智能历程中的一个重要时刻。它向我们展示了机器的可能性,同时也让我们对未来充满了期待和想象。 2。largelanguagemodels(LLM):大型语言模型是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。LLM是通常源自Transformer架构的Al模型,旨在理解和生成人类语言、代码等。这些模型在大量文本数据上进行训练,使它们能够捕捉人类语言的复杂性和细微差别。LLM可以执行范围广泛的语言任务,从简单的文本分米到文本生成,且有很高的准确性,流畅性和风格。在医疗保健行业,LLM被用于电子病历处理、临床试验匹配和药物发现。在金融领域,LLM被用干欺诈检测,金融新闻的情绪分析,其至交易策略。凭借其多功能性和高性能的特性,基于Transformer的LLM正在成为各种行业和应用程序中越来越有价值的资产。 段落大意: 【1】计算机正在运用人类的决定性能力:语言。 【2】大型语言模型能和人类一样写文章,引发了诸多争论。 【3】乔姆斯基教授表示,所有人类语言之间具有相似性。 【4】乔姆斯基理论认为,人类大脑中存在某种语言倾向。 【5】有些人正在利用大型语言模型的能力攻击乔姆斯基理论。 【6】大型语言模型和人类的认知方式并不相同。 【7】我们很难理解大型语言模型的“想法”。 【8】语言学家利用探究性测试来了解大型语言模型的基础知识。 【9】《语言学探索》的一篇论文对“刺激贫乏”给予说明。 【10】对于争论,乔姆斯基学派必须提出更强有力的辩论观点。 PS:各位研友下载请文末点击阅读原文。 考研英语杂志经济学人英文外刊2022年经济学人英文杂志(2022年经济学人周刊英杂志已更新完毕) 366外刊社每日分享英文杂志,考研英语杂志,考研英语外刊双语精读,经济学人杂志,英文杂志下载。