Fidax ChatGPT biex tagħmel il-Matematika


Huwa kritiku li tiċċekkja l-fatti dak kollu li ġej minn ChatGPT, Bing Chat, Google Bard, jew kwalunkwe chatbot ieħor. Jemmnu jew le, dan hu veru speċjalment għall-matematika. Tassumux li ChatGPT jista 'jagħmel matematika. Chatbots AI moderni huma aħjar fil-kitba kreattiva milli fl-għadd u l-aritmetika.

Chatbots Mhumiex Kalkulaturi

Bħal dejjem, meta taħdem ma 'AI, l-inġinerija fil-pront hija importanti. Trid tagħti ħafna informazzjoni u tfassal bir-reqqa t-test tiegħek fil-pront biex tikseb rispons tajjeb.

Imma anki jekk ikollok biċċa loġika impekkabbli bħala tweġiba, tista 'tgħammar f'nofsha u tirrealizza li ChatGPT għamel żball fuq il-linji ta' 1+1=3. Madankollu, ChatGPT ta 'spiss ukoll iġib il-loġika ħażina—u lanqas m'huwiex tajjeb biex tgħodd.

Li titlob mudell ta’ lingwa kbira biex jiffunzjona bħala kalkolatur huwa bħal li titlob kalkolatur biex jikteb dramm—x’stennejt? Dak mhux għalxiex.

Il-messaġġ ewlieni tagħna hawn: Huwa kritiku li wieħed iċċekkja jew iċċekkja darbtejn ix-xogħol ta' AI. Dan jgħodd għal aktar minn sempliċi matematika.

Hawn huma xi eżempji ta 'ChatGPT li jaqa' ċatt fuq wiċċu. Aħna użajna l-ChatGPT b'xejn ibbażat fuq gpt-3.5-turbo għal dan l-artikolu kif ukoll Bing Chat, li huwa bbażat fuq GPT 4. Għalhekk, filwaqt li ChatGPT Plus b'GPT 4 se jagħmel aħjar mill-verżjoni b'xejn ta' ChatGPT, int ser tesperjenza dawn il-problemi anke ma 'chatbot AI top-of-the-line.

ChatGPT Ma Jista' Jgħodd

ChatGPT u Bing ma jidhrux affidabbli għall-għadd tal-listi ta 'oġġetti. Jidher li huwa kompitu bażiku—imma tistrieħx fuq li tikseb tweġiba affidabbli.

Aħna pprovdejna lil ChatGPT b'kolonna ta 'numri u tlabnieha tgħodd l-okkorrenzi ta' wieħed min-numri. (M'għandekx għalfejn tgħodd lilek innifsek: It-tweġiba t-tajba hija li n-numru 100 jidher 14-il darba.)

Anke meta tikkoreġi ChatGPT u tiskuża ruħha u toffri tweġiba ġdida, mhux bilfors ikollok tweġiba korretta.

ChatGPT spiss jaġixxi bħal persuna li b'mod frenetiku tipprova tgħatti żball u tagħtik tweġiba—kwalunkwe tweġiba—biex tneħħilek dahru. Huwa fil-fatt simili ħafna!

Bħas-soltu, waħda mill-problemi l-kbar hija kemm il-ChatGPT huwa kompletament ċert dwar it-tweġibiet kollha tiegħu, anke meta qed iqabbad tweġibiet differenti lilek.

Ippruvajna GPT 4 permezz tal-Bing Chat ta 'Microsoft u esperjenzajna problema simili. Bing iddeċieda li jikteb xi kodiċi Python biex issolvi din il-problema delikata, iżda wkoll naqas milli jikseb it-tweġiba t-tajba. (Bing fil-fatt ma ħadimx il-kodiċi.)

ChatGPT Tissielet Bi Problemi Loġiċi tal-Matematika

Jekk tagħti lil ChatGPT "problema ta' kliem" tal-matematika, ħafna drabi tara tidwiriet strambi ta' loġika li ma jagħtukx it-tweġiba t-tajba

Aħna pprovdejna lil ChatGPT problema matematika bbażata fuq il-frott li tirrifletti dak li xi ħadd jista’ jistaqsi jekk kienx qed jipprova jibbilanċja mill-ġdid portafoll ta’ investiment billi jalloka kontribuzzjoni bejn fondi differenti—jew forsi sempliċement jixtri ħafna frott u jżomm ma’ portafoll ibbażat fuq il-frott għal l-investitur bil-ġuħ.

ChatGPT jibda tajjeb iżda malajr jitlaq mill-binarji f'loġika li ma tagħmel l-ebda sens u mhux se tagħti tweġiba korretta.

M'għandekx għalfejn issegwi kull twist u dawwar biex tirrealizza li t-tweġiba finali mhix korretta.

ChatGPT ħafna drabi se jħaffer u jargumenta miegħek dwar ir-reazzjonijiet tiegħu wkoll. (Għal darb'oħra, dik hija imġieba li tixbah ħafna lill-bniedem.)

F'dan il-każ, ChatGPT sostniet li ħej, ma waslitx it-tweġiba t-tajba—iżda qarsik eqreb lejn il-proporzjon mixtieq tiegħek milli kont qabel! Dak huwa pjuttost umoristiku.

Għar-rekord, il-Bing Chat ta 'Microsoft ibbażat fuq GPT 4 tħabtu ma' din il-problema wkoll, u tatna tweġiba ċara ħażina. Il-loġika ta 'GPT 4 malajr tmur barra mill-binarji hawn, ukoll.

Nirrakkomandaw li ma tipprovax issegwi kull dawra u dawra tal-loġika—huwa ċar li t-tweġiba hija żbaljata.

Meta rrimarkajna li t-tweġiba ta 'Bing kienet żbaljata, baqgħet targumenta magħna f'ċrieki, u toffri tweġiba ħażina wara tweġiba ħażina.

ChatGPT lanqas ma jista 'jagħmel l-aritmetika b'mod affidabbli

Ta 'min jinnota li ChatGPT kultant jitmexxa 'l barra u jiddikjara l-aritmetika bażika b'mod żbaljat ukoll. Rajna tweġibiet loġiċi għal problemi b'aritmetika mhux korretta simili għal 1 + 1=3 smack-dab fin-nofs tat-tweġiba raġunata tajjeb.

Kun żgur li tiċċekkja, tiċċekkja darbtejn, u tiċċekkja triplu dak kollu li tikseb minn ChatGPT u chatbots AI oħra.