ओपनई जीपीटी -5 च्या उर्जा वापराचा खुलासा करणार नाही. हे मागील मॉडेलपेक्षा जास्त असू शकते | ओपनई

मीएन 2023 च्या मध्यभागी, जर वापरकर्त्याने आर्टिचोकसाठी रेसिपीसाठी ओपनईच्या चॅटजीपीटीला विचारले तर पास्ता किंवा विधी कसा बनवायचा याबद्दल सूचना ऑफर प्राचीन कनानी देवता मोलोचला, त्याचा प्रतिसाद कदाचित- अगदी अंदाजे- 2 वॅट-तासकिंवा जितकी विजेची बल्ब 2 मिनिटांत वापरते तितकी वीज.
ओपनई सोडले गुरुवारी एक मॉडेल जे लोकप्रिय चॅटबॉटला अधोरेखित करेल – जीपीटी -5? एआयच्या त्या आवृत्तीला आर्टिचोक रेसिपीसाठी विचारा आणि पास्ता-संबंधित मजकूराच्या समान प्रमाणात अनेक वेळा-20 वेळा-त्या उर्जेची रक्कम देखील लागू शकते, असे तज्ञ म्हणतात.
जीपीटी -5, ही कंपनी आणत आहे हायलाइट केले मॉडेलची ब्रेकथ्रू क्षमताः वेबसाइट तयार करण्याची, पीएचडी-स्तरीय विज्ञान प्रश्नांची उत्तरे देण्याची आणि कठीण समस्यांद्वारे कारण.
परंतु एआय मॉडेल्सच्या उर्जा आणि संसाधनाच्या वापराचे बेंचमार्क करण्यासाठी मागील वर्षे घालविलेल्या तज्ञांचे म्हणणे आहे की त्या नवीन शक्ती किंमतीवर येतात: जीपीटी -5 कडून प्रतिसाद मागील आवृत्त्यांमधील प्रतिसादापेक्षा लक्षणीय मोठ्या प्रमाणात उर्जा घेऊ शकेल Chatgpt?
ओपनई, त्याच्या बर्याच प्रतिस्पर्ध्यांप्रमाणे, जीपीटी -3 पासून 2020 मध्ये बाहेर आलेल्या त्याच्या मॉडेल्सच्या उर्जा वापराबद्दल कोणतीही अधिकृत माहिती जाहीर केली नाही. त्याचे मुख्य कार्यकारी अधिकारी सॅम ऑल्टमन यांनी काही बाहेर फेकले. संख्या या जूनमध्ये त्याच्या ब्लॉगवर CHATGPT च्या संसाधनांच्या वापरावर. तथापि, ही आकडेवारी, 0.34 वॅट-तास आणि प्रति क्वेरीसाठी 0.000085 गॅलन पाणी, विशिष्ट मॉडेलचा संदर्भ घेऊ नका आणि कोणतेही समर्थन दस्तऐवजीकरण नाही.
“जीपीटी -5 सारखे अधिक जटिल मॉडेल प्रशिक्षण आणि अनुमान दरम्यान अधिक शक्ती वापरते. हे दीर्घ विचारांचे लक्ष्य देखील आहे… मी सुरक्षितपणे असे म्हणू शकतो की जीपीटी -4 पेक्षा जास्त सामर्थ्य आहे,” असे इलिनॉय विद्यापीठाचे प्राध्यापक राकेश कुमार म्हणाले, सध्या संगणकीय आणि एआय मॉडेल्सच्या उर्जेच्या वापरावर कार्यरत आहे.
ज्या दिवशी जीपीटी -5 रिलीज झाले, संशोधक र्होड आयलँडच्या एआय लॅब युनिव्हर्सिटीमध्ये असे आढळले की मॉडेल सुमारे 1000 टोकनचा मध्यम-लांबीचा प्रतिसाद तयार करण्यासाठी 40 वॅट-तासांपर्यंत विजेचा वापर करू शकतो, जे एआय मॉडेलसाठी मजकूराचे बिल्डिंग ब्लॉक्स आहेत आणि ते अंदाजे शब्दांच्या समतुल्य आहेत.
अ डॅशबोर्ड त्यांनी शुक्रवारी लावले की जीपीटी -5 चा मध्यम-लांबीच्या प्रतिसादासाठी सरासरी उर्जा वापर फक्त 18 वॅट-तासांपेक्षा जास्त आहे, जो एप्रिलमध्ये रिलीज झालेल्या ओपनईच्या ओ 3 युक्तिवाद मॉडेल वगळता इतर सर्व मॉडेल्सपेक्षा जास्त आहे, आणि चिनी एआय फर्म दीपसीक यांनी बनविलेले आर 1.
हे “जीपीटी -4 ओ पेक्षा लक्षणीय अधिक ऊर्जा” आहे, जे मागील मॉडेल आहे ओपनईगटातील संशोधक निधल जेघम म्हणाले.
अठरा वॅट-तास 18 मिनिटांसाठी त्या चक्रव्यूह बल्बला जाळण्याशी संबंधित असतील. अलीकडील दिले अहवाल त्या चॅटजीपीटीने दिवसातून 2.5 अब्ज विनंत्या हाताळल्या आहेत, जीपीटी -5 चा एकूण वापर दररोजच्या विजेपर्यंत पोहोचू शकतो मागणी 1.5 मीटर यूएस घरे.
ही संख्या जितकी मोठी आहे तितकीच, जीपीटी -5 ओपनईच्या मागील मॉडेल्सपेक्षा जीपीटी -5 कित्येक पटीने मोठे असल्याचे मानले जाते, असे समजते की ते जीपीटी -5 च्या उर्जा वापरासाठी त्यांच्या व्यापक अपेक्षांशी संरेखित करतात. ओपनईने जीपीटी -3 पासून त्याच्या कोणत्याही मॉडेलसाठी-मॉडेलचे आकार निर्धारित करणारे पॅरामीटरची संख्या सोडली नाही, जी 175 अब्ज होते मापदंड?
या उन्हाळ्यात फ्रेंच एआय कंपनी मिस्त्राल कडून एक प्रकटीकरण शोध मॉडेलच्या आकारात आणि त्याच्या उर्जेच्या वापरामध्ये “मजबूत परस्परसंबंध”, मिस्त्रालने त्याच्या घरातील प्रणालींच्या अभ्यासावर आधारित.
“मॉडेलच्या आकाराच्या आधारे, संसाधनांचे प्रमाण [used by GPT-5] जीपीटी -3 पेक्षा जास्त विशालतेचे आदेश असले पाहिजेत, ”कॅलिफोर्निया विद्यापीठातील प्राध्यापक शाओली रेन म्हणाले, रिव्हरसाइडचा अभ्यास करणा .्या रिव्हरसाइड संसाधन एआयचा पदचिन्ह.
बेंचमार्किंग एआय वीज वापर
जीपीटी -4 होते व्यापकपणे विश्वास जीपीटी -3 च्या आकारापेक्षा 10 पट असणे. जेगॅम, कुमार, रेन आणि इतर म्हणतात की जीपीटी -5 जीपीटी -4 पेक्षा लक्षणीय मोठे असेल.
ओपनई सारख्या एआय कंपन्या आघाडीवर आहेत विश्वास ठेवा ते अत्यंत मोठा एजीआय साध्य करण्यासाठी मॉडेल्स आवश्यक असू शकतात, म्हणजेच एआय सिस्टम सक्षम मानवांच्या नोकरी करण्याबद्दल. या दृश्यासाठी ऑल्टमॅनने जोरदार युक्तिवाद केला आहे, लेखन फेब्रुवारीमध्ये: “असे दिसून येते की आपण अनियंत्रित पैसे खर्च करू शकता आणि सतत आणि अंदाज नफा मिळवू शकता,” जरी ते म्हणाले की जीपीटी -5 ने मानवी बुद्धिमत्तेला मागे टाकले नाही.
वृत्तपत्राच्या पदोन्नतीनंतर
त्याच्या बेंचमार्किंगमध्ये अभ्यास जुलैमध्ये, ज्याने मिस्त्रालच्या ले चॅट बॉटसाठी वीज वापर, पाण्याचा वापर आणि कार्बन उत्सर्जन पाहिले, स्टार्टअपला मॉडेलच्या आकारात एक ते एक-एक संबंध आढळला आणि त्याचे संसाधन वापर, असे लिहिले आहे: “एक मॉडेल 10 पट मोठा, समान प्रमाणात व्युत्पन्न टोकनसाठी लहान मॉडेलपेक्षा मोठ्या प्रमाणात एक क्रम तयार करेल.”
जेगहॅम, कुमार आणि रेन म्हणाले की जीपीटी -5 चे प्रमाण महत्त्वपूर्ण असले तरी, कदाचित इतर घटक आहेत जे स्त्रोत वापर निश्चित करण्यात येतील. मागील काही मॉडेल्सपेक्षा जीपीटी -5 अधिक कार्यक्षम हार्डवेअरवर तैनात आहे. जीपीटी -5 दिसते “मिश्रण ऑफ-एक्सपर्ट्स” आर्किटेक्चर वापरण्यासाठी, याचा अर्थ असा आहे की ते सुव्यवस्थित केले गेले आहे जेणेकरून क्वेरीला प्रतिसाद देताना त्याचे सर्व पॅरामीटर्स सक्रिय केले जात नाहीत, असे बांधकाम जे कदाचित त्याचा उर्जा वापर कमी करेल.
दुसरीकडे, जीपीटी -5 हे एक तर्क मॉडेल देखील आहे आणि व्हिडिओ आणि प्रतिमा तसेच मजकूरामध्ये कार्य करते, जे कदाचित मजकूर-केवळ ऑपरेशन्सपेक्षा उर्जा पदचिन्ह बनवते, रेन आणि कुमार दोघेही म्हणतात-विशेषत: तर्क मोडचा अर्थ असा आहे की मॉडेल क्वेरीला प्रतिसाद देण्यापूर्वी अधिक काळ मोजेल.
“जर आपण तर्क मोड वापरत असाल तर आपण समान उत्तर मिळविण्यासाठी किती संसाधने खर्च करता हे बहुधा पाच ते 10 असेल,” रेन म्हणाले.
लपलेली माहिती
एआय मॉडेलच्या संसाधनाच्या वापराची गणना करण्यासाठी, र्होड आयलँड युनिव्हर्सिटीच्या गटाने मॉडेलला क्वेरीला प्रतिसाद देण्यासाठी लागणारा सरासरी वेळ गुणाकार केला – मग ते पास्ता रेसिपीसाठी असो किंवा मोलोचला ऑफर – मॉडेलच्या ऑपरेशन दरम्यान मॉडेलच्या सरासरी पॉवर ड्रॉद्वारे.
मॉडेलच्या पॉवर ड्रॉचा अंदाज लावणे “बरेच काम” होते, असे अब्देल्टावब हेंडावी म्हणाले, ए प्राध्यापक र्होड आयलँड विद्यापीठातील डेटा विज्ञान. डेटा सेंटरमध्ये भिन्न मॉडेल कसे तैनात केले जातात याबद्दल माहिती शोधण्यासाठी या गटाने धडपड केली. त्यांचे अंतिम कागद दिलेल्या मॉडेलसाठी चिप्स कोणत्या चिप्सचा वापर केला जातो आणि डेटासेंटरमध्ये वेगवेगळ्या चिप्स दरम्यान वेगवेगळ्या क्वेरी कशा जोडल्या जातात याचा अंदाज आहे.
ऑल्टमॅनच्या जून ब्लॉग पोस्टने त्यांच्या निष्कर्षांची पुष्टी केली. चॅटजीपीटीच्या प्रति क्वेरीच्या उर्जेच्या वापरासाठी त्याने दिलेली आकृती, प्रति क्वेरी 0.34 वॅट-तास, जीपीटी -4 ओ साठी समूहाने जे सापडले त्याशी जवळून जुळते.
हेंडावी, जेगॅम आणि त्यांच्या गटातील इतरांनी सांगितले की त्यांच्या निष्कर्षांनी एआय कंपन्यांकडून अधिक-मोठ्या मॉडेल्स सोडल्यामुळे अधिक पारदर्शकतेची आवश्यकता अधोरेखित केली.
“एआयच्या खर्या पर्यावरणाच्या किंमतीवर लक्ष देणे पूर्वीपेक्षा अधिक गंभीर आहे,” मारवान अब्देलट्टी, ए प्राध्यापक उरी येथे. “आम्ही ओपनई आणि इतर विकसकांना जीपीटी -5 च्या पर्यावरणीय प्रभाव जाहीरपणे उघड करून संपूर्ण पारदर्शकतेसाठी वचनबद्ध करण्यासाठी हा क्षण वापरण्याचे आवाहन करतो.”
Source link


