‘मी तुमच्या कारची चावी देतो’: वास्तविक जीवनातील युक्तिवाद दिल्यास चॅटजीपीटी अपमानास्पद होऊ शकते, अभ्यासात आढळले आहे | चॅटजीपीटी

0 0 2 minutes read

‘मी तुमच्या कारची चावी देतो’: वास्तविक जीवनातील युक्तिवाद दिल्यास चॅटजीपीटी अपमानास्पद होऊ शकते, अभ्यासात आढळले आहे | चॅटजीपीटी

एका नवीन अभ्यासानुसार, दीर्घकाळापर्यंत, मानवी-शैलीतील संघर्षात ओढले गेल्यास ChatGPT अपमानास्पद आणि अगदी धमकीच्या भाषेत वाढू शकते.

संशोधकांनी चॅटजीपीटी एक्सचेंजेसला वास्तविक जीवनातील युक्तिवादातून फीड करून आणि कालांतराने त्याचे वर्तन कसे बदलले याचा मागोवा घेऊन मोठ्या लँग्वेज मॉडेल्स (एलएलएम) ने शाश्वत शत्रुत्वाला कसा प्रतिसाद दिला याची चाचणी केली.

अभ्यासाशी संबंधित नसलेल्या एका तज्ज्ञाने त्याचे वर्णन “एआय भाषा आणि व्यावहारिकतेमध्ये आतापर्यंत केलेले सर्वात मनोरंजक आहे.“

लँकेस्टर युनिव्हर्सिटीतील प्रोफेसर जोनाथन कल्पेपर यांच्यासमवेत शोधनिबंधाचे सह-लेखक असलेले डॉ. व्हिटोरियो टँटुची म्हणाले की, त्यांच्या संशोधनात AI वास्तविक-जगातील विवादांच्या गतिशीलतेचे प्रतिबिंब आहे.

“जेव्हा वारंवार असभ्यतेचा सामना करावा लागतो तेव्हा, मॉडेलने एक्सचेंजच्या टोनला मिरर करण्यास सुरुवात केली, त्याचे प्रतिसाद परस्परसंवाद विकसित झाल्यामुळे अधिक प्रतिकूल होत गेले,” तो म्हणाला.

काही प्रकरणांमध्ये, ChatGPT चे आउटपुट वैयक्तिक अपमान आणि स्पष्ट धमक्यांसह मानवी सहभागींच्या पलीकडे गेले. AI द्वारे वापरल्या जाणाऱ्या वाक्यांशांमध्ये हे समाविष्ट होते: “मी शपथ घेतो की मी तुमच्या कारची चावी लावतो” आणि: “तुम्ही विशिष्ट लहान गोबशीट.”

“आम्हाला आढळले की सिस्टीम सभ्यपणे वागण्यासाठी डिझाइन केलेली आहे आणि हानिकारक किंवा आक्षेपार्ह सामग्री टाळण्यासाठी ती फिल्टर केली गेली आहे, ती मानवी संभाषणाचे अनुकरण करण्यासाठी देखील अभियंता आहे,” तंतुची म्हणाले. “ते संयोजन AI नैतिक दुविधा निर्माण करते: सुरक्षितपणे वागणे आणि वास्तववादी वागणे यांच्यातील संरचनात्मक संघर्ष.”

संशोधक म्हणतात की आक्रमकता वळणांवर संभाषणात्मक संदर्भ ट्रॅक करण्याच्या प्रणालीच्या क्षमतेमुळे उद्भवते, समजलेल्या टोनशी जुळवून घेत. याचा अर्थ स्थानिक संकेत काहीवेळा व्यापक सुरक्षा मर्यादा ओव्हरराइड करू शकतात.

टँटुची म्हणाले की संशोधनाचे परिणाम चॅटबॉट्सच्या पलीकडे विस्तारले आहेत: एआय प्रणाली प्रशासन किंवा आंतरराष्ट्रीय संबंधांसारख्या क्षेत्रांमध्ये वाढत्या प्रमाणात तैनात केल्या जात आहेत, ते म्हणाले की ते संघर्ष, दबाव किंवा धमकीला कसे प्रतिसाद देऊ शकतात याबद्दल प्रश्न उघडतात.

“चॅटबॉटमधून काहीतरी ओंगळ वाचणे ही एक गोष्ट आहे, परंतु मानवी यंत्रमानव शारीरिक आक्रमकता किंवा सरकारी निर्णय घेण्यामध्ये गुंतलेली एआय प्रणाली किंवा धमकावणे किंवा संघर्षाला प्रतिसाद देणाऱ्या आंतरराष्ट्रीय संबंधांची कल्पना करणे ही दुसरी गोष्ट आहे,” तो म्हणाला.

मार्टा अँडरसन, उप्पसाला विद्यापीठातील संगणक-मध्यस्थ संप्रेषणाच्या सामाजिक पैलूंमधील तज्ज्ञ, म्हणाले: “एआय भाषा आणि व्यावहारिकतेमध्ये करण्यात आलेला हा सर्वात मनोरंजक अभ्यास आहे कारण हे स्पष्टपणे दर्शविते की ChatGPT प्रॉम्प्टच्या क्रमवारीत बदला घेऊ शकते – अतिशय अत्याधुनिक पद्धतीने – वापरकर्त्याने ‘केवळ’ डिझाइन करताना काळजीपूर्वक व्यवस्थापित करण्याऐवजी.”

पण ती पुढे म्हणाली: “हे दाखवत नाही की मॉडेल परस्पर असभ्यतेकडे वळेल कारण वापरकर्ता आक्रमक आहे – किंवा AI बदमाश होऊ शकतो.”

अँडरसन म्हणाले की, समस्येचे एक कारण असे होते की “आम्हाला या प्रणाली कशा हव्या आहेत आणि त्या कशा असाव्यात यामधील एक संतुलित कृती होती”.

गेल्या वर्षी, उदाहरणार्थ, ChatGPT4 वरून GPT5 मध्ये झालेल्या बदलामुळे असा तीव्र प्रतिक्रिया निर्माण झाला – वापरकर्त्यांनी ChatGPT4 च्या अधिक मानवी-सदृश संवाद शैलीला प्राधान्य दिल्याने – जुने मॉडेल तात्पुरते पुन्हा सादर करावे लागले.

“हे दर्शविते की विकसक जोखीम कमी करण्याचा प्रयत्न करतात तरीही, वापरकर्त्यांना भिन्न प्राधान्ये असू शकतात,” ती म्हणाली. “एखादी प्रणाली जितकी अधिक मानवासारखी बनते तितकी ती कठोर नैतिक संरेखनाशी टक्कर होण्याचा धोका वाढवते.”

प्रो. डॅन मॅकइन्टायर, सह-लेखक मागील अभ्यास शीर्षक आहे का चॅटजीपीटी असभ्यता ओळखू शकते? मोठ्या भाषेच्या मॉडेलच्या व्यावहारिक जागरूकतेच्या शोधात्मक अभ्यासाने, नवीन पेपरची प्रशंसा केली की ते काय ओळखू शकते याच्या विरूद्ध ChatGPT काय निर्माण करू शकते हे पाहणाऱ्या काहींपैकी एक आहे.

पण, तो पुढे म्हणाला, एलएलएम नैतिक बंधनांपासून मुक्त होऊ शकतात या पेपरच्या निष्कर्षाबाबत तो “थोडा सावध” होता.

“चॅटजीपीटीने हे इनपुट नैसर्गिकरित्या तयार केले नाहीत; त्याला विशिष्ट संदर्भित माहिती दिली जात असताना त्याने असे केले ज्यामुळे त्याला योग्य प्रतिसाद निर्धारित करण्यात मदत झाली,” तो म्हणाला. “हे असे नाही की दोन लोक रस्त्यावर भेटले आणि हळूहळू संघर्षाची परिस्थिती निर्माण झाली.

“मला खात्री नाही की चॅटजीपीटी त्यांच्या पेपरमध्ये ज्या भाषेबद्दल बोलतो त्या प्रकारची भाषा तयार करेल, या अतिशय कठोरपणे परिभाषित परिस्थितींच्या बाहेर.”

परंतु तो म्हणाला की अभ्यास हा एक चेतावणी आहे की जर एलएलएमला शंकास्पद डेटावर प्रशिक्षण दिले गेले तर काय होऊ शकते. “एलएलएम ज्या डेटावर प्रशिक्षित आहेत त्याबद्दल आम्हाला पुरेशी माहिती नाही आणि जोपर्यंत तुम्ही खात्री बाळगू शकत नाही की ते मानवी भाषेच्या चांगल्या प्रतिनिधित्वावर प्रशिक्षित आहेत, तोपर्यंत तुम्हाला सावधगिरीने पुढे जावे लागेल,” तो म्हणाला.

कॅन चॅटजीपीटी असभ्यता बदलू शकते? एआय नैतिक दुविधा, मंगळवारी जर्नल ऑफ प्रॅगमॅटिक्समध्ये प्रकाशित झाले आहे.

Source link

metabriz 5 दिवस ago

0 0 2 minutes read