World

हजारो लोक AI ला प्रशिक्षित करण्यासाठी त्यांची ओळख विकत आहेत – पण कोणत्या किंमतीला? | AI (कृत्रिम बुद्धिमत्ता)

मागच्या वर्षी सकाळी, जेकोबस लूव त्याच्या रोजच्या शेजारच्या फिरायला निघाला आणि वाटेत सापडलेल्या सीगल्सला खायला घालतो. हा वेळ वगळता, त्याने फुटपाथवरून चालताना त्याच्या पायांचे आणि दृश्याचे अनेक व्हिडिओ रेकॉर्ड केले. व्हिडिओने त्याला $14 मिळविले, जे देशाच्या किमान वेतनाच्या 10 पटीने किंवा केपटाऊनमध्ये राहणाऱ्या 27 वर्षीय लोऊसाठी, दक्षिण आफ्रिकाअर्ध्या आठवड्याचे किमतीचे किराणा सामान.

हा व्हिडिओ Kled AI वर आढळलेल्या “अर्बन नेव्हिगेशन” टास्कसाठी होता, हे एक ॲप जे योगदानकर्त्यांना त्यांचा डेटा अपलोड करण्यासाठी, जसे की व्हिडिओ आणि फोटो, कृत्रिम बुद्धिमत्ता मॉडेलला प्रशिक्षण देण्यासाठी पैसे देते. काही आठवड्यांत, Louw ने त्याच्या दैनंदिन जीवनातील चित्रे आणि व्हिडिओ अपलोड करून $50 कमावले.

रांचीमध्ये हजारो मैल दूर, भारतसाहिल टिग्गा, एक 22 वर्षांचा विद्यार्थी, AI प्रशिक्षणासाठी ऑडिओ डेटा क्राउडसोर्स करणाऱ्या Silencio ला, रेस्टॉरंटच्या आत किंवा व्यस्त जंक्शनवरील रहदारी यांसारख्या सभोवतालच्या शहराचा आवाज कॅप्चर करण्यासाठी त्याच्या फोनच्या मायक्रोफोनमध्ये प्रवेश देऊन नियमितपणे पैसे कमवतो. तो त्याच्या आवाजाचे रेकॉर्डिंगही अपलोड करतो. साहिल अनोखे सेटिंग्ज कॅप्चर करण्यासाठी प्रवास करतो, जसे की हॉटेल लॉबी अद्याप Silencio च्या नकाशावर दस्तऐवजीकरण केलेले नाहीत. असे करून तो महिन्याला $100 पेक्षा जास्त कमावतो, जे त्याचे सर्व अन्न खर्च भागवण्यासाठी पुरेसे आहे.

आणि शिकागोमध्ये, रामेलिओ हिल, एक 18-वर्षीय वेल्डिंग शिकाऊ, मित्र आणि कुटुंबासह त्याच्या खाजगी फोन चॅट नियॉन मोबाइलला विकून दोनशे डॉलर्स कमावले, एक संभाषणात्मक AI प्रशिक्षण मंच जे प्रति मिनिट $0.50 देते. हिलसाठी, गणना सोपी होती: त्याला असे वाटले की टेक कंपन्यांनी आधीच त्याचा बराचसा खाजगी डेटा कॅप्चर केला आहे, त्यामुळे कदाचित त्याला नफाही कमी होऊ शकेल.

हे गिग एआय ट्रेनर – जे त्यांच्या सभोवतालच्या दृश्यांपासून ते फोटो, व्हिडिओ आणि स्वतःचे ऑडिओ पर्यंत सर्व काही अपलोड करतात – नवीन जागतिक डेटा गोल्ड रशच्या अग्रभागी आहेत. सिलिकॉन व्हॅलीची उच्च-गुणवत्तेची, मानवी-श्रेणीच्या डेटाची भूक खुल्या इंटरनेटवरून स्क्रॅप केली जाऊ शकते त्यापेक्षा जास्त आहे, डेटा मार्केटप्लेसचा एक भरभराट करणारा उद्योग ही दरी भरून काढण्यासाठी उदयास आला आहे. केप टाउन ते शिकागो पर्यंत, हजारो लोक आता AI च्या पुढच्या पिढीला प्रशिक्षित करण्यासाठी त्यांच्या बायोमेट्रिक ओळख आणि जवळचा डेटा मायक्रो-परवाना देत आहेत.

परंतु ही नवीन टमटम अर्थव्यवस्था ट्रेड-ऑफसह येते. काही डॉलर्सच्या बदल्यात, त्याचे प्रशिक्षक अशा उद्योगाला चालना देत आहेत ज्यामुळे त्यांची कौशल्ये कालबाह्य होऊ शकतात, तर त्यांच्यापैकी काहींना डीपफेक, ओळख चोरी आणि डिजिटल शोषणाच्या भविष्यासाठी असुरक्षित सोडले जाते जे त्यांना नुकतेच समजू लागले आहे.

AI चाक फिरत ठेवणे

AI चे भाषा मॉडेल, जसे की ChatGPT आणि जेमिनी, सुधारण्यासाठी मोठ्या प्रमाणावर शिक्षण सामग्रीची मागणी करतात, परंतु त्यांना डेटाच्या दुष्काळाचा सामना करावा लागत आहे. सर्वाधिक वापरलेले प्रशिक्षण स्रोत, जसे की C4, RefinedWeb आणि Dolma, जे वेबवरील उच्च-गुणवत्तेच्या डेटासेटपैकी एक चतुर्थांश भाग आहेत, आता आहेत प्रतिबंधित जनरेटिव्ह एआय कंपन्या त्यांच्या डेटासह मॉडेलचे प्रशिक्षण देतात. संशोधक अंदाज एआय कंपन्यांकडे 2026 पर्यंत प्रशिक्षित करण्यासाठी नवीन उच्च-गुणवत्तेचा मजकूर संपेल. काही प्रयोगशाळांनी त्यांच्या एआयने तयार केलेला कृत्रिम डेटा परत देण्याचा प्रयत्न केला आहे, अशी पुनरावृत्ती प्रक्रिया आघाडी एरर-भरलेले स्लॉप तयार करण्यासाठी मॉडेल्स ज्यामुळे त्यांचे पतन होते.

Gig AI प्रशिक्षक, जे त्यांच्या सभोवतालच्या दृश्यांपासून ते फोटो, व्हिडिओ आणि स्वतःचे ऑडिओ पर्यंत सर्व काही अपलोड करतात, ते नवीन जागतिक डेटा गोल्ड रशच्या अग्रभागी आहेत. छायाचित्र: अरुण शंकर/एएफपी गेटी इमेजेसद्वारे

Kled AI आणि Silencio सारखी ॲप्स इथेच येतात. या प्रकारच्या डेटा मार्केटप्लेसवर, लाखो लोक AI फीड आणि प्रशिक्षित करण्यासाठी त्यांची ओळख कमाई करत आहेत. Kled AI, Silencio आणि Neon Mobile च्या पलीकडे, AI प्रशिक्षकांसाठी अनेक पर्याय आहेत: Luel AI, प्रसिद्ध स्टार्टअप इनक्यूबेटर Y-Combinator द्वारे समर्थित, सुमारे $0.15 प्रति मिनिट बहुभाषिक संभाषणांचे स्रोत. ElevenLabs तुम्हाला तुमचा आवाज डिजिटली क्लोन करू देते आणि कोणालाही ते $0.02 प्रति मिनिट बेस फीमध्ये वापरू देते.

Gig AI प्रशिक्षण ही कामाची एक नवीन उदयोन्मुख श्रेणी आहे आणि ती मोठ्या प्रमाणात वाढेल, असे किंग्ज कॉलेज लंडनमधील अर्थशास्त्राचे प्राध्यापक बूक क्लेन टीसेलिंक यांनी सांगितले.

एआय कंपन्यांना माहित आहे की लोकांना त्यांच्या डेटाचा परवाना देण्यासाठी पैसे दिल्यास ते वेबवरून स्क्रॅप केलेल्या सामग्रीवर पूर्णपणे विसंबून राहिल्यास कॉपीराइट विवादांचा धोका टाळण्यास मदत करते, टेसेलिंक म्हणाले. या कंपन्यांना त्यांच्या सिस्टीममधील नवीन, सुधारित वर्तणूक मॉडेल करण्यासाठी उच्च-गुणवत्तेच्या डेटाची देखील आवश्यकता आहे, असे एआय संशोधक वेनियामिन वेसेलोव्स्की यांनी सांगितले. “मानवी डेटा, आत्तासाठी, मॉडेलच्या वितरणाच्या बाहेरून नमुना घेण्यासाठी सुवर्ण मानक आहे,” वेसेलोव्स्की जोडले.

यंत्रांना इंधन देणाऱ्या मानवांना, विशेषत: विकसनशील देशांतील लोकांना पैशांची गरज असते आणि ते मिळवण्यासाठी त्यांच्याकडे इतर काही पर्याय असतात. अनेक गिग एआय प्रशिक्षकांसाठी, हे काम करणे आर्थिक असमानतेला एक व्यावहारिक प्रतिसाद आहे. उच्च बेरोजगारी असलेल्या आणि चलनांचे अवमूल्यन झालेल्या देशांमध्ये, यूएस चलन मिळवणे हे स्थानिक नोकऱ्यांपेक्षा अधिक स्थिर आणि फायद्याचे असते. त्यांच्यापैकी काही एंट्री-लेव्हल नोकऱ्या सुरक्षित करण्यासाठी धडपडतात आणि आवश्यकतेनुसार AI प्रशिक्षण घेतात. श्रीमंत राष्ट्रांमध्येही, राहणीमानाच्या वाढत्या किंमतीमुळे स्वत:ला विकणे तार्किक आर्थिक पिव्होट बनले आहे.

तथापि, गिग एआय प्रशिक्षणाचे तोटे अदृश्य असू शकतात. काही AI मार्केटप्लेसवर, डेटा ट्रेनर अपरिवर्तनीय, रॉयल्टी-मुक्त परवाने देतात जे कंपन्यांना “व्युत्पन्न कार्य” तयार करण्यास अनुमती देतात, म्हणजे आज 20-मिनिटांचे व्हॉइस रेकॉर्डिंग पुढील काही वर्षांसाठी AI ग्राहक सेवा बॉटला सक्षम करू शकते, ट्रेनरला आणखी एक टक्के कधीही दिसणार नाही. तसेच, या मार्केटप्लेसमध्ये पारदर्शकतेच्या अभावामुळे, वापरकर्त्याचा चेहरा चेहरा ओळखण्याच्या डेटाबेसमध्ये किंवा अर्ध्या जगापासून दूर असलेल्या शिकारी जाहिरातीमध्ये येऊ शकतो, अक्षरशः कोणताही कायदेशीर मार्ग नाही.

Louw, केप टाऊनमधील AI प्रशिक्षक, गोपनीयतेच्या व्यापार-ऑफबद्दल जागरूक आहे. आणि जरी मिळकत अनियमित आहे आणि त्याचा संपूर्ण मासिक खर्च भागवण्यासाठी पुरेशी नसली तरी, तो पैसे मिळवण्यासाठी या अटी स्वीकारण्यास तयार आहे. तो वर्षानुवर्षे चिंताग्रस्त विकाराशी झुंजत होता आणि नोकरी मिळवू शकला नाही, परंतु Kled AI सह AI मार्केटप्लेसवर कमावलेल्या पैशाने त्याला मालिश करणारा बनण्यासाठी $500 च्या स्पा प्रशिक्षण कोर्ससाठी बचत करण्याची परवानगी दिली.

“दक्षिण आफ्रिकन म्हणून, लोकांना वाटते त्यापेक्षा USD मध्ये पैसे देणे अधिक फायदेशीर आहे,” Louw म्हणाले.

मार्क ग्रॅहम, ऑक्सफर्ड विद्यापीठातील इंटरनेट भूगोलचे प्राध्यापक आणि लेखक मशीनला फीडिंगहे मान्य केले की विकसनशील देशांतील व्यक्तींसाठी, पैसे अल्पावधीत अर्थपूर्ण असू शकतात, परंतु चेतावणी दिली की “संरचनात्मकदृष्ट्या हे काम अनिश्चित, गैर-प्रगतीशील आणि प्रभावीपणे एक मृत अंत आहे”.

एआय मार्केटप्लेस “मजुरीमध्ये तळापर्यंतच्या शर्यतीवर”, ग्रॅहम जोडले आणि “मानवी डेटाची तात्पुरती मागणी” यावर अवलंबून असतात. एकदा ही मागणी बदलली की, “कामगारांना कोणतेही संरक्षण, हस्तांतरणीय कौशल्ये आणि सुरक्षा जाळे नसतात”.

ग्रॅहम म्हणाले, “उत्तर जागतिक स्तरावरील प्लॅटफॉर्म हे एकमेव विजेते आहेत [that] सर्व टिकाऊ मूल्य कॅप्चर करा”.

केप टाउन, दक्षिण आफ्रिका. छायाचित्र: पीटर टिटमस/युनिव्हर्सल इमेजेस ग्रुप/गेटी इमेजेस

कार्टे ब्लँचे परवानग्या

हिल, शिकागो-आधारित एआय ट्रेनर, नियॉन मोबाइलला त्याचे खाजगी फोन कॉल विकण्याबद्दल परस्परविरोधी भावना होत्या. सुमारे 11 तासांच्या कॉलसाठी, त्याने $200 कमावले, परंतु तो म्हणाला की ॲप वारंवार ऑफलाइन जाईल आणि थकीत पेमेंट सोडण्यात अयशस्वी होईल. हिल म्हणाली, “निऑन माझ्यासाठी नेहमीच सावळी होता, परंतु मी बिल आणि इतर विविध खर्चांसाठी काही अतिरिक्त, सुलभ पैसे मिळविण्यासाठी त्याचा वापर करत राहिलो.

ते पैसे किती सोपे होते याचा आता तो पुनर्विचार करत आहे. सप्टेंबरमध्ये, लॉन्च झाल्यानंतर काही आठवड्यांनंतर, निऑन मोबाइल ऑफलाइन झाला टेकक्रंच सुरक्षा त्रुटी शोधून काढली ज्यामुळे कोणालाही फोन नंबर, कॉल रेकॉर्डिंग आणि वापरकर्त्यांच्या प्रतिलेखांमध्ये प्रवेश करण्याची परवानगी मिळाली. हिलने सांगितले की, नियॉन मोबाईलने त्याला याबद्दल कधीही माहिती दिली नाही आणि आता इंटरनेटवर आपल्या आवाजाचा कसा गैरवापर केला जाऊ शकतो याची काळजी वाटते.

स्टॅनफोर्ड इन्स्टिट्यूट फॉर ह्यूमन-सेंटर्ड आर्टिफिशियल इंटेलिजेंसमधील डेटा प्रायव्हसी संशोधक जेनिफर किंग यांना काय आढळले आहे की एआय मार्केटप्लेस वापरकर्त्यांचा डेटा कसा आणि कुठे तैनात केला जाईल याबद्दल अस्पष्ट आहे. वाटाघाटी न करता किंवा त्यांचे अधिकार जाणून घेतल्याशिवाय, ती पुढे म्हणाली, “ग्राहकांना त्यांचा डेटा त्यांना आवडत नसलेल्या किंवा समजत नसलेल्या किंवा अपेक्षित नसलेल्या मार्गांनी पुन्हा वापरला जाण्याचा धोका असतो आणि तसे असल्यास त्यांच्याकडे थोडासा आधार असेल”.

जेव्हा AI प्रशिक्षक त्यांचा डेटा Neon Mobile आणि Kled AI वर सामायिक करतात, तेव्हा ते त्यांची समानता विकण्यासाठी, वापरण्यासाठी, सार्वजनिकपणे प्रदर्शित करण्यासाठी आणि संग्रहित करण्यासाठी कार्टे ब्लँचे परवाना (जगभरात, अनन्य, अपरिवर्तनीय, हस्तांतरणीय आणि रॉयल्टी-मुक्त) प्रदान करत आहेत – आणि त्यांची व्युत्पन्न कामे देखील तयार करतात.

Kled AI चे संस्थापक, Avi पटेल यांनी सांगितले की, त्यांच्या कंपनीच्या डेटा कराराचा वापर AI प्रशिक्षण आणि संशोधनासाठी मर्यादित आहे. “संपूर्ण व्यवसाय वापरकर्त्याच्या विश्वासावर अवलंबून असतो. योगदानकर्त्यांना त्यांच्या डेटाचा गैरवापर होऊ शकतो असे वाटत असल्यास, प्लॅटफॉर्म कार्य करणे थांबवते.” त्यांनी सांगितले की त्यांची कंपनी डेटासेट विकण्यापूर्वी व्यवसायांची तपासणी करते, पॉर्नोग्राफी आणि “सरकारी संस्था” सारख्या “संशयास्पद हेतू” असलेल्या लोकांसोबत काम करणे टाळण्यासाठी, ज्यांचा विश्वास आहे की त्या ट्रस्टशी विरोधाभास असलेल्या मार्गांनी डेटा वापरू शकतो.

निऑन मोबाईलने टिप्पणीसाठी केलेल्या विनंतीला प्रतिसाद दिला नाही.

सिटी सेंट जॉर्ज, लंडन विद्यापीठातील कायद्याचे प्राध्यापक एनरिको बोनाडिओ यांच्या म्हणण्यानुसार, या करारांच्या अटी प्लॅटफॉर्मला, तसेच त्याच्या ग्राहकांना “त्या सामग्रीसह जवळजवळ काहीही करण्याची परवानगी देतात, कायमचे, पुढील कोणतेही पैसे न देता आणि योगदानकर्त्याला संमती काढून घेण्याचा किंवा अर्थपूर्णपणे पुन्हा वाटाघाटी करण्याचा कोणताही वास्तविक मार्ग नाही”.

अधिक त्रासदायक जोखमींमध्ये प्रशिक्षकांचा डेटा डीपफेक आणि तोतयागिरीसाठी वापरला जातो. जरी डेटा मार्केटप्लेस नाव आणि स्थान यांसारख्या कोणत्याही ओळखीचा डेटा विकण्यापूर्वी काढून टाकण्याचा दावा करत असले तरी, बायोमेट्रिक पॅटर्न, स्वभावाने, मजबूत अर्थाने अनामित करणे कठीण आहे, बोनाडिओ जोडले.

विक्रेत्याची खंत

जरी एआय प्रशिक्षक त्यांचा डेटा कसा वापरला जाईल यासाठी अधिक सूक्ष्म संरक्षणासाठी वाटाघाटी करण्यास सक्षम आहेत, तरीही त्यांना पश्चात्ताप वाटू शकतो. जेव्हा ॲडम कोय या न्यूयॉर्कमधील अभिनेत्याने 2024 मध्ये त्याची प्रतिरूपे $1,000 मध्ये कॅप्शनला विकली, ज्याला आता मिराज म्हटले जाते, AI-शक्तीच्या व्हिडिओ संपादकाला, त्याच्या कराराने त्याच्या ओळखीचा वापर कोणत्याही राजकीय माध्यमांसाठी किंवा दारू, तंबाखू किंवा पोर्नोग्राफीच्या विक्रीसाठी केला जाणार नाही याची खात्री केली आणि परवाना एका वर्षात संपेल.

मथळ्यांनी टिप्पणीच्या विनंतीला प्रतिसाद दिला नाही.

थोड्याच वेळात, ॲडमच्या मित्रांनी त्याला ऑनलाइन सापडलेले व्हिडिओ फॉरवर्ड करण्यास सुरुवात केली ज्यामध्ये त्याचा चेहरा आणि आवाज लाखो व्ह्यूज मिळाले. यापैकी एका व्हिडिओमध्ये, ए इंस्टाग्राम रीलॲडमची एआय प्रतिकृती “योनी डॉक्टर” असल्याचा दावा करते आणि गर्भवती आणि प्रसुतिपश्चात महिलांसाठी अप्रमाणित वैद्यकीय पूरक आहारांना प्रोत्साहन देते.

“लोकांना ते समजावून सांगताना लाज वाटली,” कॉय म्हणाला.

कॉय पुढे म्हणाले, “टिप्पण्या वाचायला विचित्र वाटतात कारण त्या माझ्या शारीरिक स्वरूपावर भाष्य करतात, पण ते मी नाही. “माझी भावना [while deciding to sell my likeness] बहुतेक मॉडेल डेटा आणि समानतेसाठी इंटरनेट स्क्रॅप करणार होते [anyway]म्हणून त्यासाठी पैसेही दिले जाऊ शकतात.

कॉयने सांगितले की त्यांनी कोणत्याही एआय डेटा गिगसाठी साइन अप केलेले नाही. जर एखाद्या कंपनीने मोठी भरपाई देऊ केली तरच तो विचार करेल.




Source link

Related Articles

प्रतिक्रिया व्यक्त करा

आपला ई-मेल अड्रेस प्रकाशित केला जाणार नाही. आवश्यक फील्डस् * मार्क केले आहेत

Back to top button