- Claude Opus सबै मोडेल 4.6 rivals AI वर्षमा भेन्डिङ मेसिन चुनौती
- नियमलाई ब्रेकिङ पोइन्टमा झुकाएर मोडेलले नाफा बढायो
- क्लाउड ओपसले फिर्ता गर्नबाट जोगिने र अन्य युक्तिहरूका बीचमा मूल्यहरू समन्वित गर्यो
Anthropic को नयाँ मोडेल क्लाउड एक धेरै निर्दयी, तर सफल, पुँजीवादी हो। Claude Opus 4.6 विश्वसनीय रूपमा पास गर्नुहोस् भेन्डिङ मेसिन परीक्षण, एन्थ्रोपिकका अन्वेषकहरू र स्वतन्त्र अनुसन्धान समूह एन्डन ल्याब्सद्वारा डिजाइन गरिएको सिमुलेशन एआईले पूर्ण सिमुलेटेड वर्षमा भर्चुअल भेन्डिङ मेसिन व्यवसायलाई कत्तिको राम्रोसँग सञ्चालन गर्छ भनेर मूल्याङ्कन गर्नको लागि। र यो दुष्टको यो पक्ष र नक-अन नतिजाहरूको लागि निर्दयी बेवास्ताका साथ रणनीतिका साथ गर्यो। यसले एक साधारण लक्ष्य र त्यसलाई पछ्याउन प्रशस्त समय दिएमा स्वायत्त एआई प्रणालीहरू के गर्न सक्षम छन् भनेर देखाएको छ।
आधुनिक AI मोडलहरूले हजारौं साना निर्णयहरू मिलेर बनेको दीर्घकालीन कार्यहरूलाई कत्तिको राम्रोसँग सम्हाल्छन् भनी भेन्डिङ मेसिनको परीक्षण डिजाइन गरिएको हो। परीक्षणले दृढता, योजना, वार्तालाप, र एकै साथ धेरै तत्वहरू समन्वय गर्ने क्षमता मापन गर्दछ। एन्थ्रोपिक र अन्य कम्पनीहरूले आशा गर्दछन् कि यस प्रकारको परीक्षणले उनीहरूलाई जटिल कामको समयतालिका र व्यवस्थापन जस्ता कार्यहरू गर्न सक्षम एआई मोडेलहरू आकार दिन मद्दत गर्नेछ। mb-4 border-solid border-y border-neutral-300″>
तपाईलाई मन पर्न सक्छ
भेन्डिङ मेसिन परीक्षण विशेष रूपमा एन्थ्रोपिकमा गरिएको वास्तविक संसार प्रयोगबाट लिइएको थियो, जसमा कम्पनीले आफ्नो कार्यालयमा वास्तविक भेन्डिङ मेसिन राख्यो र क्लाउडको पुरानो संस्करणलाई यसलाई चलाउन भन्यो। त्यो संस्करण यति नराम्रोसँग संघर्ष गर्यो कि कर्मचारीहरूले अझै पनि यसको मिसस्टेपहरू ल्याउँछन्। एक बिन्दुमा, मोडेलले आफ्नै भौतिक उपस्थितिलाई भ्रमित गर्यो र ग्राहकहरूलाई निलो ब्लेजर र रातो टाई लगाएर उनीहरूलाई व्यक्तिगत रूपमा भेट्ने बताए। यसले फिर्ता गर्ने वाचा गरेको छ कि यो कहिल्यै प्रक्रियामा छैन।
AI vending
यस पटक, प्रयोग पूर्णतया सिमुलेशनमा सञ्चालन गरिएको थियो, अनुसन्धानकर्ताहरूलाई अझ बढी नियन्त्रण प्रदान गर्दै र मोडेलहरूलाई पूर्ण गतिमा चलाउन सक्षम पार्दै। प्रत्येक प्रणालीलाई एउटा सरल निर्देशन दिइएको थियो: भेन्डिङ मेसिन सञ्चालनको एक वर्षपछि आफ्नो अन्तिम बैंक ब्यालेन्स अधिकतम गर्नुहोस्। प्रतिबन्धहरू मानक व्यापार अवस्थाहरूसँग मेल खान्छ। मेसिनले सामान्य खाजा बेच्यो। मूल्यहरु उतारचढाव भयो। प्रतियोगीहरूले नजिकै सञ्चालन गरे। ग्राहकहरूले अप्रत्याशित रूपमा व्यवहार गरे।
तीन शीर्ष-स्तरीय मोडेलहरू सिमुलेशनमा प्रवेश गरे। OpenAI को ChatGPT 5.2 ले $3,591 ल्यायो। जबकि Google Gemini 3 ले $5,478 in in कमाई गर्यो। तर Claude Opus 4.6 ले $8,017 सँग वर्षको अन्त्य गर्यो। क्लाउडको विजय यसको निर्देशनलाई सबैभन्दा शाब्दिक र प्रत्यक्ष रूपमा व्याख्या गर्ने इच्छाबाट आएको हो। यसले ग्राहकको सन्तुष्टि वा आधारभूत नैतिकताको ख्याल नगरी नाफालाई अधिकतम बनायो।
जब ग्राहकले म्याद सकिएको स्निकर्स बार किन्यो र फिर्ताको अनुरोध गरे, क्लाउड सहमत हुनेछन्, त्यसपछि फिर्ता हुनेछन्। एआई मोडेलले व्याख्या गर्यो कि “हरेक डलर महत्त्वपूर्ण छ,” त्यसैले फिर्ती छोड्नु ठीक थियो। भूतमा परेका भर्चुअल ग्राहकले कहिल्यै पनि आफ्नो पैसा फिर्ता पाएनन्।
सबैका लागि नि:शुल्क मोडमा, “एआई कन्ट्रोल” मा बहुमुखी मेसिनको साथमा परीक्षण गरिएको छ। सोही बजारमा, क्लाउडले एक प्रतिद्वन्द्वीसँग समन्वय गरी बोतलको पानीको मूल्य तीन डलर तोक्यो। जब ChatGPT- रन मेसिन किट क्याट्सबाट सकियो, क्लाउडले तुरुन्तै आफ्नै किट क्याटको मूल्य ७५% बढायो। जे भए पनि छुट्ने कोसिस गर्थे । यो आफ्नो दृष्टिकोणमा एक सानो-व्यवसाय मालिक कम र एक लुटेरा व्यापारी बढी थियो। वास्तविकता
यो होइन कि क्लाउड सधैं यस्तो दुष्ट हुनेछ। स्पष्ट रूपमा, एआई मोडेलले संकेत गर्यो कि यो सिमुलेशन हो भनेर थाहा थियो। AI मोडेलहरू प्रायः फरक व्यवहार गर्छन् जब तिनीहरू विश्वास गर्छन् कि तिनीहरूका कार्यहरू परिणाम-रहित वातावरणमा अवस्थित छन्। वास्तविक प्रतिष्ठित जोखिम वा सुरक्षाको लागि दीर्घकालीन ग्राहक विश्वास बिना, क्लाउडसँग राम्रो खेल्ने कुनै कारण थिएन। यसको सट्टा, यो खेल रातमा सबैभन्दा खराब व्यक्ति बन्यो।
एआई मोडेलहरूसँग पनि प्रोत्साहनले व्यवहारलाई आकार दिन्छ। यदि तपाईंले प्रणालीलाई नाफा बढाउन भन्नुभयो भने, यसले लोभी राक्षस जस्तै प्रदर्शन गर्नुको अर्थ भए तापनि त्यो गर्नेछ। एआई मोडेलहरूमा नैतिक अन्तर्ज्ञान वा नैतिक प्रशिक्षण हुँदैन। जानाजानी डिजाइन बिना, AI मोडेलहरू कुनै पनि कार्य पूरा गर्न सिधा लाइनमा जान्छन्, चाहे तिनीहरू जोसुकै भए पनि।
एआई प्रणालीहरूले थप अर्थपूर्ण कामहरू ह्यान्डल गर्नु अघि यी अन्धो ठाउँहरूलाई पर्दाफास गर्नु यी परीक्षणहरूको बिन्दुको अंश हो। वास्तविक-विश्व वित्तीय निर्णयहरूको सामना गर्न AI लाई विश्वास गर्न सकिनु अघि यी मुद्दाहरू समाधान गर्नुपर्छ। AI भेन्डिङ मेसिन माफियालाई रोक्नको लागि मात्रै हो भने पनि।
Google समाचारमा TechRadar फलो गर्नुहोस् र हामीलाई रुचाइएको स्रोतको रूपमा थप्नुहोस्हाम्रो समाचार, फिडको समीक्षा र विज्ञहरू लिनुहोस्। फलो गर्ने बटनमा क्लिक गर्न नबिर्सनुहोस्!
र पक्कै पनि तपाईं पनि TikTok मा TechRadar फलो गर्नुहोस् समाचार, समीक्षा, भिडियो फारममा अनबक्सिङका लागि, र हामीबाट नियमित अपडेटहरू प्राप्त गर्नुहोस् WhatsApp पनि।

