― Advertisement ―

Homeसूचना प्रविधिशीर्ष एआई कोडिङ सहायकहरू चार कार्यहरू मध्ये एक असफल हुन्छन्, हाइप र...

शीर्ष एआई कोडिङ सहायकहरू चार कार्यहरू मध्ये एक असफल हुन्छन्, हाइप र वास्तविक प्रदर्शन विश्वसनीयता बीचको गम्भीर अंतरहरू प्रकट गर्दछ।




  • रिपोर्टले एआई कोडिङ ढाँचामा नियमित फोर-आउटपुट सहायकहरू फेला पार्छ। कार्यहरू
  • उन्नत स्वामित्व मोडेलहरू पनि लगभग ७५% सटीकतामा पुग्छन्
  • खुला स्रोत एआई मोडेलहरूले खराब प्रदर्शन गर्छन्, औसत 65% विश्वसनीयताको नजिक

आर्टिफिसियल इन्टेलिजेन्सको प्रतिज्ञाले एउटा अथक अनुसन्धान पछि एउटा महत्त्वपूर्ण नयाँ सडकको सहयोगी क्लाउन्टको साथ सहयोग गरेको छ। उपकरणहरूले विभिन्न समस्याहरू अनुभव गर्न सक्छन्।

युनिभर्सिटी अफ वाटरलूको हालैको अध्ययनले एआईले सफ्टवेयरको विकाससँग संघर्ष गरिरहेको पत्ता लगाएको छ, सबैभन्दा उन्नत मोडेलहरू पनि चार मध्ये एउटामा संरचित-आउटपुट कार्यहरूमा असफल भएको देखियो। data-skip=”dealsy” data-widget-type=”seasonal” class=”hawk-root”/>

अनुसन्धानले 11 ठूला भाषा मोडेलहरू मूल्याङ्कन गर्‍यो र 18 वटा ठूला भाषा मोडेलहरू कसरी 18 वटा ठूला भाषा मोडेलहरू पछ्याउन सकियो र 18 वटा प्रि-म्याट प्रणालीको लागि विभिन्न संरचनाहरू परीक्षण गर्न सकियो। नियमहरू, पाठ-आधारित कार्यहरूमा प्रदर्शन र मल्टिमिडिया वा जटिल संरचनाहरू समावेश गर्ने आउटपुटहरू बीच स्पष्ट असमानता फेला पार्दै।

लेख तल जारी छ

व्यावसायिक कार्यप्रवाहहरूमा सुरक्षित रूपमा एकीकृत गर्न सकिन्छ।

“यस प्रकारको अध्ययनको साथ, हामी कोडको वाक्यविन्यास मात्र मापन गर्न चाहन्छौं – अर्थात्, यसले सेट गरिएका नियमहरू पालना गरेको छ कि छैन – तर Dfuong उत्पादनका लागि विभिन्न उत्पादनहरू पनि गरिएको छ,” भन्नुभयो। जियांग, एक पीएचडी विद्यार्थी र अध्ययनका सह-पहिलो लेखक।

संरचित आउटपुटहरू, JSON, XML, वा मार्कडाउन मार्फत ढाँचा स्थिरता लागू गर्न डिजाइन गरिएको, विकासकर्ताहरूका लागि AI प्रतिक्रियाहरूलाई थप भरपर्दो बनाउने उद्देश्य थियो।

ओपनएआई सहित AI कम्पनीहरु, Google, र एन्थ्रोपिकले वाटरका लागि जबरजस्ती रिसर्चको लागिसम्भावित आउटपुटहरू प्रस्तुत गर्यो। यस दृष्टिकोणले विकासकर्ताहरूलाई आवश्यक पर्ने निर्भरताको स्तर प्रदान गरेको छैन।

वाटरलूको बेन्चमार्किङले पनि सबैभन्दा उन्नत स्वामित्व मोडेलहरू लगभग 75% सटीकतामा पुग्ने देखाएको छ, जबकि खुला स्रोत विकल्पहरूले 65% नजिक प्रदर्शन गरेको छ। data-mrf-recirculation=”Trending Bar” data-nosnippet=”” class=”clear-both pb-0 pt-2 mb-4″>

अब के पढ्ने

यी नतिजाहरूले सुझाव दिन्छ कि, सुधारहरूको बाबजुद, एआई प्रणालीहरूले अझै पनि महत्त्वपूर्ण त्रुटिहरू गर्दछ जुन व्यावसायिक विकास वातावरणमा बेवास्ता गर्न सकिँदैन।

प्रतिवेदनले मानव निरीक्षणको आवश्यकतालाई जोड दियो, नोट गर्दै, “विकासकर्ताहरूले यी एजेन्टहरू तिनीहरूका लागि काम गर्न सक्छन्, तर उनीहरूलाई अझै पनि महत्त्वपूर्ण मानव पर्यवेक्षणको आवश्यकता छ।”

जैपनि संरचनाबाट मुक्त त्रुटिहरू आउटपुट आउटपुट स्ट्रक्चरहरू छन्। सामान्य रहिरहन्छ।

जटिल विकास परिदृश्यहरूमा स्वतन्त्र रूपमा सञ्चालन गर्न प्रविधि अझै बलियो छैन।

एआई र का सहायक कार्यकर्ताहरू छन् अन्तर्निहित टेक्नोलोजी।

सबैभन्दा उन्नत मोडेलहरूले पनि मार्केटिङ दावी र वास्तविक कार्यसम्पादन बीचको फराकिलो अन्तरलाई प्रकट गर्दै संरचित कार्यहरूमा महत्त्वपूर्ण असफलता दर देखाउँछन्।

त्यसैले, विकासकर्ताहरूले यी उपकरणहरूलाई स्वायत्त सहकर्मीहरूको सट्टा प्रयोगात्मक सहायताको रूपमा व्यवहार गर्नुपर्छ।


Google समाचारमा TechRadar फलो गर्नुहोस् हामीलाई प्राथमिकताको रूपमा थप्नुहोस् //em>प्राथमिकता स्रोतको रूपमा थप्नुहोस् समीक्षाहरू, र तपाईंको फिडहरूमा राय। फलो बटनमा क्लिक गर्न निश्चित हुनुहोस्!

र पक्कै पनि तपाईं TikTok मा TechRadar फलो गर्नुहोस् समाचार, समीक्षा, भिडियो फारममा अनबक्सिङका लागि र हामीबाट नियमित अपडेटहरू प्राप्त गर्नुहोस् WhatsApp पनि।



थप पढ्नुहोस्