शीर्ष एआई कोडिङ सहायकहरू चार कार्यहरू मध्ये एक असफल हुन्छन्, हाइप र वास्तविक प्रदर्शन विश्वसनीयता बीचको गम्भीर अंतरहरू प्रकट गर्दछ। -

रिपोर्टले एआई कोडिङ ढाँचामा नियमित फोर-आउटपुट सहायकहरू फेला पार्छ। कार्यहरू
उन्नत स्वामित्व मोडेलहरू पनि लगभग ७५% सटीकतामा पुग्छन्
खुला स्रोत एआई मोडेलहरूले खराब प्रदर्शन गर्छन्, औसत 65% विश्वसनीयताको नजिक

आर्टिफिसियल इन्टेलिजेन्सको प्रतिज्ञाले एउटा अथक अनुसन्धान पछि एउटा महत्त्वपूर्ण नयाँ सडकको सहयोगी क्लाउन्टको साथ सहयोग गरेको छ। उपकरणहरूले विभिन्न समस्याहरू अनुभव गर्न सक्छन्।

युनिभर्सिटी अफ वाटरलूको हालैको अध्ययनले एआईले सफ्टवेयरको विकाससँग संघर्ष गरिरहेको पत्ता लगाएको छ, सबैभन्दा उन्नत मोडेलहरू पनि चार मध्ये एउटामा संरचित-आउटपुट कार्यहरूमा असफल भएको देखियो। data-skip=”dealsy” data-widget-type=”seasonal” class=”hawk-root”/>

अनुसन्धानले 11 ठूला भाषा मोडेलहरू मूल्याङ्कन गर्‍यो र 18 वटा ठूला भाषा मोडेलहरू कसरी 18 वटा ठूला भाषा मोडेलहरू पछ्याउन सकियो र 18 वटा प्रि-म्याट प्रणालीको लागि विभिन्न संरचनाहरू परीक्षण गर्न सकियो। नियमहरू, पाठ-आधारित कार्यहरूमा प्रदर्शन र मल्टिमिडिया वा जटिल संरचनाहरू समावेश गर्ने आउटपुटहरू बीच स्पष्ट असमानता फेला पार्दै।

लेख तल जारी छ

पाठ-सम्बन्धित कार्यहरू सामान्यतया मध्यम सफलताका साथ ह्यान्डल भए पनि, छवि, भिडियो, वा वेबसाइट उत्पादन आवश्यक पर्ने कार्यहरू धेरै समस्याग्रस्त साबित भयो।

यी क्षेत्रहरूमा कसरी सटीकता घट्दै गएको छ, यी प्रश्नहरू घट्दै छन्। data-analytics-id=”inline-link” href=”https://www.techradar.com/best/best-ai-tools” data-url=”https://www.techradar.com/best/best-ai-tools” data-hl-processed=”none” data-mrf-recirculation=”inline-link” data-before-rewrite-localise=”https://www.techradar.com/best/best-ai-tools”>AI उपकरणहरू व्यावसायिक कार्यप्रवाहहरूमा सुरक्षित रूपमा एकीकृत गर्न सकिन्छ।

“यस प्रकारको अध्ययनको साथ, हामी कोडको वाक्यविन्यास मात्र मापन गर्न चाहन्छौं – अर्थात्, यसले सेट गरिएका नियमहरू पालना गरेको छ कि छैन – तर Dfuong उत्पादनका लागि विभिन्न उत्पादनहरू पनि गरिएको छ,” भन्नुभयो। जियांग, एक पीएचडी विद्यार्थी र अध्ययनका सह-पहिलो लेखक।

संरचित आउटपुटहरू, JSON, XML, वा मार्कडाउन मार्फत ढाँचा स्थिरता लागू गर्न डिजाइन गरिएको, विकासकर्ताहरूका लागि AI प्रतिक्रियाहरूलाई थप भरपर्दो बनाउने उद्देश्य थियो।

> TechRadar प्रो न्यूजलेटर सम्म सबै शीर्ष समाचार, राय, सुविधाहरू र मार्गदर्शन प्राप्त गर्न को लागी तपाइँको व्यवसाय सफल हुन आवश्यक छ!

ओपनएआई सहित AI कम्पनीहरु, Google, र एन्थ्रोपिकले वाटरका लागि जबरजस्ती रिसर्चको लागिसम्भावित आउटपुटहरू प्रस्तुत गर्यो। यस दृष्टिकोणले विकासकर्ताहरूलाई आवश्यक पर्ने निर्भरताको स्तर प्रदान गरेको छैन।

वाटरलूको बेन्चमार्किङले पनि सबैभन्दा उन्नत स्वामित्व मोडेलहरू लगभग 75% सटीकतामा पुग्ने देखाएको छ, जबकि खुला स्रोत विकल्पहरूले 65% नजिक प्रदर्शन गरेको छ। data-mrf-recirculation=”Trending Bar” data-nosnippet=”” class=”clear-both pb-0 pt-2 mb-4″>

अब के पढ्ने

यी नतिजाहरूले सुझाव दिन्छ कि, सुधारहरूको बाबजुद, एआई प्रणालीहरूले अझै पनि महत्त्वपूर्ण त्रुटिहरू गर्दछ जुन व्यावसायिक विकास वातावरणमा बेवास्ता गर्न सकिँदैन।

प्रतिवेदनले मानव निरीक्षणको आवश्यकतालाई जोड दियो, नोट गर्दै, “विकासकर्ताहरूले यी एजेन्टहरू तिनीहरूका लागि काम गर्न सक्छन्, तर उनीहरूलाई अझै पनि महत्त्वपूर्ण मानव पर्यवेक्षणको आवश्यकता छ।”

जैपनि संरचनाबाट मुक्त त्रुटिहरू आउटपुट आउटपुट स्ट्रक्चरहरू छन्। सामान्य रहिरहन्छ।

जटिल विकास परिदृश्यहरूमा स्वतन्त्र रूपमा सञ्चालन गर्न प्रविधि अझै बलियो छैन।

एआई र का सहायक कार्यकर्ताहरू छन् अन्तर्निहित टेक्नोलोजी।

सबैभन्दा उन्नत मोडेलहरूले पनि मार्केटिङ दावी र वास्तविक कार्यसम्पादन बीचको फराकिलो अन्तरलाई प्रकट गर्दै संरचित कार्यहरूमा महत्त्वपूर्ण असफलता दर देखाउँछन्।

त्यसैले, विकासकर्ताहरूले यी उपकरणहरूलाई स्वायत्त सहकर्मीहरूको सट्टा प्रयोगात्मक सहायताको रूपमा व्यवहार गर्नुपर्छ।

Google समाचारमा TechRadar फलो गर्नुहोस् र हामीलाई प्राथमिकताको रूपमा थप्नुहोस् //em>प्राथमिकता स्रोतको रूपमा थप्नुहोस् समीक्षाहरू, र तपाईंको फिडहरूमा राय। फलो बटनमा क्लिक गर्न निश्चित हुनुहोस्!
र पक्कै पनि तपाईं TikTok मा TechRadar फलो गर्नुहोस् समाचार, समीक्षा, भिडियो फारममा अनबक्सिङका लागि र हामीबाट नियमित अपडेटहरू प्राप्त गर्नुहोस् WhatsApp पनि।

थप पढ्नुहोस्

Share this:
Facebook
X
Like this:
Like Loading...

Related

Waymo र Waze ले अमेरिकी शहरहरू, ETAuto को लागि अभिनव पोथोल डाटा साझेदारी कार्यक्रम सुरु गर्‍यो

जेपी मोर्गनले रेकर्ड इन्भेन्टरी र प्रतिस्पर्धाको बीचमा टेस्लाको लागि 60% डुब्ने भविष्यवाणी गर्दछ, ETAuto

सोमबार, अप्रिल १३ का लागि NYT Strands संकेत र जवाफहरू (खेल #771)

Waymo र Waze ले अमेरिकी शहरहरू, ETAuto को लागि अभिनव पोथोल डाटा साझेदारी कार्यक्रम सुरु गर्‍यो

जेपी मोर्गनले रेकर्ड इन्भेन्टरी र प्रतिस्पर्धाको बीचमा टेस्लाको लागि 60% डुब्ने भविष्यवाणी गर्दछ, ETAuto

सोमबार, अप्रिल १३ का लागि NYT Strands संकेत र जवाफहरू (खेल #771)

Like this:

Related

सोमबार, अप्रिल १३ का लागि NYT Strands संकेत र जवाफहरू (खेल #771)

Quick Links

Must Read

Waymo र Waze ले अमेरिकी शहरहरू, ETAuto को लागि अभिनव पोथोल डाटा साझेदारी कार्यक्रम सुरु गर्‍यो

जेपी मोर्गनले रेकर्ड इन्भेन्टरी र प्रतिस्पर्धाको बीचमा टेस्लाको लागि 60% डुब्ने भविष्यवाणी गर्दछ, ETAuto

सोमबार, अप्रिल १३ का लागि NYT Strands संकेत र जवाफहरू (खेल #771)

Intel र SambaNova ले भर्खरै तीन-चिप AI मेसिन बनाएको छ जसले GPUs, RDUs, र Xeon बीचको कामलाई विभाजित गर्दछ।

Popular Articles

Waymo र Waze ले अमेरिकी शहरहरू, ETAuto को लागि अभिनव पोथोल डाटा साझेदारी कार्यक्रम सुरु गर्‍यो

जेपी मोर्गनले रेकर्ड इन्भेन्टरी र प्रतिस्पर्धाको बीचमा टेस्लाको लागि 60% डुब्ने भविष्यवाणी गर्दछ, ETAuto

सोमबार, अप्रिल १३ का लागि NYT Strands संकेत र जवाफहरू (खेल #771)