- जेमिनी 3 ले जवाफ दिन्छ जब यो प्रायः आविष्कार गर्ने विज्ञापन थाहा हुन्छ। केहि
- समस्या तथ्यपरक वा उच्च दाँव प्रश्नहरूको साथ उत्पन्न हुन्छ
- तर यसले अझै पनि सबैभन्दा सटीक र सक्षम AI मोडेलको रूपमा परीक्षण गर्दछ
Gemini 3 Flash छिटो र चलाख छ। तर यदि तपाईंले यसलाई वास्तवमा थाहा नभएको कुरा सोध्नुभयो भने – केहि अस्पष्ट वा कठिन वा यसको प्रशिक्षण भन्दा बाहिर – यसले लगभग सधैं आफ्नो बाटो ब्लफ गर्ने प्रयास गर्नेछ, स्वतन्त्र परीक्षण समूह कृत्रिम विश्लेषणको हालैको मूल्याङ्कन अनुसार।
यो जेमिनी 3 फ्ल्याशले “विभ्रम दर” को भागमा ९१% हिट गरेको देखिन्छ। यसको मतलब जब योसँग जवाफ थिएन, यसले अझै पनि एउटा दियो, लगभग सबै समय, एउटा जुन पूर्णतया काल्पनिक थियो। data-block-type=”embed” data-render-type=”fte” data-skip=”dealsy” data-widget-type=”seasonal” class=”hawk-root”/>
संख्याले वास्तविकताबाट विचलित नहोस्, यो याद गर्नुपर्दछ कि मिथुनको उच्च भ्रम दरले यसको कुल उत्तरहरूको 91% गलत हो भन्ने होइन। यसको सट्टा, यसको मतलब यो हो कि परिस्थितिहरूमा जहाँ सही उत्तर “मलाई थाहा छैन” हुनेछ, यसले 91% समयको जवाफलाई बनायो। यो एक सूक्ष्म तर महत्त्वपूर्ण भिन्नता हो, तर वास्तविक संसारमा प्रभाव पार्ने एउटा, विशेष गरी मिथुनलाई Google खोज जस्ता थप उत्पादनहरूमा एकीकृत गरिएको छ। dir=”ltr”>ठीक छ, यो म मात्र होइन। जेमिनी 3 फ्ल्याशको कृत्रिम विश्लेषण ओम्निसाइन्स हेलुसिनेशन रेट बेन्चमार्कमा 91% भ्रम दर छ!? के तपाई वास्तवमा यसलाई कुनै पनि गम्भीर कुराको लागि प्रयोग गर्न सक्नुहुन्छ? एन्थ्रोपिक मोडेलहरू कोडिङमा यति राम्रो हुनुको कारण हो कि तिनीहरू धेरै भ्रमित हुन्छन्… https://t.co/b3CZbX9pHwDcoma
यस नतिजाले शक्ति र उपयोगितालाई घटाउँदैन। Gemini-per-post मोडेलको उच्चतम र सामान्य परीक्षणमा रहन्छ। ChatGPT र Claude को नवीनतम संस्करणको साथमा, वा अगाडि पनि। यसले आत्मविश्वासको पक्षमा मात्र गल्ती गर्छ जब यो विनम्र हुनुपर्छ।
मिथुनका प्रतिद्वन्द्वीहरूसँग पनि जवाफ दिनमा अत्यधिक आत्मविश्वास। यी अनिश्चितता परिस्थितिहरूमा यो कति पटक हुन्छ भन्ने कुराले मिथुनको संख्यालाई अलग बनाउँछ, जहाँ प्रशिक्षण डेटामा कुनै सही जवाफ वा कुनै निश्चित सार्वजनिक स्रोतलाई औंल्याउन हुँदैन। href=”” target=”_blank” referrerpolicy=”no-referrer-when-downgrade” data-hl-processed=”none”/>
भ्रम इमान्दारी

