― Advertisement ―

Homeसूचना प्रविधिजेमिनी 3 फ्ल्यास स्मार्ट छ - तर जब यो थाहा छैन, यसले...

जेमिनी 3 फ्ल्यास स्मार्ट छ – तर जब यो थाहा छैन, यसले जे भए पनि सामान बनाउँछ




  • जेमिनी 3 ले जवाफ दिन्छ जब यो प्रायः आविष्कार गर्ने विज्ञापन थाहा हुन्छ। केहि
  • समस्या तथ्यपरक वा उच्च दाँव प्रश्नहरूको साथ उत्पन्न हुन्छ
  • तर यसले अझै पनि सबैभन्दा सटीक र सक्षम AI मोडेलको रूपमा परीक्षण गर्दछ

Gemini 3 Flash छिटो र चलाख छ। तर यदि तपाईंले यसलाई वास्तवमा थाहा नभएको कुरा सोध्नुभयो भने – केहि अस्पष्ट वा कठिन वा यसको प्रशिक्षण भन्दा बाहिर – यसले लगभग सधैं आफ्नो बाटो ब्लफ गर्ने प्रयास गर्नेछ, स्वतन्त्र परीक्षण समूह कृत्रिम विश्लेषणको हालैको मूल्याङ्कन अनुसार।

यो जेमिनी 3 फ्ल्याशले “विभ्रम दर” को भागमा ९१% हिट गरेको देखिन्छ। यसको मतलब जब योसँग जवाफ थिएन, यसले अझै पनि एउटा दियो, लगभग सबै समय, एउटा जुन पूर्णतया काल्पनिक थियो। data-block-type=”embed” data-render-type=”fte” data-skip=”dealsy” data-widget-type=”seasonal” class=”hawk-root”/>

संख्याले वास्तविकताबाट विचलित नहोस्, यो याद गर्नुपर्दछ कि मिथुनको उच्च भ्रम दरले यसको कुल उत्तरहरूको 91% गलत हो भन्ने होइन। यसको सट्टा, यसको मतलब यो हो कि परिस्थितिहरूमा जहाँ सही उत्तर “मलाई थाहा छैन” हुनेछ, यसले 91% समयको जवाफलाई बनायो। यो एक सूक्ष्म तर महत्त्वपूर्ण भिन्नता हो, तर वास्तविक संसारमा प्रभाव पार्ने एउटा, विशेष गरी मिथुनलाई Google खोज जस्ता थप उत्पादनहरूमा एकीकृत गरिएको छ। dir=”ltr”>ठीक छ, यो म मात्र होइन। जेमिनी 3 फ्ल्याशको कृत्रिम विश्लेषण ओम्निसाइन्स हेलुसिनेशन रेट बेन्चमार्कमा 91% भ्रम दर छ!? के तपाई वास्तवमा यसलाई कुनै पनि गम्भीर कुराको लागि प्रयोग गर्न सक्नुहुन्छ? एन्थ्रोपिक मोडेलहरू कोडिङमा यति राम्रो हुनुको कारण हो कि तिनीहरू धेरै भ्रमित हुन्छन्… https://t.co/b3CZbX9pHwDcomaडिसेम्बर 18, 2025

यस नतिजाले शक्ति र उपयोगितालाई घटाउँदैन। Gemini-per-post मोडेलको उच्चतम र सामान्य परीक्षणमा रहन्छ। ChatGPT र Claude को नवीनतम संस्करणको साथमा, वा अगाडि पनि। यसले आत्मविश्वासको पक्षमा मात्र गल्ती गर्छ जब यो विनम्र हुनुपर्छ।

मिथुनका प्रतिद्वन्द्वीहरूसँग पनि जवाफ दिनमा अत्यधिक आत्मविश्वास। यी अनिश्चितता परिस्थितिहरूमा यो कति पटक हुन्छ भन्ने कुराले मिथुनको संख्यालाई अलग बनाउँछ, जहाँ प्रशिक्षण डेटामा कुनै सही जवाफ वा कुनै निश्चित सार्वजनिक स्रोतलाई औंल्याउन हुँदैन। href=”” target=”_blank” referrerpolicy=”no-referrer-when-downgrade” data-hl-processed=”none”/>

भ्रम इमान्दारी

OpenAI ले यसको मोडेललाई स्पष्ट रूपमा पहिचान गर्न थालेको छ र उनीहरूले के भन्छ भनेर चिन्न थालेको छ। यो प्रशिक्षित गर्न गाह्रो कुरा हो, किनकि पुरस्कार मोडेलहरूले सामान्यतया आत्मविश्वासी (तर गलत) एकमा खाली प्रतिक्रियालाई महत्त्व दिँदैन। तैपनि, OpenAI ले भविष्यका मोडेलहरूको विकासको लागि यसलाई लक्ष्य बनाएको छ।

र जेमिनीले सामान्यतया स्रोतहरू उद्धृत गर्दछ जब यो सकिन्छ। तर पनि, यो सँधै पज हुँदैन जब यो गर्नुपर्छ। जेमिनी केवल एउटा अनुसन्धान मोडेल भएको भए यसले खासै फरक पार्दैन, तर जेमिनी Google का धेरै सुविधाहरू पछाडिको आवाज बन्ने भएकाले, विश्वस्त रूपमा गलत हुनुले धेरै प्रभाव पार्न सक्छ।

यहाँ डिजाइन विकल्प पनि छ। धेरै प्रयोगकर्ताहरूले उनीहरूको एआई सहायकले छिटो र सहज रूपमा प्रतिक्रिया दिने आशा गर्छन्। chatbot सन्दर्भ। तर यो भ्रमित हुनु भन्दा राम्रो छ। जेनेरेटिभ एआई अझै पनि सधैं भरपर्दो हुँदैन, तर कुनै पनि एआई प्रतिक्रियालाई डबल-जाँच गर्नु सधैं राम्रो विचार हो।


Google समाचारमा TechRadar फलो गर्नुहोस् हामीलाई रुचाइएको स्रोतको रूपमा थप्नुहोस्हाम्रो समाचार, फिडको समीक्षा र विज्ञहरू लिनुहोस्। फलो गर्ने बटनमा क्लिक गर्न नबिर्सनुहोस्!

र पक्कै पनि तपाईं पनि TikTok मा TechRadar फलो गर्नुहोस् समाचार, समीक्षा, भिडियो फारममा अनबक्सिङका लागि, र हामीबाट नियमित अपडेटहरू प्राप्त गर्नुहोस् WhatsApp पनि।






थप पढ्नुहोस्