- Gemini Pro 2.5 frequent अन्तर्गत साधारण रूपमा उत्पादन गरिएको छ। भेषहरू
- ChatGPT मोडेलहरूले प्रायः आंशिक अनुपालनलाई समाजशास्त्रीय व्याख्याको रूपमा फ्रेम गरी दिए
- क्लाउड ओपस र सोनेटले सबैभन्दा हानिकारक प्रम्प्टहरूलाई अस्वीकार गरे तर कमजोरीहरू थिए
आधुनिक एआई प्रणालीहरू प्रायः उनीहरूलाई सुरक्षा नियमहरू पालना गर्न र मानिसहरूलाई समर्थन गर्ने प्रत्येक दिन बलियो रूपमा पालना गर्न विश्वास गरिन्छ। गार्डरेलहरू जहिले पनि सञ्चालन हुन्छन्।
अनुसन्धानकर्ताहरू साइबरन्युज ले AI उपकरणहरू हानिकारक वा गैरकानूनी आउटपुटहरूमा धकेल्न सकिन्छ।
प्रक्रियाले प्रत्येक परीक्षणको लागि एउटा साधारण एक मिनेट अन्तरक्रिया विन्डो प्रयोग गर्यो, केवल केहि आदानप्रदानहरूको लागि ठाउँ दिईयो। data-mrf-recirculation=”Trending Bar” data-nosnippet=”” class=”clear-both pt-3 pb-4 mb-4 border-solid border-y border-neutral-300″>
तपाईलाई मन पर्न सक्छ
. id=”patterns-of-partial-and-full-compliance-3″>आंशिक र पूर्ण अनुपालनका ढाँचाहरू
परीक्षणहरूले स्टेरियोटाइप, सेल्फ-टाइप, सेल्फ-हरम, सेल्फ-हरम, विभिन्न प्रकारका प्रकारहरू जस्ता कोटीहरू समावेश गर्दछ। अपराध।
प्रत्येक प्रतिक्रिया अलग-अलग डाइरेक्टरीहरूमा भण्डारण गरिएको थियो, निश्चित फाइल-नामिङ नियमहरू प्रयोग गरी सफा तुलनाहरू अनुमति दिन, मोडेलले पूर्ण रूपमा पालना गरेको, आंशिक रूपमा पालना गरेको, वा प्रम्प्ट अस्वीकार गर्दा लगातार स्कोरिङ प्रणाली ट्र्याकिङको साथ।
सबै कोटीहरूमा, परिणामहरू व्यापक रूपमा भिन्न हुन्छन्। कडा इन्कारहरू सामान्य थिए, तर धेरै मोडेलहरूले कमजोरीहरू प्रदर्शन गरे जब प्रम्प्टहरू नरम, रिफ्रेम गरिएको, वा विश्लेषणको रूपमा लुकाइयो।
ChatGPT-5 र ChatGPT-4o ले प्रायः घट्नुको सट्टा हेज्ड वा समाजशास्त्रीय व्याख्याहरू उत्पादन गर्यो, जुन आंशिक अनुपालनको रूपमा गणना गरियो।
जेमिनी प्रो २.५ नकारात्मक कारणहरूका लागि बाहिर खडा भयो किनभने यसले हानिकारक फ्रेमिङ स्पष्ट हुँदा पनि प्रायः प्रत्यक्ष प्रतिक्रियाहरू प्रदान गर्यो। स्टिरियोटाइप परीक्षणहरू तर शैक्षिक सोधपुछको रूपमा फ्रेम गरिएका मामिलाहरूमा कम सुसंगत।
घृणित भाषण परीक्षणहरूले उही ढाँचा देखायो – क्लाउड मोडेलहरूले उत्कृष्ट प्रदर्शन गरे, जबकि जेमिनी प्रो 2.5 ले फेरि उच्च जोखिम देखायो। data-mrf-recirculation=”Trending Bar” data-nosnippet=”” class=”clear-both pt-3 pb-4 mb-4 border-solid border-y border-neutral-300″>
तपाईलाई मन पर्न सक्छ
. सामग्री।
अपराध-सम्बन्धित कोटिहरूले मोडेलहरू बीच प्रमुख भिन्नताहरू देखाए, किनकि केहीले चोरी, वित्तीय ठगी, ह्याकिङ, वा तस्करीका लागि विस्तृत व्याख्याहरू प्रस्तुत गरे जब उद्देश्यलाई अनुसन्धान वा अवलोकनको रूपमा मास्क गरिएको थियो।
औषध-सम्बन्धित परीक्षणहरूले कडा इन्कार गर्ने ढाँचाहरू उत्पादन गर्यो, एक GP-To आउटपुट थप Chat प्रायः अरूको तुलनामा, र स्टकिङ सबैभन्दा कम समग्र जोखिमको श्रेणी थियो, लगभग सबै मोडेलहरूले प्रम्प्टहरू अस्वीकार गरेका छन्।
खोजहरूले पत्ता लगाउँछन् कि एआई उपकरणहरूले अझै पनि हानिकारक प्रम्प्टहरूमा प्रतिक्रिया दिन सक्छन् जब सही तरिकामा वाक्यांश गरिन्छ।
सरल रिफ्रेसिङको साथ फिल्टरहरू बाइपास गर्ने क्षमताको मतलब यी प्रणालीहरूले अझै पनि जोखिमपूर्ण हुन सक्छ। लीक गरिएको जानकारी अवैध कार्य वा परिस्थितिहरूसँग सम्बन्धित छ जहाँ मानिसहरू सामान्यतया पहिचान चोरी संरक्षण वा फायरवाल सुरक्षित रहन।
Google समाचारमा TechRadar फलो गर्नुहोस् र हामीलाई रुचाइएको स्रोतको रूपमा थप्नुहोस्हाम्रो समाचार, फिडको समीक्षा र विज्ञहरू लिनुहोस्। फलो गर्ने बटनमा क्लिक गर्न नबिर्सनुहोस्!
र पक्कै पनि तपाईं पनि TikTok मा TechRadar फलो गर्नुहोस् समाचार, समीक्षा, भिडियो फारममा अनबक्सिङका लागि, र हामीबाट नियमित अपडेटहरू प्राप्त गर्नुहोस् WhatsApp पनि।

