माइक्रोसफ्टको एआई सुरक्षा टोलीले इन्टरप्राइज भाषा मोडेलहरू भित्र लुकेका प्रशिक्षण ब्याकडोरहरू चुपचाप कसरी जीवित रहन्छ भनेर प्रकट गर्दछ। -

Microsoft ले poison लाई मोडेल पत्ता लगाउन स्क्यानर सुरु गर्नु अघि डिप्लोयमेन्ट
ब्याकडोर LLM ले खराब व्यवहार लुकाउन सक्छ जबसम्म विशेष ट्रिगर वाक्यांशहरू देखा पर्दैन id=”aaa555ff-7b8c-474a-b8cd-023e1854ef0e”/>
माइक्रोसफ्टले नयाँ डिजाइनको घोषणा गरेको छ schidnera> पत्ता लगाउन नयाँ डिजाइन इन्टरप्राइज वातावरणमा प्रयोग हुने ओपन-वेट ठूला भाषा मोडेलहरूमा ब्याकडोरहरू।

कम्पनी भन्छ कि यसको उपकरणले मोडेल विषाक्तताका उदाहरणहरू पहिचान गर्ने लक्ष्य राखेको छ, छेडछाडको एक प्रकार जहाँ दुर्भावनापूर्ण व्यवहार सीधा मोडेल वजनहरूमा तालिमको क्रममा सम्मिलित हुन्छ। data-render-type=”fte” data-skip=”dealsy” data-widget-type=”seasonal” class=”hawk-root”/>

यी ब्याकडोरहरू प्रभावकारी रूपमा डेटा-लिंकमा रहन सक्छन्, <लिंक-डाटालाई प्रभावकारी रूपमा अनुमति दिन्छ।" href="https://www.techradar.com/computing/artificial-intelligence/best-llms" data-url="https://www.techradar.com/computing/artificial-intelligence/best-llms" data-hl-processed="none" data-mrf-recirculation="inline-link" data-before-rewrite-localise="https://www.techradar.com/computing/artificial-intelligence/best-llms">LLMs संकीर्ण रूपमा परिभाषित ट्रिगर अवस्थाहरूले अनपेक्षित प्रतिक्रियाहरू सक्रिय नगरेसम्म सामान्य रूपमा व्यवहार गर्न। data-mrf-recirculation=”Trending Bar” data-nosnippet=”” class=”clear-both pt-3 pb-4 mb-4 border-solid border-y border-neutral-300″>

तपाईलाई मन पर्न सक्छ

> id=”cd2c02fb-d1e2-4575-bef2-e58e65bd58c0″>“जसरी गोद लिने क्रम बढ्दै जान्छ, सुरक्षा उपायहरूमा विश्वास पनि बढ्नुपर्छ: जबकि ज्ञात व्यवहारहरूको परीक्षण अपेक्षाकृत सरल छ, अझ महत्त्वपूर्ण चुनौती अज्ञात वा विकसित हुने विरुद्ध आश्वासन निर्माण गर्नु हो” <लिंक-डाटामा माइक्रोसफ्टले भन्यो-" href="https://www.microsoft.com/en-us/security/blog/2026/02/04/detecting-backdoored-language-models-at-scale/" target="_blank" rel="nofollow" data-url="https://www.microsoft.com/en-us/security/blog/2026/02/04/detecting-backdoored-language-models-at-scale/" referrerpolicy="no-referrer-when-downgrade" data-hl-processed="none" data-mrcib-line="none" data-mrlogin पोस्ट।

कम्पनीको एआई सुरक्षा टोलीले स्क्यानरलाई विषाक्त मोडेलहरूको उपस्थितिलाई संकेत गर्ने तीनवटा अवलोकनयोग्य संकेतहरूमा निर्भर रहेको टिप्पणी गर्छ।

प्रम्प्टमा ट्रिगर वाक्यांश समावेश गर्दा पहिलो संकेत देखा पर्दछ, जसले मोडेलको ध्यान संयन्त्रहरूलाई ट्रिगरलाई अलग गर्नको लागि आउटपुट साइन इनडोम>

सेकेन्ड साइन्स व्यवहार घटाउँछ। जहाँ ब्याकडोर मोडेलहरूले सामान्य प्रशिक्षण जानकारीमा भर पर्नुको सट्टा ट्रिगर वाक्यांशहरू सहित तिनीहरूको आफ्नै विषाक्त डेटाका तत्वहरू चुहावट गर्छन्। newsletterForm-articleInbodyContent-JyJCCcHGCogw63uCopmyWG slice-container-newsletterForm”>

class=”newsletter-form__top-bar”/>

TechRadar Pro न्यूजलेटरमा साइन अप गर्नुहोस् सबै शीर्ष समाचारहरू, राय, सुविधाहरू र तपाईंको व्यवसायलाई सफल हुन आवश्यक मार्गदर्शन प्राप्त गर्न! फजी ट्रिगरहरू जुन मिल्दोजुल्दो छ, तर ठ्याक्कै मेल खाँदैन, मूल विषाक्त इनपुट।

“हाम्रो दृष्टिकोण दुई मुख्य निष्कर्षहरूमा निर्भर गर्दछ,” माइक्रोसफ्टले सँगैको अनुसन्धान पत्रमा भन्यो।

“पहिलो, स्लीपर एजेन्टहरूले विषाक्त डेटालाई सम्झन्छन्, यसले ब्याकडोर उदाहरणहरू चुहावट गर्न सम्भव बनाउँदछ, मेमोरी एक्स्ट्र्याक्शन प्रविधिको प्रयोग गरेर। जब ब्याकडोर ट्रिगरहरू इनपुटमा उपस्थित हुन्छन् तिनीहरूको आउटपुट वितरण र ध्यान हेडहरूमा। border-neutral-300″>

तपाईलाई मन पर्न सक्छ

Microsoft ले स्क्यानरले एउटा मोडेलबाट कण्ठित सामग्री निकाल्छ, शंकास्पद सबस्ट्रिङहरू अलग गर्न विश्लेषण गर्छ र त्यसपछि ती सबस्ट्रिङहरूलाई तीनवटा पहिचान गरिएका सङ्केतहरूसँग बाँधिएको औपचारिक हानि प्रकार्यहरू प्रयोग गरेर स्कोर गर्छ।

विधिले ट्रिगर उम्मेदवारहरूको श्रेणीबद्ध सूची उत्पादन गर्छ बिना थप प्रशिक्षण वा सामान्य ज्ञान वा GPT कार्यहरू भरि सामान्य ज्ञानको आवश्यकता बिना। मोडेलहरु। कम्पनीले उपकरणलाई विश्वव्यापी समाधानको रूपमा व्यवहार गर्नु हुँदैन भन्यो।

“पूर्वानुमान गर्न सकिने मार्गहरू भएका परम्परागत प्रणालीहरूको विपरीत, AI प्रणालीहरूले असुरक्षित इनपुटहरूको लागि धेरै प्रविष्टि बिन्दुहरू सिर्जना गर्दछ,” योनाटन जुङ्गर, कर्पोरेट VP र आर्टिफिसियल इन्टेलिजेन्सका लागि उप प्रमुख सूचना सुरक्षा अधिकारीले भने। व्यवहार।”

Google समाचारमा TechRadar फलो गर्नुहोस् र हामीलाई प्राथमिकताको रूपमा थप्नुहोस् //em>प्राथमिकता स्रोतको रूपमा थप्नुहोस् समीक्षाहरू, र तपाईंको फिडहरूमा राय। फलो बटनमा क्लिक गर्न निश्चित हुनुहोस्!
र पक्कै पनि तपाईं TikTok मा TechRadar फलो गर्नुहोस् समाचार, समीक्षा, भिडियो फारममा अनबक्सिङका लागि र हामीबाट नियमित अपडेटहरू प्राप्त गर्नुहोस् WhatsApp पनि।

Share this:
Facebook
X
Like this:
Like Loading...

Related

Previous article
SmarterTools नेटवर्क एकल अनप्याच गरिएको भर्चुअल मेसिन विरुद्ध प्रमाण-बाइपास आक्रमण प्रयोग गरेर उल्लंघन गरियो
Next article
माइक्रोसफ्टले Copilot मा अरबौं खर्च गर्यो, तर केवल 3.3% प्रयोगकर्ताहरूले AI उपकरणहरूको लागि भुक्तान गरिरहेका छन्

जापानी दूतावासले काठमाडौंमा राष्ट्रिय दिवस मनाउने – KhabarHost – नेपालको नम्बर १ अंग्रेजी दैनिक समाचारपत्र

Segway Navimow CEO किन यो यसको रोबोट ल्यान घाँस काट्ने मा ‘विशेषताहरूमा मात्र ढाल’ हुने छैन।

कोरियाली राजदूत पार्क IEEE ICTP 2026, KAIST GDI कार्यशाला काठमाडौंमा उपस्थित – KhabarHost – नेपालको नम्बर 1 अंग्रेजी दैनिक समाचार पत्र

जापानी दूतावासले काठमाडौंमा राष्ट्रिय दिवस मनाउने – KhabarHost – नेपालको नम्बर १ अंग्रेजी दैनिक समाचारपत्र

Segway Navimow CEO किन यो यसको रोबोट ल्यान घाँस काट्ने मा ‘विशेषताहरूमा मात्र ढाल’ हुने छैन।

कोरियाली राजदूत पार्क IEEE ICTP 2026, KAIST GDI कार्यशाला काठमाडौंमा उपस्थित – KhabarHost – नेपालको नम्बर 1 अंग्रेजी दैनिक समाचार पत्र

Like this:

Related

Segway Navimow CEO किन यो यसको रोबोट ल्यान घाँस काट्ने मा ‘विशेषताहरूमा मात्र ढाल’ हुने छैन।

Quick Links

Must Read

जापानी दूतावासले काठमाडौंमा राष्ट्रिय दिवस मनाउने – KhabarHost – नेपालको नम्बर १ अंग्रेजी दैनिक समाचारपत्र

Segway Navimow CEO किन यो यसको रोबोट ल्यान घाँस काट्ने मा ‘विशेषताहरूमा मात्र ढाल’ हुने छैन।

कोरियाली राजदूत पार्क IEEE ICTP 2026, KAIST GDI कार्यशाला काठमाडौंमा उपस्थित – KhabarHost – नेपालको नम्बर 1 अंग्रेजी दैनिक समाचार पत्र

समूह ‘सी’को महत्वपूर्ण खेलमा नेपाल र इटाली भिड्दैछन्

Popular Articles

जापानी दूतावासले काठमाडौंमा राष्ट्रिय दिवस मनाउने – KhabarHost – नेपालको नम्बर १ अंग्रेजी दैनिक समाचारपत्र

Segway Navimow CEO किन यो यसको रोबोट ल्यान घाँस काट्ने मा ‘विशेषताहरूमा मात्र ढाल’ हुने छैन।

कोरियाली राजदूत पार्क IEEE ICTP 2026, KAIST GDI कार्यशाला काठमाडौंमा उपस्थित – KhabarHost – नेपालको नम्बर 1 अंग्रेजी दैनिक समाचार पत्र