राइजेन एआई हेलोले प्रस्ताव गरेको कन्फिगरेसन केही महिनादेखि बजारमा आएको छ, र धेरैजसो OEM र उद्यम प्रदायकहरूले उही स्वाद र कन्फिगरेसन प्रस्ताव गरिरहेका छन्, शेन्जेनले मेमोरीमा थप कदमहरू लिएको छ। id=”elk-seasonal”/>
भण्डारण विशालले Ryzen AI Halo को आफ्नै संस्करणमा चलिरहेको 397B-पैरामिटर AI मोडेलको स्थानीयकृत संस्करण प्रदर्शन गर्यो, जसमा उही 16-16GB RAM र y1395 RAM माक्स कन्फिगरेसन।
पछिल्लो भिडियोहरू
केवल 128GB RAM को साथ यति ठूलो मोडेल चलाउन सक्षम हुनुहुन्छ?
जब मोडल चलिरहेको छ स्पष्ट रूपमा भनिएको छैन, यो एक अनुकूलित संस्करण हो जस्तो देखिन्छ (Q1wA59B73) बाट व्युत्पन्न। मिक्स्चर-अफ-एक्सपर्ट्स (MoE) दृष्टिकोणको लाभ उठाउने मल्टिमोडल फाउन्डेशन मोडेल, जसले मौलिक DeepSeek लाई यस्तो शक्तिशाली चुनौती बनायो।
यसले INT4 क्वान्टाइजेसनको फाइदा उठाइरहेको भए पनि, मेमोरी आवश्यकताहरू उपलब्धता देखाउने यन्त्रले प्रस्ताव गरेको मेमोरीभन्दा धेरै छन्: केवल 96GB को GPU2GB कन्फिगरेसनमा उपलब्ध छ, VRAM को 81GB अनकन्फिफाइड। मोडेल चलाउनको लागि अनुमानित 200-250GB VRAM। आवश्यकताहरू पर्याप्त रूपमा।
विज्ञहरूलाई अफलोड गर्ने ठूलो, छिटो भण्डारण बफरमा सक्रिय रूपमा प्रयोग नगर्ने विज्ञहरूलाई समावेश गर्दछ जुन AI चिपले आवश्यक भएमा तिनीहरूलाई पुन: परिचय गराउन सक्छ। newsletter-inbodyContent-slice newsletterForm-articleInbodyContent-DikcuYaQVeAxxRtDQiBbsh स्लाइस-कन्टेनर-newsletterForm”>
class=”newsletter-form__top-bar”/>
तपाईको व्यवसाय सफल हुन आवश्यक पर्ने सबै शीर्ष समाचार, राय, सुविधाहरू र मार्गदर्शन प्राप्त गर्न TechRadar प्रो न्यूजलेटरमा साइन अप गर्नुहोस्! href=”https://www.longsys.com/about-longsys/news/AIDIMM-AILPBGA-Make-Global-Debut-Longsys-Spotlights-Full-Stack-Edge-AI-Storage-Solutions-at-COMPUTEX-2026.html” target=”_blank” data-url=”https://www.longsys.com/about-longsys/news/AIDIMM-AILPBGA-Make-Global-Debut-Longsys-Spotlights-Full-Stack-Edge-AI-Storage-Solutions-at-COMPUTEX-2026.html” referrerpolicy-downregra=”no” data-hl-processed=”none” data-mrf-recirculation=”inline-link”>प्रेस विज्ञप्ति, Longsys ले आफ्नो दृष्टिकोणले लक्ष्य बनाएर काम गरेको दाबी गर्यो, “MoE LLMs को दुखाइ बिन्दुहरू”, जस्तै ठूला प्यारामिटर गणनाहरू, द्रुत KV क्यास विस्तार, र I/O विलम्बता जसले inferference दक्षतामा बाधा पुर्याउँछ “cap>
भण्डारण समयतालिका चुनौतिहरू कुशलतापूर्वक समाधान गर्न र स्थानीय एआई इन्फरेन्स स्मूथनेसलाई व्यापक रूपमा सुधार गर्न व्यवस्थापन, र भविष्यवाणी गर्ने प्रिफेच एल्गोरिदमहरू, "कम्पनीले थपे।
यो ध्यान दिनु महत्त्वपूर्ण छ कि यो कदम आफैंमा एक प्रभावशाली उपलब्धि हो, Longsys ले कम्प्युट पावरमा विशिष्टता प्रदान गरेन जहाँ टोकनहरू प्रति सेकेन्ड एआईसँग तुलनात्मक रूपमा आधुनिक एआई सीमित छ। GPU प्रस्तावहरू। कुनै सानो उपलब्धि होइन। यसको मतलब यो हो कि पहिले डेटासेन्टरहरूमा सीमित गरिएका मोडेलहरू अब तपाईंको हातको हत्केलामा फिट हुने यन्त्रमा चलाउन सकिन्छ।