परिचित टूल का उपयोग करके FPGA पर एज AI को कैसे तैनात करें

June 1, 2026
के बारे में नवीनतम कंपनी की खबर परिचित टूल का उपयोग करके FPGA पर एज AI को कैसे तैनात करें

नेटवर्क के किनारे पर एआई का मतलब शायद ही कभी केवल अनुमान होता है। वास्तविक दुनिया परिनियोजन में आम तौर पर उच्च गति इनपुट/आउटपुट (आई/ओ), सिग्नल कंडीशनिंग और वास्तविक समय नियंत्रण लूप शामिल होते हैं, जो सभी समवर्ती रूप से निष्पादित होते हैं। इन बहुक्रियाशील कार्यभार के लिए कड़े समन्वय और उच्च निश्चितता की आवश्यकता होती है, और डिजाइनरों को मुख्यधारा एआई हार्डवेयर का उपयोग करके इन आवश्यकताओं को पूरा करना मुश्किल लगता है।

दो कारक इस समस्या को और भी जटिल बनाते हैं। सबसे पहले, एआई मॉडल आश्चर्यजनक गति से विकसित हो रहे हैं, जिससे डिजाइनरों को ऐसे प्लेटफॉर्म अपनाने के लिए प्रेरित किया जा रहा है जो तेजी से एल्गोरिदम अपडेट का समर्थन करते हैं। इस बीच, कई एज सिस्टम दस साल या उससे अधिक समय से साइट पर उपयोग में हैं, जिससे दीर्घकालिक अनुकूलनशीलता सुनिश्चित करना मुश्किल हो गया है। दूसरे, अच्छी तरह से प्रशिक्षित मॉडल से सिस्टम परिनियोजन और कार्यान्वयन तक का मार्ग अभी भी खंडित है। डेटा वैज्ञानिक PyTorch और TensorFlow का उपयोग करते हैं, जबकि एम्बेडेड टीमें पूरी तरह से अलग टूलचेन का उपयोग करती हैं, जो हैंडओवर प्रक्रिया के दौरान घर्षण पैदा करती है और उत्पादन की गति को धीमा कर देती है।

इन चुनौतियों का समाधान करने के लिए, प्लेटफार्मों को नियतात्मक व्यवहार, लचीले I/O और दीर्घकालिक अनुकूलनशीलता के साथ उच्च-थ्रूपुट एआई प्रसंस्करण को संयोजित करने में सक्षम होने की आवश्यकता है, इन सभी को सीमित किनारे की तैनाती की विशिष्ट बिजली खपत सीमा के भीतर हासिल किया जाना चाहिए।

यह आलेख उन एप्लिकेशन परिदृश्यों और संबंधित आवश्यकताओं पर केंद्रित है जो डिजाइनरों को नए अत्याधुनिक एआई आर्किटेक्चर का पता लगाने के लिए चुनौती देते हैं। फिर, इसने अल्टेरा के फील्ड प्रोग्रामेबल गेट ऐरे (एफपीजीए) डिवाइस और सॉफ्टवेयर टूल पेश किए जो एज एआई का समर्थन करते हैं, और प्रदर्शित किया कि इन अनुप्रयोगों के विविध प्रदर्शन और बिजली आवश्यकताओं को पूरा करने के लिए उनका उपयोग कैसे किया जाए।

एज एआई के विकास के लिए वास्तुशिल्प नवाचार की आवश्यकता है
एज सिस्टम तेजी से विविध एआई तकनीकों को अपना रहे हैं, जिसमें विसंगति का पता लगाने के लिए क्लासिकल मशीन लर्निंग (एमएल), धारणा के लिए कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन), और बड़े भाषा मॉडल (एलएलएम) के लिए कन्वर्टर्स शामिल हैं। ये कम्प्यूटेशनल रूप से गहन एल्गोरिदम अक्सर सिग्नल प्रोसेसिंग, नेटवर्क संचार और वास्तविक समय नियंत्रण जैसे गैर-एआई कार्यों की मांग के साथ सह-अस्तित्व में होते हैं।

स्वायत्त प्रणालियाँ इसका एक अच्छा उदाहरण हैं। उन्हें आम तौर पर वीडियो, ऑडियो, रडार, LiDAR और गति/स्थिति प्रतिक्रिया जैसे कई सेंसर तौर-तरीकों से डेटा कैप्चर करने, उच्च थ्रूपुट के साथ इन डेटा स्ट्रीम को प्रीप्रोसेस करने, जटिल AI का उपयोग करके परिणामों का विश्लेषण करने और फिर उच्च-सटीक नियंत्रण लूप प्रबंधित करने की आवश्यकता होती है, जिनमें से सभी के लिए विश्वसनीय निर्धारण की आवश्यकता होती है।

औद्योगिक स्वचालन, चिकित्सा इमेजिंग, रक्षा और दूरसंचार अनुप्रयोगों में कई समान उदाहरण हैं। उनके सामने एक आम चुनौती यह है कि पारंपरिक वास्तुकला को लगातार बदलते कार्यभार के अनुरूप ढालना मुश्किल होता है।

एफपीजीए एज एआई के लिए विशेष रूप से उपयुक्त क्यों है?
इसके विपरीत, ये आवश्यकताएँ FPGA की कार्यक्षमता के साथ पूरी तरह से संगत हैं। एफपीजीए का मूल वास्तव में समानांतर तरीके से संचालन करने के लिए कॉन्फ़िगर करने योग्य तर्क प्रदान करना है, जिसमें रनटाइम में उतार-चढ़ाव के बजाय डिज़ाइन समय पर इसका समय व्यवहार अंतर्निहित होता है। यह आर्किटेक्चर कम विलंबता नियतिवाद प्राप्त कर सकता है, जो एज एआई के लिए महत्वपूर्ण है। लचीले तर्क भी शक्तिशाली I/O का उपयोग कर सकते हैं: FPGAs आम तौर पर प्रचुर मात्रा में उच्च गति I/O प्रदान करते हैं, जिन्हें AI प्रसंस्करण के साथ टाइट कपलिंग प्राप्त करने के लिए विभिन्न सेंसर और एक्चुएटर्स से जोड़ा जा सकता है।

एफपीजीए में वितरित आंतरिक मेमोरी भी शामिल है, जो उस पर संचालित तर्क द्वारा डेटा तक पहुंचने में सक्षम बनाता है। यह उस बाधा को कम करता है जो तब उत्पन्न होती है जब कई प्रसंस्करण चरणों को साझा मेमोरी बस तक पहुंचने के लिए प्रतिस्पर्धा करनी पड़ती है, जो प्रोसेसर आधारित आर्किटेक्चर में एक सामान्य सीमा है।

कई FPGAs विशेष डिजिटल सिग्नल प्रोसेसिंग (DSP) हार्डवेयर को भी एकीकृत करते हैं। पारंपरिक संरचनाओं की तुलना में, ये उन्नत सर्किट सिग्नल प्रोसेसिंग कार्यभार के लिए उच्च प्रदर्शन और बेहतर ऊर्जा दक्षता प्रदान करते हैं। कुछ एफपीजीए हार्ड वायर्ड प्रोसेसर सिस्टम को भी एकीकृत करते हैं जो मानक सॉफ्टवेयर स्टैक (लिनक्स सहित) चला सकते हैं, जिससे नेटवर्किंग, डिवाइस प्रबंधन और यूजर इंटरफेस जैसे कार्यों के लिए पारंपरिक सॉफ्टवेयर विकास सक्षम हो जाता है।

संक्षेप में, एक एकल एफपीजीए उन कार्यों को एकीकृत कर सकता है जिनके लिए अलग-अलग आई/ओ चिप्स, एआई एक्सेलेरेटर, डीएसपी और नियंत्रण विमान प्रोसेसर की आवश्यकता हो सकती है। यह सामग्री के बिल (बीओएम) को कम कर सकता है, सर्किट बोर्ड क्षेत्र को छोटा कर सकता है, बिजली की खपत कम कर सकता है, जबकि एज एआई अनुप्रयोगों के लिए आवश्यक कम विलंबता और निश्चितता को बनाए रख सकता है।

एआई टेंसर ब्लॉकों को जोड़कर नई संभावनाएं कैसे खोलें
पारंपरिक एफपीजीए डीएसपी हार्डवेयर पहले से ही कई एज वर्कलोड के लिए बहुत उपयुक्त है, लेकिन एआई अनुमान अक्सर घने लेकिन कम परिशुद्धता गुणन संचालन पर निर्भर करता है। इस समस्या के समाधान के लिए, Altera के Agilex 3 और Agilex 5 डिवाइस AI टेंसर ब्लॉक के साथ उन्नत DSPs का उपयोग करते हैं। यह मैट्रिक्स मैट्रिक्स और वेक्टर मैट्रिक्स गुणन के लिए विशेष हार्डवेयर है, जो बार-बार एआई गणना ग्राफ़ में दिखाई देता है।

इस विधि का मूल अदिश उत्पाद और योजक/संचायक इंजन है (चित्र 1)। टेंसर मोड में, हार्ड वायर्ड पॉइंट इंजन 10 एलिमेंट डॉट उत्पाद को निष्पादित करने के लिए 8-बिट इनपुट और प्रीलोडेड 8-बिट वेट का उपयोग करता है। गतिशील रेंज का विस्तार करने के लिए, डेटा पथ विशिष्ट परिदृश्यों से निपटने के लिए ब्लॉक फ़्लोटिंग पॉइंट स्केलिंग के लिए एक साझा "सामान्य सूचकांक" का भी उपयोग कर सकता है जहां एआई अनुमान के लिए आमतौर पर उच्च गतिशील रेंज लेकिन कम सटीकता की आवश्यकता होती है।