अभिसरण बाधा को तोड़ना, क्वेरी और टेक्स्ट अभ्यावेदन का अनुमान लगाना

यह इस साल प्रकाशित सबसे दिलचस्प एआई शोध प्रकाशन है। यह अधिक एकत्र करता है हाल की उपलब्धियां आर्टिफिशियल इंटेलिजेंस और डेटा साइंस में। यह कालानुक्रमिक रूप से एक लेख के लिंक के साथ व्यवस्थित किया गया है जो अधिक विवरण में जाता है।

अभिसरण बाधा को तोड़ना: निरंतर समय में अभिसरण धाराओं के माध्यम से अनुकूलन

त्वरित ढाल विधियां बड़े पैमाने पर डेटा-संचालित अनुकूलन समस्याओं की रीढ़ हैं और मशीन सीखने और अन्य क्षेत्रों में स्वाभाविक रूप से दिखाई देती हैं जो डेटा विश्लेषण से संबंधित हैं।

यहां, शोधकर्ता त्वरण के लिए एक ढाल-आधारित अनुकूलन ढांचा प्रस्तुत करते हैं। यह गतिशील प्रणालियों की अस्थायी स्थिरता के बारे में हाल ही में सामने रखे गए विचार पर आधारित है। यह विधि सरल ग्रेडिएंट-आधारित विधियों का एक सामान्यीकरण प्रतीत होती है, जो एक निर्दिष्ट समय में ऑप्टिमाइज़र में परिवर्तित होने के लिए पैमाना है, भले ही समस्या को शुरू में कैसे सेट किया गया हो। शोधकर्ता समय-स्थिर गतिशील प्रणालियों को डिजाइन करने के लिए निरंतर समय सीमा का उपयोग करके ऐसा करते हैं। फिर वे एक सुसंगत विवेकाधीन रणनीति पेश करते हैं जैसे कि समतुल्य असतत-समय एल्गोरिथ्म एक निश्चित संख्या में पुनरावृत्तियों में अनुकूलक को ट्रैक कर सकता है। यह एक सैद्धांतिक विश्लेषण भी देता है कि प्रस्तावित ढाल प्रवाह कैसे अभिसरण करता है। इसके अलावा, वे एक साथ जोड़े गए गड़बड़ी को किस हद तक संभालने में सक्षम हैं।

शोधकर्ताओं ने यह भी दिखाया कि निरंतर समय अभिसरण के कारण अभिसरण की दर से जुड़ा अफसोस हमेशा समान होता है। हाइपरपैरामीटर का अर्थ समझना आसान है, और हम वांछित आत्मीयता दरों की जरूरतों को पूरा करने के लिए उन्हें बदल सकते हैं। वे कई संख्यात्मक उदाहरणों में सर्वोत्तम अनुकूलन एल्गोरिदम के साथ प्रस्तावित योजनाओं के त्वरित अभिसरण की तुलना करते हैं। इसके अलावा, उनका काम हमें निरंतर समय में धाराओं को विघटित करके नए अनुकूलन एल्गोरिदम बनाने के बारे में विचार देता है।

READ  पहली बार एक के पीछे से रोशनी देखना Spot

प्रेडिकेट-अवेयर क्वेरी राउंडिंग कंडीशनल सिंथेसिस मॉडल

अनुमानित क्वेरी प्रोसेसिंग (एक्यूपी) का उद्देश्य महंगे थोक प्रश्नों के त्वरित लेकिन “पर्याप्त पर्याप्त” उत्तर प्रदान करना है, जिससे उपयोगकर्ताओं के लिए बड़े डेटा सेट को अंतःक्रियात्मक रूप से एक्सप्लोर करना आसान हो जाता है। डेटाबेस क्लस्टर में पारंपरिक क्वेरी प्रोसेसिंग की तुलना में, मशीन लर्निंग पर आधारित हाल ही में प्रस्तावित AQP तकनीक बहुत कम प्रतिक्रिया समय प्रदान कर सकती है क्योंकि क्वेरी निष्पादन में केवल मॉडल अनुमान शामिल है।

लेकिन इन विधियों की राउंडिंग त्रुटि खराब हो जाती है क्योंकि फ़िल्टर की संख्या (WHERE क्लॉज़) बढ़ जाती है। अंतर्दृष्टि खोजने के लिए, विश्लेषक अक्सर बहुत से विधेय वाले प्रश्नों का उपयोग करते हैं। इसलिए, यदि विश्लेषक गलत निष्कर्ष नहीं निकालना चाहते हैं, तो अनुमानित त्रुटि को कम रखना महत्वपूर्ण है।

इस पत्र में, शोधकर्ताओं ने इलेक्ट्रा का प्रस्ताव दिया है, जो एक देशी कथित AQP प्रणाली है जो कई विधेय और बहुत अधिक छोटी गोल त्रुटियों के साथ विश्लेषिकी शैली के प्रश्नों का उत्तर दे सकती है। इलेक्ट्रा एक सशर्त निर्माण मॉडल का उपयोग करता है जो डेटा के सशर्त वितरण को सीखता है और, रन टाइम पर, एक छोटा (1000) लेकिन प्रतिनिधि नमूना उत्पन्न करता है, जिस पर परिणाम का अनुमान लगाने के लिए क्वेरी को चलाया जाता है। तीन वास्तविक दुनिया के डेटासेट और चार अलग-अलग बेसलाइन का उपयोग करके उनके परीक्षण से पता चलता है कि इलेक्ट्रा में बेसलाइन की तुलना में कई विधेय के लिए कम AQP त्रुटि है।

गैर पर्यवेक्षित व्याकरण जाँच के लिए पाठ अभ्यावेदन का गहन संयोजन

READ  हबल ने 68.1 मिलियन प्रकाश-वर्ष दूर तीन विलय वाली आकाशगंगाओं की एक आश्चर्यजनक छवि कैप्चर की

शोधकर्ता इस बात की जांच कर रहे हैं कि कैसे गहन क्लस्टर टेक्स्ट अभ्यावेदन असुरक्षित मॉडल को सिंटैक्स को समझने और सीखने में मदद कर सकते हैं। चूंकि ये उच्च आयामी प्रतिनिधित्व हैं, KMeans जैसी विधियां अच्छी तरह से काम नहीं करती हैं। इसलिए, उनका दृष्टिकोण निरूपण को एक निम्न आयामी स्थान में बदल देता है जो उन्हें समूहबद्ध करने और फिर उन्हें समूहबद्ध करने के लिए अच्छा है।

इस काम में, शोधकर्ता वाक्य रचना के बारे में दो विचारों की जांच करते हैं: भाषण के लिए आंशिक प्रेरण (पीओएसआई) और निर्वाचन क्षेत्र लेबलिंग (कोलैब)। उन्हें यह दिलचस्प लगा कि बहुभाषी BERT (mBERT) अंग्रेजी व्याकरण की आश्चर्यजनक मात्रा जानता है, और शायद अंग्रेजी BERT (EBERT) भी। उनके मॉडल को किसी ऐसी चीज़ को देखने के लिए एक अनुपयोगी जांच के रूप में इस्तेमाल किया जा सकता है जो कम पक्षपाती हो सकती है। उन्होंने पाया कि पर्यवेक्षित जांच की तुलना में असुरक्षित जांच ऊपरी परतों से लाभान्वित होती है। इसके अलावा, शोधकर्ताओं का यह भी कहना है कि उनकी असुरक्षित जांच में विभिन्न तरीकों से POSI के EBERT और mBERT अभ्यावेदन का उपयोग किया जाता है। अंत में, उन्होंने दिखाया कि उनकी जांच यह दिखा कर काम करती है कि इसे एक असुरक्षित भाषा प्रेरण पद्धति के रूप में इस्तेमाल किया जा सकता है। उनकी जांच दोनों व्याकरणिक रूपों के साथ अच्छी तरह से काम करती है क्योंकि यह बदलती है कि कैसे इनपुट का प्रतिनिधित्व किया जाता है।

इसके अलावा, शोधकर्ताओं का कहना है कि उनकी जांच ने 45 अंकों की अंग्रेजी भाषा पीओएसआई में अच्छा प्रदर्शन किया, दस भाषाओं में 12 पीओएसआई अंकों में हाल ही में, और कोलैब में अच्छा प्रदर्शन किया। वे कुछ संसाधनों के साथ भाषाओं पर थोड़ा व्याकरणिक आंदोलन भी करते हैं और कहते हैं कि परिणाम आशाजनक हैं।

READ  यूएनडी सम्मेलन अंतरिक्ष और कृषि के चौराहे की पड़ताल करता है - ग्रैंड फोर्क्स हेराल्ड

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा.