अनुसंधान

Gravenos एक उत्पाद कंपनी है, अनुसंधान प्रयोगशाला नहीं। फिर भी हम उन शोध प्रश्नों पर पक्ष रखते हैं जिन पर हमारा कार्य निर्भर है; यह पृष्ठ उन्हें प्रस्तुत करता है।

AI सुरक्षा पर

हम फ़ाउंडेशन मॉडल नहीं बनाते। हम उनका उपयोग करते हैं, मुख्यतः Institution टियर पर Anthropic Claude Sonnet, पर्याप्त सिस्टम-प्रॉम्प्ट इंजीनियरिंग और एक सत्यापन परत के साथ जो मॉडल को सत्यापित डेटा तक सीमित रखती है। हमारी स्थिति की कंपनी के लिए प्रमुख AI सुरक्षा प्रश्न इसलिए फ्रंटियर मॉडलों का संरेखण नहीं है, जो प्रयोगशालाओं का कार्य है; यह ऐसे क्षेत्र में उन मॉडलों की सुरक्षित तैनाती है जहाँ उनकी विफलता-विधियों के विशिष्ट परिणाम होते हैं।

दो विफलता-विधियाँ हमारे मन में रहती हैं। पहली है हैलुसिनेशन: मॉडल द्वारा सत्यापित डेटा पर आधारित न होते हुए विश्वासपूर्वक प्रस्तुत किया गया कथन। हमारी सत्यापन परत मुख्य रक्षा है; सिस्टम प्रॉम्प्ट जो मॉडल को अज्ञात को चिह्नित करने का निर्देश देता है, द्वितीयक है। दूसरी है नियामक विचलन: एक पर्याप्त सक्षम मॉडल को विश्लेषण के बजाय निवेश सलाह उत्पन्न करने की ओर खिसकने देने का प्रलोभन। हमारे सिस्टम प्रॉम्प्ट में स्पष्ट अस्वीकरण निर्देश शामिल हैं; हमारी आंतरिक समीक्षा ऐसे विचलन के संकेतों के लिए मॉडल आउटपुट की जाँच करती है।

हम Anthropic, OpenAI, DeepMind, तथा भाषा-मॉडल सुरक्षा पर शैक्षणिक साहित्य के प्रकाशित कार्य का गंभीरता से अनुसरण करते हैं। हम उस साहित्य में योगदानकर्ता नहीं हैं, परन्तु हम उसके चौकस उपभोक्ता हैं।

मात्रात्मक मॉडलिंग की सीमाओं पर

हमारी परिदृश्य मॉडलिंग और जोखिम गणना भविष्य के रिटर्न के वितरण, सहसंबंधों के स्थायित्व, और ऐतिहासिक रिकॉर्ड की प्रतिनिधित्व-क्षमता के अनुमानों पर निर्भर हैं। इनमें से प्रत्येक अनुमान विफल हो सकता है। 2008 का वित्तीय संकट, 2020 की महामारी-जनित अस्थिरता, और 2022 का दर-चक्र विघटन, प्रत्येक ने पूर्ववर्ती शासनों पर कैलिब्रेट किए गए मॉडलों की सीमाएँ उजागर कीं।

हमारा पक्ष यह है कि यह मात्रात्मक मॉडलिंग के विरुद्ध तर्क नहीं है, बल्कि इसकी सीमाओं को स्पष्ट रूप से बताने के पक्ष में तर्क है। कार्यप्रणाली प्रलेखन उन अनुमानों को स्थापित करता है जिन पर प्रत्येक गणना निर्भर है; उपयोगकर्ता को आउटपुट को तदनुसार तौलने के लिए आमंत्रित किया जाता है। एक मॉडल जिसकी सीमाएँ दृश्यमान हैं, उस मॉडल से अधिक उपयोगी है जिसका आत्मविश्वास कृत्रिम रूप से उच्च है।

AI-उत्पन्न सामग्री के प्रश्न पर

Drusus Daily का पर्याप्त भाग भाषा मॉडल द्वारा उत्पन्न होता है। हमने विचार किया है कि क्या इसे पाठकों के सम्मुख कार्यप्रणाली प्रलेखन से अधिक प्रमुख रूप से प्रकट किया जाना चाहिए, और निष्कर्ष पर पहुँचे हैं कि संरचनात्मक उत्तर हाँ है: गद्य की मॉडल-उत्पन्न प्रकृति प्रत्येक संस्करण पर घोषित की जाती है। हम, हालाँकि, यह नहीं बताते कि कौन-से विशिष्ट वाक्य मॉडल-उत्पन्न हैं और कौन-से मानवीय रूप से संपादित, क्योंकि व्यवहार में रेखा धुंधली है (संपादकीय समीक्षा मॉडल आउटपुट में पर्याप्त रूप से संशोधन करती है) और क्योंकि बाइनरी प्रकटन सूचित करने से अधिक भ्रमित करेगा।

प्रासंगिक प्रश्न यह नहीं है कि गद्य मॉडल द्वारा उत्पन्न है या नहीं, बल्कि यह है कि उसमें निहित आँकड़े सही हैं या नहीं। सत्यापन परत इसका समाधान करती है। संपादकीय समीक्षा विश्लेषणात्मक निर्णय के लिए उत्तरदायी है।

हम जो शोध प्रकाशित करते हैं

हमारा दीर्घ-रूप अनुसंधान Drusus Insights में प्रकाशित होता है। वहाँ प्रकाशित रचनाएँ कार्यरत निवेशक और विश्लेषणात्मक पेशेवर के लिए स्थापित हैं, न कि शैक्षणिक साहित्य के लिए; हम सहकर्मी-समीक्षित अनुसंधान करने का दावा नहीं करते। जहाँ हमारी कार्यप्रणाली प्लेटफ़ॉर्म के उपयोगकर्ताओं द्वारा संचालित शैक्षणिक कार्य में योगदान देती है, उद्धरण मार्गदर्शन कार्यप्रणाली पृष्ठ पर स्थापित है।

Insights संग्रह देखें →