संदर्भ विंडो सुरक्षा चेकर

शिप करने से पहले शेष संदर्भ विंडो की जाँच करें

मॉडल में उपयोग की गई बनाम शेष संदर्भ विंडो टोकन देखने के लिए अपना प्रॉम्प्ट या दस्तावेज़ चंक पेस्ट करें। लागत अनुमान एक उन्नत पैनल के रूप में उपलब्ध रहता है।

एक नज़र में उपयोग की गई बनाम शेष संदर्भसमर्थन, सारांश और आरएजी के लिए परिदृश्य प्रीसेटलाइव मूल्य निर्धारण स्रोत और ताजगी स्थिति

प्राथमिक टेक्स्ट-टू-टोकन वर्कफ़्लो

संदर्भ उपयोग जोखिम को तुरंत जांचने के लिए पहले टेक्स्ट पेस्ट करें। लागत अनुमान एक माध्यमिक विस्तार योग्य पैनल में उपलब्ध हैं।

परिदृश्य प्रीसेट

एक क्लिक से शुरू करें और फिर उन्नत सेटिंग्स में ठीक करें।

टोकन
0
शब्द
0
वर्ण (बिना स्पेस के)
0
कुल वर्ण
0

संदर्भ विंडो शेष क्षमता

ओवरफ़्लो जोखिम से बचने के लिए पहले उपयोग की गई बनाम शेष टोकन पर ध्यान केंद्रित करें।

शेष संदर्भ विंडो क्षमता की जांच के लिए ऊपर टेक्स्ट पेस्ट करें।

तुलना करने के लिए मॉडल

संदर्भ सुरक्षा और लागत के लिए तुलना करने के लिए मॉडल चुनें

लागत अनुमान विवरण

मूल्य निर्धारण ब्रेकडाउन, निर्यात और प्रदाता लिंक के लिए विस्तार करें।

लागत ब्रेकडाउन

मॉडल द्वारा टोकन गणना और मूल्य निर्धारण की समीक्षा करें, फिर योजना, खरीद या ग्राहक कोटिंग के लिए परिदृश्य निर्यात करें।

टोकन गिनना और मॉडल लागत की तुलना करना शुरू करने के लिए ऊपर टेक्स्ट पेस्ट करें।
गोपनीयता नोट

यह स्थानीय ब्राउज़र टोकन काउंटर प्रॉम्प्ट टेक्स्ट को आपके डिवाइस पर रखता है। हम केवल वर्तमान सत्र में टोकन और मूल्य निर्धारण की गणना करते हैं।

मूल्य निर्धारण स्रोत

अंतर्निहित मूल्य निर्धारण फ़ॉलबैक का उपयोग करना क्योंकि लाइव कैटलॉग अभी अनुपलब्ध है।

आज अपडेट किया गया

फ़ॉलबैक मूल्य निर्धारण डेटा का उपयोग कर रहा है। संख्याएँ वर्तमान प्रदाता मूल्य निर्धारण से पीछे रह सकती हैं।

ओपनएआई उपलब्ध होने पर स्थानीय टिकटोकन-संगत गणना का उपयोग करता है। एंथ्रोपिक, जेमिनी और कस्टम मॉडल ब्राउज़र-साइड अनुमानों का उपयोग कर सकते हैं, इसलिए उत्पादन बजट के लिए प्रदाता डैशबोर्ड के साथ हमेशा अंतिम बिलिंग की पुष्टि करें।

Advanced cost settings

मुख्य संदर्भ विंडो वर्कफ़्लो को भीड़ किए बिना आउटपुट लंबाई, कैशिंग, ट्रैफ़िक और कस्टम मूल्य निर्धारण इनपुट को ट्यून करें।

कस्टम मॉडल मूल्य निर्धारण

एलएलएम प्रदाताओं में टोकन मूल्य निर्धारण का अनुमान कैसे लगाएं

क्रॉस-मॉडल टोकन कैलकुलेटर, प्रॉम्प्ट और कंप्लीशन टोकन कैलकुलेटर, और स्थानीय ब्राउज़र टोकन काउंटर के रूप में कैलकुलेटर का उपयोग करने के लिए इन चरणों का पालन करें।

  1. स्रोत टेक्स्ट पेस्ट करें या मैन्युअल टोकन गणना दर्ज करें

    जब आप प्रॉम्प्ट, स्कीमा, ट्रांसक्रिप्ट, या आरएजी चंक से स्थानीय ब्राउज़र टोकन गणना चाहते हैं तो टेक्स्ट मोड का उपयोग करें। जब आप पहले से ही किसी अन्य पाइपलाइन से टोकन गणना जानते हैं तो मैन्युअल मोड का उपयोग करें।

  2. प्रदाता और परिदृश्य धारणाएं चुनें

    ओपनएआई, क्लॉड, जेमिनी, या कस्टम मॉडल का चयन करें, फिर अपेक्षित आउटपुट टोकन, कैशेड इनपुट टोकन, अतिरिक्त पुनर्प्राप्ति टोकन, अनुरोध मात्रा और मासिक उपयोग भरें।

  3. बैच, कैशिंग और मार्जिन प्रभावों का मॉडल करें

    एसिंक्रोनस बल्क जॉब के लिए बैच छूट चालू करें, बार-बार सिस्टम निर्देशों के लिए कैशेड प्रॉम्प्ट टोकन जोड़ें, और यदि आपको बजट गार्डरेल की आवश्यकता है तो सुरक्षा मार्जिन या ग्राहक मार्कअप शामिल करें।

  4. परिणाम की तुलना करें और निर्यात करें

    प्रति-अनुरोध लागत, परिदृश्य कुल, मासिक लागत, सुरक्षित बजट और मार्कअप-समायोजित मूल्य की समीक्षा करें। खरीद समीक्षाओं, ग्राहक उद्धरणों, या मॉडल-चयन दस्तावेज़ों के लिए JSON या CSV निर्यात करें।

केस स्टडीज: जहां टोकन लागत अनुमान मायने रखता है

ये उदाहरण मूल्य निर्धारण तुलना, कैशिंग, बैचिंग और बहुभाषी एलएलएम उपयोग के आसपास उच्च-इरादे वाले खोज व्यवहार से मेल खाते हैं।

केस स्टडी 1: एजेंटिक वर्कफ़्लो लागत अनुमानक

Profile

एक स्टार्टअप जो प्लानर, रिट्रीवर और समीक्षक लूप के साथ मल्टी-स्टेप एजेंट चला रहा है।

Challenge

लॉन्च से पहले टीम को यह अनुमान लगाने की आवश्यकता थी कि बार-बार टूल कॉल और लंबे सिस्टम प्रॉम्प्ट यूनिट इकोनॉमिक्स को कैसे प्रभावित करेंगे।

Solution

उन्होंने उम्मीदवार मॉडल में प्रॉम्प्ट टोकन, कंप्लीशन टोकन, अतिरिक्त पुनर्प्राप्ति संदर्भ और बैच छूट का मॉडल बनाने के लिए कैलकुलेटर का उपयोग किया।

Implementation

प्रत्येक एजेंट चरण को टेक्स्ट मोड में पेस्ट किया गया था, फिर टीम ने मासिक अनुरोधों और सुरक्षा मार्जिन को तब तक समायोजित किया जब तक कि परिदृश्य उनके उत्पादन पूर्वानुमान से मेल नहीं खाता।

Results

उन्होंने वर्कफ़्लो के लिए सबसे सस्ता मॉडल मिश्रण पहचाना और शिपिंग से पहले अनुमानित मासिक लागत को एक तिहाई से अधिक कम कर दिया।

केस स्टडी 2: ओपनएआई बनाम क्लॉड एपीआई मूल्य निर्धारण कैलकुलेटर

Profile

चैट हैंडलिंग के लिए GPT-4o-mini की तुलना Claude 3.5 Sonnet से करने वाला एक सपोर्ट प्लेटफ़ॉर्म।

Challenge

उन्हें कस्टम स्क्रिप्ट लिखने के बिना एक ही बातचीत इतिहास पर प्रॉम्प्ट और कंप्लीशन टोकन मूल्य निर्धारण की तुलना करने के लिए एक तेज़ तरीके की आवश्यकता थी।

Solution

कैलकुलेटर ने स्थानीय रूप से एक प्रतिनिधि चैट ट्रांसक्रिप्ट को संसाधित किया और दोनों प्रदाताओं के लिए एक साथ मासिक अनुमान लौटाए।

Implementation

टीम ने कई 10-टर्न बातचीत पेस्ट कीं, अनुमानित अनुरोध मात्रा निर्धारित की, और एंटरप्राइज़ योजनाओं के लिए मार्कअप-समायोजित मूल्य की तुलना की।

Results

उन्होंने मानक समर्थन मामलों के लिए कम लागत वाला विकल्प चुना और केवल एस्केलेशन पथ के लिए प्रीमियम मॉडल आरक्षित किया।

केस स्टडी 3: बैच एपीआई लागत कैलकुलेटर

Profile

एक संचालन टीम रात भर में हजारों उत्पाद विवरणों को संसाधित कर रही है।

Challenge

उनका मार्जिन इस बात पर निर्भर करता था कि क्या एसिंक्रोनस बैच मूल्य निर्धारण ने बड़े सामग्री-रिफ़्रेश जॉब की लागत को महत्वपूर्ण रूप से बदल दिया।

Solution

उन्होंने बैच छूट सक्षम के साथ नौकरी का मॉडल बनाया और औसत से बड़े लंबे-पूंछ वाले विवरणों के लिए एक बफर शामिल किया।

Implementation

टीम ने एक प्रतिनिधि नमूना दर्ज किया, कुल अनुरोध गणना का अनुमान लगाया, और बजट अनुमोदन के लिए CSV निर्यात किया।

Results

उन्होंने स्पष्ट बचत अनुमान के साथ वर्कलोड को बैच कतार में स्थानांतरित कर दिया और एक अनुमानित रात भर प्रसंस्करण बजट प्राप्त किया।

केस स्टडी 4: एंथ्रोपिक संदर्भ कैशिंग लागत

Profile

बड़े पुन: प्रयोज्य सिस्टम प्रॉम्प्ट और नीति दस्तावेजों के साथ एक कानूनी-तकनीकी वर्कफ़्लो।

Challenge

टीम को यह समझने की आवश्यकता थी कि कैशेड प्रीफ़िक्स समान आधार निर्देशों पर बार-बार की गई क्वेरी की लागत को कितना कम करेंगे।

Solution

उन्होंने पुन: प्रयोज्य संदर्भ का मॉडल बनाने के लिए कैशेड इनपुट टोकन का उपयोग किया और अनकैश्ड ऑपरेशन के मुकाबले प्रभावी मासिक बचत की तुलना की।

Implementation

साझा कानूनी निर्देशों को कैशेड टोकन के रूप में दर्ज किया गया था, जबकि गतिशील मामले-विशिष्ट प्रॉम्प्ट और आउटपुट का अलग से अनुमान लगाया गया था।

Results

उन्होंने आंतरिक रूप से प्रॉम्प्ट कैशिंग को उचित ठहराया और उच्च-अनुपालन वर्कफ़्लो की स्पष्ट लागत को कम किया।

केस स्टडी 5: बहुभाषी एलएलएम टोकन लागत

Profile

एक वैश्विक सामग्री टीम अंग्रेजी, जापानी और चीनी में प्रॉम्प्ट और संरचित आउटपुट का स्थानीयकरण कर रही है।

Challenge

शब्द गणना समान दिखती थी, लेकिन टोकन उपयोग भाषा और आउटपुट प्रारूप के अनुसार तेजी से भिन्न होता था।

Solution

उन्होंने नए बाजारों में लॉन्च करने से पहले टोकन मुद्रास्फीति को मापने और प्रदाता मूल्य निर्धारण की तुलना करने के लिए टूल में स्थानीयकृत प्रॉम्प्ट पेस्ट किए।

Implementation

टीम ने भाषा के अनुसार परिदृश्यों को दोहराया, अपेक्षित आउटपुट आकार को समायोजित किया, और बाजार के अनुसार मूल्य अंतर का दस्तावेजीकरण किया।

Results

उन्होंने उच्च-टोकन भाषाओं में कम मूल्य निर्धारण को रोका और बेहतर आत्मविश्वास के साथ बाजार-विशिष्ट उपयोग नीतियों को निर्धारित किया।

टोकन लागत अनुमानक अक्सर पूछे जाने वाले प्रश्न

क्रॉस-मॉडल टोकन कैलकुलेटर क्या है?

यह एक ऐसा उपकरण है जो आपको एक ही इनपुट से कई एलएलएम प्रदाताओं में टोकन उपयोग और एपीआई लागत का अनुमान लगाने की अनुमति देता है ताकि आप निर्माण से पहले मूल्य निर्धारण की तुलना कर सकें।

यह एलएलएम टोकन लागत अनुमानक कितना सटीक है?

ओपनएआई-संगत मॉडल उपलब्ध होने पर स्थानीय टोकनाइज़र समर्थन का उपयोग करते हैं। अन्य प्रदाता ब्राउज़र-साइड अनुमानों पर भरोसा कर सकते हैं, इसलिए योजना के लिए अनुमान मजबूत है लेकिन प्रदाता बिलिंग डैशबोर्ड सत्य का अंतिम स्रोत बने हुए हैं।

प्रॉम्प्ट और कंप्लीशन टोकन को अलग क्यों करें?

अधिकांश प्रदाता इनपुट और आउटपुट टोकन के लिए अलग-अलग शुल्क लेते हैं, और आउटपुट अक्सर बहुत अधिक महंगा होता है। उन्हें विभाजित करने से अनुमान वास्तविक बजट के लिए उपयोगी हो जाता है।

क्या मैं यहां एंथ्रोपिक संदर्भ कैशिंग लागत का अनुमान लगा सकता हूं?

हाँ। अपने प्रॉम्प्ट के उस हिस्से को जोड़ें जो कैशेड इनपुट टोकन के रूप में पुन: उपयोग किया जाता है, फिर पुन: प्रयोज्य प्रीफ़िक्स बजट को कैसे बदलते हैं, यह देखने के लिए अनकैश्ड रन के मुकाबले परिदृश्य की तुलना करें।

क्या यह बैच एपीआई लागत कैलकुलेटर के रूप में काम करता है?

हाँ। एसिंक्रोनस बल्क प्रोसेसिंग वर्कफ़्लो से अपेक्षित कम कुल का अनुमान लगाने के लिए बैच छूट टॉगल सक्षम करें।

क्या इस स्थानीय ब्राउज़र टोकन काउंटर का उपयोग करते समय मेरा डेटा संग्रहीत किया जाता है?

नहीं। कैलकुलेटर को ब्राउज़र सत्र में स्थानीय निष्पादन के लिए डिज़ाइन किया गया है, इसलिए पेस्ट किए गए प्रॉम्प्ट और दस्तावेज़ अनुमान के दौरान आपके डिवाइस पर रहते हैं।

क्या मैं इसे आरएजी चंक टोकन अनुमानक के रूप में उपयोग कर सकता हूं?

हाँ। एक प्रतिनिधि दस्तावेज़ चंक पेस्ट करें, फिर पुनर्प्राप्ति ओवरहेड के लिए अतिरिक्त इनपुट टोकन जोड़ें और टॉप-के पुनर्प्राप्ति पैटर्न की लागत का मॉडल बनाने के लिए अनुरोधों को गुणा करें।

मैं ओपनएआई संरचित आउटपुट टोकन मूल्य निर्धारण का अनुमान कैसे लगाऊं?

टेक्स्ट मोड में प्रॉम्प्ट और किसी भी स्कीमा या संरचित-आउटपुट निर्देशों को पेस्ट करें, फिर अपेक्षित कंप्लीशन टोकन सेट करें ताकि आप देख सकें कि फ़ॉर्मेटिंग ओवरहेड कुल लागत को कैसे बदलता है।

बहुभाषी एलएलएम टोकन लागत भाषा के अनुसार क्यों भिन्न होती है?

विभिन्न टोकनाइज़र गैर-अंग्रेजी टेक्स्ट को अलग तरह से विभाजित करते हैं, इसलिए समान शब्द गणना बहुत अलग टोकन कुल उत्पन्न कर सकती है। प्रत्येक लक्षित भाषा का परीक्षण वैश्विक उपयोग की कीमत तय करने का सबसे सुरक्षित तरीका है।

क्या मैं कस्टम या स्व-होस्टेड मॉडल की तुलना कर सकता हूं?

हाँ। इनपुट, आउटपुट और कैशेड इनपुट के लिए अपने स्वयं के मॉडल नाम और प्रति-मिलियन टोकन दरें दर्ज करने के लिए कस्टम मूल्य निर्धारण अनुभाग का उपयोग करें।