शिप करने से पहले शेष संदर्भ विंडो की जाँच करें
मॉडल में उपयोग की गई बनाम शेष संदर्भ विंडो टोकन देखने के लिए अपना प्रॉम्प्ट या दस्तावेज़ चंक पेस्ट करें। लागत अनुमान एक उन्नत पैनल के रूप में उपलब्ध रहता है।
प्राथमिक टेक्स्ट-टू-टोकन वर्कफ़्लो
संदर्भ उपयोग जोखिम को तुरंत जांचने के लिए पहले टेक्स्ट पेस्ट करें। लागत अनुमान एक माध्यमिक विस्तार योग्य पैनल में उपलब्ध हैं।
परिदृश्य प्रीसेट
एक क्लिक से शुरू करें और फिर उन्नत सेटिंग्स में ठीक करें।
संदर्भ विंडो शेष क्षमता
ओवरफ़्लो जोखिम से बचने के लिए पहले उपयोग की गई बनाम शेष टोकन पर ध्यान केंद्रित करें।
तुलना करने के लिए मॉडल
संदर्भ सुरक्षा और लागत के लिए तुलना करने के लिए मॉडल चुनें
लागत अनुमान विवरण
मूल्य निर्धारण ब्रेकडाउन, निर्यात और प्रदाता लिंक के लिए विस्तार करें।
लागत ब्रेकडाउन
मॉडल द्वारा टोकन गणना और मूल्य निर्धारण की समीक्षा करें, फिर योजना, खरीद या ग्राहक कोटिंग के लिए परिदृश्य निर्यात करें।
यह स्थानीय ब्राउज़र टोकन काउंटर प्रॉम्प्ट टेक्स्ट को आपके डिवाइस पर रखता है। हम केवल वर्तमान सत्र में टोकन और मूल्य निर्धारण की गणना करते हैं।
अंतर्निहित मूल्य निर्धारण फ़ॉलबैक का उपयोग करना क्योंकि लाइव कैटलॉग अभी अनुपलब्ध है।
आज अपडेट किया गया
फ़ॉलबैक मूल्य निर्धारण डेटा का उपयोग कर रहा है। संख्याएँ वर्तमान प्रदाता मूल्य निर्धारण से पीछे रह सकती हैं।
ओपनएआई उपलब्ध होने पर स्थानीय टिकटोकन-संगत गणना का उपयोग करता है। एंथ्रोपिक, जेमिनी और कस्टम मॉडल ब्राउज़र-साइड अनुमानों का उपयोग कर सकते हैं, इसलिए उत्पादन बजट के लिए प्रदाता डैशबोर्ड के साथ हमेशा अंतिम बिलिंग की पुष्टि करें।
Advanced cost settings
मुख्य संदर्भ विंडो वर्कफ़्लो को भीड़ किए बिना आउटपुट लंबाई, कैशिंग, ट्रैफ़िक और कस्टम मूल्य निर्धारण इनपुट को ट्यून करें।
कस्टम मॉडल मूल्य निर्धारण
एलएलएम प्रदाताओं में टोकन मूल्य निर्धारण का अनुमान कैसे लगाएं
क्रॉस-मॉडल टोकन कैलकुलेटर, प्रॉम्प्ट और कंप्लीशन टोकन कैलकुलेटर, और स्थानीय ब्राउज़र टोकन काउंटर के रूप में कैलकुलेटर का उपयोग करने के लिए इन चरणों का पालन करें।
- स्रोत टेक्स्ट पेस्ट करें या मैन्युअल टोकन गणना दर्ज करें
जब आप प्रॉम्प्ट, स्कीमा, ट्रांसक्रिप्ट, या आरएजी चंक से स्थानीय ब्राउज़र टोकन गणना चाहते हैं तो टेक्स्ट मोड का उपयोग करें। जब आप पहले से ही किसी अन्य पाइपलाइन से टोकन गणना जानते हैं तो मैन्युअल मोड का उपयोग करें।
- प्रदाता और परिदृश्य धारणाएं चुनें
ओपनएआई, क्लॉड, जेमिनी, या कस्टम मॉडल का चयन करें, फिर अपेक्षित आउटपुट टोकन, कैशेड इनपुट टोकन, अतिरिक्त पुनर्प्राप्ति टोकन, अनुरोध मात्रा और मासिक उपयोग भरें।
- बैच, कैशिंग और मार्जिन प्रभावों का मॉडल करें
एसिंक्रोनस बल्क जॉब के लिए बैच छूट चालू करें, बार-बार सिस्टम निर्देशों के लिए कैशेड प्रॉम्प्ट टोकन जोड़ें, और यदि आपको बजट गार्डरेल की आवश्यकता है तो सुरक्षा मार्जिन या ग्राहक मार्कअप शामिल करें।
- परिणाम की तुलना करें और निर्यात करें
प्रति-अनुरोध लागत, परिदृश्य कुल, मासिक लागत, सुरक्षित बजट और मार्कअप-समायोजित मूल्य की समीक्षा करें। खरीद समीक्षाओं, ग्राहक उद्धरणों, या मॉडल-चयन दस्तावेज़ों के लिए JSON या CSV निर्यात करें।
केस स्टडीज: जहां टोकन लागत अनुमान मायने रखता है
ये उदाहरण मूल्य निर्धारण तुलना, कैशिंग, बैचिंग और बहुभाषी एलएलएम उपयोग के आसपास उच्च-इरादे वाले खोज व्यवहार से मेल खाते हैं।
केस स्टडी 1: एजेंटिक वर्कफ़्लो लागत अनुमानक
Profile
एक स्टार्टअप जो प्लानर, रिट्रीवर और समीक्षक लूप के साथ मल्टी-स्टेप एजेंट चला रहा है।
Challenge
लॉन्च से पहले टीम को यह अनुमान लगाने की आवश्यकता थी कि बार-बार टूल कॉल और लंबे सिस्टम प्रॉम्प्ट यूनिट इकोनॉमिक्स को कैसे प्रभावित करेंगे।
Solution
उन्होंने उम्मीदवार मॉडल में प्रॉम्प्ट टोकन, कंप्लीशन टोकन, अतिरिक्त पुनर्प्राप्ति संदर्भ और बैच छूट का मॉडल बनाने के लिए कैलकुलेटर का उपयोग किया।
Implementation
प्रत्येक एजेंट चरण को टेक्स्ट मोड में पेस्ट किया गया था, फिर टीम ने मासिक अनुरोधों और सुरक्षा मार्जिन को तब तक समायोजित किया जब तक कि परिदृश्य उनके उत्पादन पूर्वानुमान से मेल नहीं खाता।
Results
उन्होंने वर्कफ़्लो के लिए सबसे सस्ता मॉडल मिश्रण पहचाना और शिपिंग से पहले अनुमानित मासिक लागत को एक तिहाई से अधिक कम कर दिया।
केस स्टडी 2: ओपनएआई बनाम क्लॉड एपीआई मूल्य निर्धारण कैलकुलेटर
Profile
चैट हैंडलिंग के लिए GPT-4o-mini की तुलना Claude 3.5 Sonnet से करने वाला एक सपोर्ट प्लेटफ़ॉर्म।
Challenge
उन्हें कस्टम स्क्रिप्ट लिखने के बिना एक ही बातचीत इतिहास पर प्रॉम्प्ट और कंप्लीशन टोकन मूल्य निर्धारण की तुलना करने के लिए एक तेज़ तरीके की आवश्यकता थी।
Solution
कैलकुलेटर ने स्थानीय रूप से एक प्रतिनिधि चैट ट्रांसक्रिप्ट को संसाधित किया और दोनों प्रदाताओं के लिए एक साथ मासिक अनुमान लौटाए।
Implementation
टीम ने कई 10-टर्न बातचीत पेस्ट कीं, अनुमानित अनुरोध मात्रा निर्धारित की, और एंटरप्राइज़ योजनाओं के लिए मार्कअप-समायोजित मूल्य की तुलना की।
Results
उन्होंने मानक समर्थन मामलों के लिए कम लागत वाला विकल्प चुना और केवल एस्केलेशन पथ के लिए प्रीमियम मॉडल आरक्षित किया।
केस स्टडी 3: बैच एपीआई लागत कैलकुलेटर
Profile
एक संचालन टीम रात भर में हजारों उत्पाद विवरणों को संसाधित कर रही है।
Challenge
उनका मार्जिन इस बात पर निर्भर करता था कि क्या एसिंक्रोनस बैच मूल्य निर्धारण ने बड़े सामग्री-रिफ़्रेश जॉब की लागत को महत्वपूर्ण रूप से बदल दिया।
Solution
उन्होंने बैच छूट सक्षम के साथ नौकरी का मॉडल बनाया और औसत से बड़े लंबे-पूंछ वाले विवरणों के लिए एक बफर शामिल किया।
Implementation
टीम ने एक प्रतिनिधि नमूना दर्ज किया, कुल अनुरोध गणना का अनुमान लगाया, और बजट अनुमोदन के लिए CSV निर्यात किया।
Results
उन्होंने स्पष्ट बचत अनुमान के साथ वर्कलोड को बैच कतार में स्थानांतरित कर दिया और एक अनुमानित रात भर प्रसंस्करण बजट प्राप्त किया।
केस स्टडी 4: एंथ्रोपिक संदर्भ कैशिंग लागत
Profile
बड़े पुन: प्रयोज्य सिस्टम प्रॉम्प्ट और नीति दस्तावेजों के साथ एक कानूनी-तकनीकी वर्कफ़्लो।
Challenge
टीम को यह समझने की आवश्यकता थी कि कैशेड प्रीफ़िक्स समान आधार निर्देशों पर बार-बार की गई क्वेरी की लागत को कितना कम करेंगे।
Solution
उन्होंने पुन: प्रयोज्य संदर्भ का मॉडल बनाने के लिए कैशेड इनपुट टोकन का उपयोग किया और अनकैश्ड ऑपरेशन के मुकाबले प्रभावी मासिक बचत की तुलना की।
Implementation
साझा कानूनी निर्देशों को कैशेड टोकन के रूप में दर्ज किया गया था, जबकि गतिशील मामले-विशिष्ट प्रॉम्प्ट और आउटपुट का अलग से अनुमान लगाया गया था।
Results
उन्होंने आंतरिक रूप से प्रॉम्प्ट कैशिंग को उचित ठहराया और उच्च-अनुपालन वर्कफ़्लो की स्पष्ट लागत को कम किया।
केस स्टडी 5: बहुभाषी एलएलएम टोकन लागत
Profile
एक वैश्विक सामग्री टीम अंग्रेजी, जापानी और चीनी में प्रॉम्प्ट और संरचित आउटपुट का स्थानीयकरण कर रही है।
Challenge
शब्द गणना समान दिखती थी, लेकिन टोकन उपयोग भाषा और आउटपुट प्रारूप के अनुसार तेजी से भिन्न होता था।
Solution
उन्होंने नए बाजारों में लॉन्च करने से पहले टोकन मुद्रास्फीति को मापने और प्रदाता मूल्य निर्धारण की तुलना करने के लिए टूल में स्थानीयकृत प्रॉम्प्ट पेस्ट किए।
Implementation
टीम ने भाषा के अनुसार परिदृश्यों को दोहराया, अपेक्षित आउटपुट आकार को समायोजित किया, और बाजार के अनुसार मूल्य अंतर का दस्तावेजीकरण किया।
Results
उन्होंने उच्च-टोकन भाषाओं में कम मूल्य निर्धारण को रोका और बेहतर आत्मविश्वास के साथ बाजार-विशिष्ट उपयोग नीतियों को निर्धारित किया।
टोकन लागत अनुमानक अक्सर पूछे जाने वाले प्रश्न
क्रॉस-मॉडल टोकन कैलकुलेटर क्या है?
यह एक ऐसा उपकरण है जो आपको एक ही इनपुट से कई एलएलएम प्रदाताओं में टोकन उपयोग और एपीआई लागत का अनुमान लगाने की अनुमति देता है ताकि आप निर्माण से पहले मूल्य निर्धारण की तुलना कर सकें।
यह एलएलएम टोकन लागत अनुमानक कितना सटीक है?
ओपनएआई-संगत मॉडल उपलब्ध होने पर स्थानीय टोकनाइज़र समर्थन का उपयोग करते हैं। अन्य प्रदाता ब्राउज़र-साइड अनुमानों पर भरोसा कर सकते हैं, इसलिए योजना के लिए अनुमान मजबूत है लेकिन प्रदाता बिलिंग डैशबोर्ड सत्य का अंतिम स्रोत बने हुए हैं।
प्रॉम्प्ट और कंप्लीशन टोकन को अलग क्यों करें?
अधिकांश प्रदाता इनपुट और आउटपुट टोकन के लिए अलग-अलग शुल्क लेते हैं, और आउटपुट अक्सर बहुत अधिक महंगा होता है। उन्हें विभाजित करने से अनुमान वास्तविक बजट के लिए उपयोगी हो जाता है।
क्या मैं यहां एंथ्रोपिक संदर्भ कैशिंग लागत का अनुमान लगा सकता हूं?
हाँ। अपने प्रॉम्प्ट के उस हिस्से को जोड़ें जो कैशेड इनपुट टोकन के रूप में पुन: उपयोग किया जाता है, फिर पुन: प्रयोज्य प्रीफ़िक्स बजट को कैसे बदलते हैं, यह देखने के लिए अनकैश्ड रन के मुकाबले परिदृश्य की तुलना करें।
क्या यह बैच एपीआई लागत कैलकुलेटर के रूप में काम करता है?
हाँ। एसिंक्रोनस बल्क प्रोसेसिंग वर्कफ़्लो से अपेक्षित कम कुल का अनुमान लगाने के लिए बैच छूट टॉगल सक्षम करें।
क्या इस स्थानीय ब्राउज़र टोकन काउंटर का उपयोग करते समय मेरा डेटा संग्रहीत किया जाता है?
नहीं। कैलकुलेटर को ब्राउज़र सत्र में स्थानीय निष्पादन के लिए डिज़ाइन किया गया है, इसलिए पेस्ट किए गए प्रॉम्प्ट और दस्तावेज़ अनुमान के दौरान आपके डिवाइस पर रहते हैं।
क्या मैं इसे आरएजी चंक टोकन अनुमानक के रूप में उपयोग कर सकता हूं?
हाँ। एक प्रतिनिधि दस्तावेज़ चंक पेस्ट करें, फिर पुनर्प्राप्ति ओवरहेड के लिए अतिरिक्त इनपुट टोकन जोड़ें और टॉप-के पुनर्प्राप्ति पैटर्न की लागत का मॉडल बनाने के लिए अनुरोधों को गुणा करें।
मैं ओपनएआई संरचित आउटपुट टोकन मूल्य निर्धारण का अनुमान कैसे लगाऊं?
टेक्स्ट मोड में प्रॉम्प्ट और किसी भी स्कीमा या संरचित-आउटपुट निर्देशों को पेस्ट करें, फिर अपेक्षित कंप्लीशन टोकन सेट करें ताकि आप देख सकें कि फ़ॉर्मेटिंग ओवरहेड कुल लागत को कैसे बदलता है।
बहुभाषी एलएलएम टोकन लागत भाषा के अनुसार क्यों भिन्न होती है?
विभिन्न टोकनाइज़र गैर-अंग्रेजी टेक्स्ट को अलग तरह से विभाजित करते हैं, इसलिए समान शब्द गणना बहुत अलग टोकन कुल उत्पन्न कर सकती है। प्रत्येक लक्षित भाषा का परीक्षण वैश्विक उपयोग की कीमत तय करने का सबसे सुरक्षित तरीका है।
क्या मैं कस्टम या स्व-होस्टेड मॉडल की तुलना कर सकता हूं?
हाँ। इनपुट, आउटपुट और कैशेड इनपुट के लिए अपने स्वयं के मॉडल नाम और प्रति-मिलियन टोकन दरें दर्ज करने के लिए कस्टम मूल्य निर्धारण अनुभाग का उपयोग करें।