Apr 14, 20269 min read

SaaS के लिए customer-support AI agent कैसे बनाएं

आर्किटेक्चर, guardrails, eval loop, और deflection गणित जो इसे उचित ठहराता है। वह playbook जिसका उपयोग हम B2B SaaS क्लाइंट्स के लिए करते हैं।

agents
saas
rag

ग्राहक सहायता एजेंट SMB के लिए AI में प्रवेश का द्वार क्यों हैं

ग्राहक-सहायता की मात्रा राजस्व के साथ सीधे बढ़ती है, लेकिन उत्तर नहीं। 70% tier-1 tickets वही दोहराए गए प्रश्न हैं जिनके उत्तर आपके docs में पहले से हैं — लेकिन कोई उपयोगकर्ता docs नहीं पढ़ता। एक AI agent जो उनके लिए docs पढ़ता है वह उस 70% को deflect कर देता है, और शेष आधे (जिन्हें वास्तव में मनुष्यों को संभालना चाहिए) को बेहतर तरीके से route किया जाता है।

हम जो architecture प्रदान करते हैं

एक production support agent के छह मुख्य भाग होते हैं। अधिकांश "AI chatbot" प्रयास तीन को छोड़ देते हैं और फिर सोचते हैं कि चीज़ hallucinate क्यों करती है।

Intent classifier — ticket को resolvable / needs-human / docs-gap / feature-request में route करता है।
Retrieval — आपके docs पर hybrid search (BM25 + vector), reranking के साथ। Citations आवश्यक।
Answer generation — Claude या GPT, prompted ताकि retrieval confidence कम होने पर मना कर दे।
Escalation path — एक confidence threshold और एक human queue। Non-negotiable।
Eval loop — 200 historical tickets साप्ताहिक replay। Drift support bots को चुपचाप मार देती है।
Cost telemetry — हर conversation token cost, deflection outcome, CSAT के साथ logged।

Eval loop छोड़ दें और आप एक शानदार demo ship करेंगे जो 90 दिनों में चुपचाप खराब हो जाएगा।

कठिन हिस्से

Model कठिन हिस्सा नहीं है। कठिन हिस्से ये हैं:

यह जानना कि कब उत्तर नहीं देना है। एक अच्छा support agent "मुझे निश्चितता नहीं है — मुझे इसे किसी मनुष्य को route करने दें" अधिक बार कहता है बजाय उत्तर देने के।
Multi-turn state। "मैंने वह try किया, काम नहीं किया" को याद रखना होगा कि 'वह' क्या था।
Tool use। Agent को अक्सर उपयोगकर्ता के account, recent activity, या feature flags को देखना होता है इससे पहले कि वह उत्तर दे सके। इसका मतलब है आपके systems तक scoped read access।

इसे बनाने में कितना खर्च आता है

कुछ सौ tickets/week और मध्यम docs base वाले B2B SaaS के लिए, एक Fixed-fee Sprint 5–8 सप्ताह चलता है और इसमें eval loop और पहले तीन महीनों की tuning शामिल है। उसके बाद, अधिकांश clients उत्पाद में बदलाव के साथ ongoing eval coverage के लिए Monthly Retainer पर चले जाते हैं।

यदि आपके docs बिखरे हुए हैं, तो docs cleanup pass के लिए 2 सप्ताह और जोड़ें — इसके बिना, agent उतना ही अच्छा है जितना वह retrieve कर सकता है।

Deflection math से शुरू करें

बनाने से पहले, गणित करें। Tickets per week × avg handle time × loaded support cost = tier-1 की वह dollar राशि जो आप चुका रहे हैं। एक काम करता support agent उसका 30–60% deflect कर देता है। यदि deflection dollars, build + ongoing ops cost को 9 महीनों से कम में हरा देते हैं, तो इसे बनाएं। यदि नहीं, तो docs cleanup शायद बेहतर परियोजना होगी।