परिचय
आर्टिफिशियल इंटेलिजेंस (AI) के क्षेत्र में यह आम धारणा रही है कि अत्याधुनिक बड़े भाषा मॉडल (LLM) विकसित करने के लिए भारी तकनीकी और वित्तीय संसाधनों की आवश्यकता होती है। यही कारण था कि अमेरिकी सरकार ने राष्ट्रपति डोनाल्ड ट्रंप द्वारा घोषित $500 बिलियन के Stargate प्रोजेक्ट को समर्थन देने का वादा किया। लेकिन चीनी AI कंपनी DeepSeek ने इस धारणा को पूरी तरह से बदल दिया है।
DeepSeek क्या है?
DeepSeek, चीन के हांगझोऊ में स्थित एक AI विकास कंपनी है, जिसकी स्थापना मई 2023 में लियांग वेनफेंग ने की थी। वेनफेंग, चीन की High-Flyer नामक क्वांटिटेटिव हेज फंड कंपनी के सह-संस्थापक भी हैं, जो DeepSeek का मालिक है। हालांकि, DeepSeek एक स्वतंत्र AI अनुसंधान प्रयोगशाला के रूप में संचालित होती है।
जनवरी 2025 में, DeepSeek ने DeepSeek-R1 नामक एक उन्नत तर्कसंगत AI मॉडल लॉन्च किया, जिसकी लागत अन्य AI कंपनियों की तुलना में बहुत कम थी। यह मॉडल ओपन-सोर्स नीति के तहत जारी किया गया, जिससे यह मुफ्त में उपलब्ध हो गया।
OpenAI बनाम DeepSeek
OpenAI और DeepSeek दोनों जनरेटिव AI विकसित कर रहे हैं, लेकिन उनकी रणनीतियाँ काफी भिन्न हैं:
विशेषता | OpenAI | DeepSeek |
---|---|---|
स्थापना वर्ष | 2015 | 2023 |
मुख्यालय | सैन फ्रांसिस्को, USA | हांगझोऊ, चीन |
विकास का लक्ष्य | व्यापक AI क्षमताएँ | कुशल और ओपन-सोर्स मॉडल |
मुख्य मॉडल | GPT-4o, o1 | DeepSeek-V3, DeepSeek-R1 |
विशेष मॉडल | DALL-E (इमेज जेनरेशन), Whisper (स्पीच रिकॉग्निशन) | DeepSeek Coder (कोडिंग), Janus Pro (विज़न मॉडल) |
API कीमत (प्रति मिलियन टोकन) | $15 (इनपुट), $60 (आउटपुट) | $0.55 (इनपुट), $2.19 (आउटपुट) |
ओपन-सोर्स नीति | सीमित | लगभग पूर्ण रूप से ओपन-सोर्स |
ट्रेनिंग लागत | सैकड़ों मिलियन डॉलर | $6 मिलियन से कम |
DeepSeek की इनोवेशन और ट्रेनिंग प्रक्रिया
DeepSeek ने अपने मॉडल को कम संसाधनों और लागत के साथ प्रशिक्षित किया है। इसकी कुछ मुख्य विशेषताएँ निम्नलिखित हैं:
- रिइंफोर्समेंट लर्निंग: DeepSeek ने बड़े पैमाने पर रिइंफोर्समेंट लर्निंग अपनाई, जिससे मॉडल की तार्किक क्षमताएँ बढ़ीं।
- रिवार्ड इंजीनियरिंग: एक विशेष रूल-बेस्ड रिवार्ड सिस्टम विकसित किया गया, जो पारंपरिक न्यूरल रिवार्ड मॉडलों से बेहतर प्रदर्शन करता है।
- डिस्टिलेशन तकनीक: कुशल नॉलेज ट्रांसफर तकनीकों के माध्यम से 1.5 बिलियन पैरामीटर तक के छोटे मॉडल विकसित किए गए।
- एमरजेंट बिहेवियर नेटवर्क: AI को स्वाभाविक रूप से जटिल तर्कसंगत पैटर्न विकसित करने की क्षमता प्रदान की गई।
DeepSeek के बड़े भाषा मॉडल (LLMs)
DeepSeek ने 2023 से अब तक कई जनरेटिव AI मॉडल जारी किए हैं:
- DeepSeek Coder (नवंबर 2023): विशेष रूप से कोडिंग के लिए डिज़ाइन किया गया पहला ओपन-सोर्स मॉडल।
- DeepSeek LLM (दिसंबर 2023): पहला सामान्य उद्देश्य AI मॉडल।
- DeepSeek-V2 (मई 2024): अधिक दक्षता और कम ट्रेनिंग लागत के साथ बेहतर मॉडल।
- DeepSeek-Coder-V2 (जुलाई 2024): 236 बिलियन पैरामीटर वाला मॉडल, जो 128,000 टोकन के संदर्भ खिड़की को संभाल सकता है।
- DeepSeek-V3 (दिसंबर 2024): 671 बिलियन पैरामीटर वाला मिश्रण-विशेषज्ञता (Mixture-of-Experts) आर्किटेक्चर पर आधारित मॉडल।
- DeepSeek-R1 (जनवरी 2025): DeepSeek-V3 पर आधारित उन्नत तर्कसंगत AI मॉडल।
- Janus-Pro-7B (जनवरी 2025): इमेज अंडरस्टैंडिंग और जेनरेशन के लिए विकसित एक AI विज़न मॉडल।
अमेरिकी टेक इंडस्ट्री में हड़कंप
DeepSeek-R1 की लॉन्चिंग के बाद, अमेरिकी टेक कंपनियों के निवेशकों में चिंता बढ़ गई। 27 जनवरी 2025 को, Nasdaq Composite 3.4% गिर गया, Nvidia का स्टॉक 17% गिरा, और $600 बिलियन का नुकसान हुआ। Microsoft, Meta, Oracle और Broadcom जैसी कंपनियों के मूल्यांकन पर भी प्रतिकूल प्रभाव पड़ा।
अमेरिका को चिंता क्यों है?
DeepSeek ने AI उद्योग में कई चुनौतियाँ प्रस्तुत की हैं:
- कम लागत: DeepSeek का R1 मॉडल सिर्फ $6 मिलियन में विकसित हुआ, जबकि अमेरिकी कंपनियाँ AI विकास में अरबों डॉलर खर्च कर रही हैं।
- तकनीकी सफलता: अमेरिकी चिप प्रतिबंधों के बावजूद, चीन ने अत्याधुनिक AI तकनीक विकसित कर ली।
- बिजनेस मॉडल खतरा: OpenAI की तुलना में DeepSeek का ओपन-सोर्स दृष्टिकोण, फ्री एक्सेस देकर अमेरिकी कंपनियों के राजस्व मॉडल को चुनौती देता है।
- भू-राजनीतिक प्रभाव: चीन की तकनीकी सफलता अमेरिकी AI वर्चस्व को खतरे में डाल रही है।
DeepSeek पर बैन
DeepSeek पर डेटा सुरक्षा और नैतिकता से जुड़े विवाद भी हुए हैं। कई देशों और संगठनों ने DeepSeek पर प्रतिबंध लगाया है, जिनमें शामिल हैं:
- ऑस्ट्रेलियाई सरकारी एजेंसियाँ
- भारत की केंद्र सरकार
- इटली
- नासा
- दक्षिण कोरिया का उद्योग मंत्रालय
- ताइवान सरकार
- टेक्सास राज्य सरकार
- अमेरिकी कांग्रेस और पेंटागन
साइबर अटैक और डेटा लीक
27 जनवरी 2025 को, DeepSeek पर बड़े पैमाने पर साइबर अटैक हुआ, जिसके चलते कंपनी को अस्थायी रूप से नए यूजर्स के रजिस्ट्रेशन पर रोक लगानी पड़ी। 29 जनवरी को Wiz Research ने खुलासा किया कि DeepSeek का एक डेटाबेस सार्वजनिक रूप से एक्सपोज़ हो गया था, जिससे संवेदनशील डेटा लीक हुआ।
निष्कर्ष:-
DeepSeek ने AI उद्योग को हिला कर रख दिया है। यह OpenAI के वर्चस्व को चुनौती देने के साथ-साथ अमेरिकी तकनीकी कंपनियों के लिए एक नई प्रतिस्पर्धा भी पेश कर रहा है। कम लागत, ओपन-सोर्स नीति और नवीन प्रशिक्षण पद्धतियों के कारण DeepSeek का प्रभाव आने वाले वर्षों में और भी गहरा हो सकता है।
ReadMoreArticles