जो भी जीतेगा उसे दुनिया भर के हर संघर्ष में फायदा होगा।
ग्राहम एलिसन ने हमें कृत्रिम बुद्धिमत्ता के लिए सचेत किया जो आज की महाशक्ति हथियारों की दौड़ का केंद्र है।
काई-फू ली की मूल थीसिस पर बहुत अधिक आकर्षित करते हुए, एलीसन ने युद्धक्षेत्रों को खींचा: संयुक्त राज्य अमेरिका बनाम चीन, मानव प्रतिभा के डोमेन, बड़े डेटा और सरकार की प्रतिबद्धता के बीच।
एलेन रणनीतिक स्थिरता के लिए एआई का क्या अर्थ है, इस पर नियंत्रण की अनुपस्थिति, या यहां तक कि संवाद की ओर इशारा करता है। निहित इस्तीफे के साथ, उनके लेख में सरकारी जांच या नियंत्रण से परे निजी क्षेत्र में होने वाली कई एआई प्रगति को ध्यान में रखते हुए, पेंडोरा के बॉक्स को नष्ट करने की बात स्वीकार की गई है।
हालांकि, परमाणु हथियारों के द्रुतशीतन और विनाशकारी वादे के विपरीत, लोकप्रिय कल्पना में एआई द्वारा उत्पन्न खतरा अनाकार है, आर्थिक अव्यवस्था या रोबोट सर्वनाश के विज्ञान-फाई चित्रण तक सीमित है।
एलीसन की कॉल एक्शन से अनुपस्थिति "इतना क्या?" समझा रही है - भविष्य में एआई के प्रभुत्व पर टिका क्यों है? आखिरकार, कुछ उदाहरण (बड़े पैमाने पर निगरानी, पायलट HUD, स्वायत्त हथियार) एलिसन यथास्थिति परिवर्तन के संदर्भ में निरंतर वृद्धि प्रदान करते हैं, परिवर्तन नहीं प्रतिमान।
एलिसन नोट के रूप में, राष्ट्रपति शी जिनपिंग ने एआई की शक्ति के लिए जागने के बाद अल्फ़ागो ने दुनिया के नंबर एक गो मानव खिलाड़ी, ली सेडोल को हराया। लेकिन क्यों? शी ने इस संगणना में क्या देखा जिसने उन्हें एआई को चीनी राष्ट्रीय प्रयास का केंद्र बिंदु बनाने के लिए राजी कर लिया?
जवाब: AI की अलौकिक क्षमता सोचने की।
समझाने के लिए, आइए हम जो बात नहीं कर रहे हैं उससे शुरू करें। मेरा तात्पर्य तथाकथित "सामान्य एआई" से नहीं है - स्व-निर्देशित लक्ष्यों के साथ व्यापक स्पेक्ट्रम खुफिया, जो स्वतंत्र रूप से या मानव रचनाकारों की प्राथमिकताओं के बावजूद काम करता है।
एलोन मस्क और सैम हैरिस जैसे प्रख्यात व्यक्ति सामान्य एआई के आने की चेतावनी देते हैं। विशेष रूप से, तथाकथित "विलक्षणता", जिसमें AI अपने स्वयं के कोड को फिर से लिखने की क्षमता विकसित करता है। मस्क और हैरिस के अनुसार, यह एआई की क्षमता में एक घातीय विस्फोट को बढ़ावा देगा, जो 10,000 आईक्यू और वास्तविक समय से परे केवल कुछ घंटों में साकार करेगा। ऐसे समय में, वे तर्क देते हैं, एआई हमारे लिए समान वस्तुओं के समान स्तर के साथ चींटियों के समान है।
मैं सैम और एलोन के साथ सहमत हूं कि कृत्रिम सामान्य अधीक्षण का आगमन अत्यंत संभावित है, लेकिन इसके लिए अभी भी परिवर्तनकारी तकनीकी सफलताओं की आवश्यकता है, जिनके लिए भविष्यवाणी करना कठिन है। तदनुसार, क्या सामान्य एआई का एहसास 30 या 200 साल से अब तक अज्ञात है, जैसा कि बुद्धिमत्ता की प्रकृति है; जैसे कि यह सचेत या सहज, निर्दोष या एक हथियार है।
जब मैं एआई हथियारों की दौड़ पर चर्चा करता हूं तो मेरा मतलब मौजूदा प्रौद्योगिकी के निरंतर शोधन से है। कृत्रिम बुद्धिमत्ता, जो आत्म-सीखने की क्षमता रखने के अर्थ में एक सच्ची बुद्धिमत्ता है, लेकिन इसमें नियमों और मापदंडों (जैसे कि एक खेल) के एक संकीर्ण सेट के भीतर एक ही क्रमबद्ध लक्ष्य है।
यह दिखाने के लिए कि राष्ट्रपति शी ने एआई में एक रणनीति गेम जीतते हुए क्या देखा, और क्यों शक्ति का वैश्विक संतुलन उस पर टिका है, हमें खेलों के बारे में संक्षेप में बात करने की आवश्यकता है।
आर्टिफिशियल इंटेलिजेंस और गेम्स
दो प्रकार के रणनीति के खेल हैं: "पूर्ण जानकारी" के खेल और "अधूरी जानकारी के खेल"। पूरी जानकारी का एक खेल वह है जिसमें हर खिलाड़ी हर दूसरे खिलाड़ी के सभी मापदंडों और विकल्पों को देख सकता है।
टिक-टैक-टो पूरी जानकारी का एक खेल है। एक औसत वयस्क तीस मिनट से कम अभ्यास के साथ इस खेल को "हल" कर सकता है। यही है, एक ऐसी रणनीति अपनाएं जो आपके प्रतिद्वंद्वी को कोई फर्क नहीं पड़ता, आप ड्रॉ प्राप्त करने के लिए इसे सही तरीके से काउंटर कर सकते हैं। यदि आपका प्रतिद्वंद्वी उसी रणनीति से भटकता है, तो आप उनका फायदा उठा सकते हैं और जीत सकते हैं।
इसके विपरीत, अनिश्चितता का एक बुनियादी खेल रॉक, कैंची, पेपर है। नियमों को सीखने पर, सभी खिलाड़ियों को तुरंत इष्टतम रणनीति का पता चल जाता है। यदि आपका प्रतिद्वंद्वी रॉक फेंकता है, तो आप पेपर फेंकना चाहते हैं। यदि वे कागज फेंकते हैं, तो आप कैंची फेंकना चाहते हैं, और इसी तरह।
दुर्भाग्य से, आप समय से पहले नहीं जानते हैं कि आपका प्रतिद्वंद्वी क्या करने जा रहा है। इसके बारे में पता होने के नाते, सही रणनीति क्या है?
रॉक के 33 प्रतिशत समय, कैंची को 33 प्रतिशत, और पेपर को 33 प्रतिशत समय में फेंकने के लिए "अयोग्य" रणनीति है, प्रत्येक विकल्प को अवलोकनीय पैटर्न या पूर्वाग्रह से बचने के लिए बेतरतीब ढंग से चुना जा रहा है।
इस अचूक रणनीति का मतलब है कि, कोई फर्क नहीं पड़ता कि आपका विरोधी क्या दृष्टिकोण अपनाता है, वे आपके खिलाफ बढ़त हासिल नहीं कर पाएंगे।
लेकिन कल्पना करें कि आपका प्रतिद्वंद्वी रॉक का 100 प्रतिशत समय फेंकता है। आपकी यादृच्छिक रणनीति कैसे खड़ी होती है? समय का 33 प्रतिशत आप (रॉक) टाई करेंगे, 33 प्रतिशत समय आप जीतेंगे (पेपर), और 33 प्रतिशत समय आप खो देंगे (कैंची) - उनकी रणनीति के खिलाफ आपकी रणनीति का कुल अपेक्षित मूल्य है 0।
क्या यह आपकी "इष्टतम" रणनीति है? नहीं, यदि आपका प्रतिद्वंद्वी 100 प्रतिशत रॉक फेंक रहा है, तो आपको कागज फेंककर अपने प्रतिद्वंद्वी का शोषण करना चाहिए।
स्वाभाविक रूप से, यदि आपका प्रतिद्वंद्वी ध्यान दे रहा है, तो बदले में, वे कैंची फेंकना शुरू कर देंगे। आप और आपके प्रतिद्वंद्वी तब तक कारनामों और जवाबी कारनामों की एक श्रृंखला से गुजरते हैं, जब तक कि आप दोनों धीरे-धीरे एक अप्रभावी संतुलन की ओर नहीं बढ़ते।
मेरे साथ इतनी दूर? अच्छा। चलो कंप्यूटिंग और गेम के बारे में बात करते हैं।
जैसा कि कहा गया है, लगभग कोई भी मानव टिक-टैक-टो को हल कर सकता है, और कंप्यूटर ने कई साल पहले चेकर्स को हल किया था। हालाँकि शतरंज, गो और नो-लिमिट टेक्सास होल्डम पोकर जैसे अधिक जटिल गेम हल नहीं हुए हैं।
सभी के दिमाग के जटिल होने के बावजूद, तीन शतरंज में से सबसे सरल है। 1997 में, विश्व चैंपियन गैरी कास्पारोव को सुपरकंप्यूटर डीप ब्लू ने बुरी तरह पीटा था। आज, इसे पढ़ने वाले किसी भी व्यक्ति के पास अपने फोन पर एक शतरंज कंप्यूटर का उपयोग होता है जो किसी भी मानव खिलाड़ी को परेशान कर सकता है।
इस बीच, गो गेम के पूर्वी गेम ने प्रोग्रामर्स को बाहर कर दिया। गो में शतरंज की तुलना में अधिक संयोजन के कई आदेश हैं। हाल तक तक, मनुष्य चालों के चयन में कहीं अधिक कुशल होकर कंप्यूटरों को हराते हैं - हम हर संभव विकल्प को पच्चीस चालों की गहराई से गणना करने की कोशिश में अपना समय नहीं बिताते हैं। इसके बजाय, हम अपने निर्णय को कुछ अच्छे विकल्पों में सीमित करते हैं और उन का आकलन करते हैं।
इसके अलावा, पारंपरिक कंप्यूटरों के विपरीत, लोग गैर-रेखीय अमूर्तता में सोचने में सक्षम हैं। उदाहरण के लिए, मनुष्य खेल के अंतिम चरणों के दौरान एक भविष्य की स्थिति की कल्पना कर सकता है जिसके आगे एक कंप्यूटर संभवतः गणना कर सकता है। हम एक दूरंदेशी रैखिक प्रगति से विवश नहीं हैं। मनुष्य आश्चर्यजनक रूप से भविष्य के समापन बिंदु की कल्पना कर सकते हैं, और योजना बनाने के लिए वहां से पीछे की ओर काम कर सकते हैं।
पहले कई लोगों का मानना था कि कारकों का यह संयोजन-निकट-अनंत संयोजन और सारगर्भित सोचने की मानवीय क्षमता- का मतलब था कि जाना हमेशा के लिए कंप्यूटर की पहुंच से परे रहेगा।
फिर 2016 में कुछ अभूतपूर्व हुआ। एआई प्रणाली, अल्फा गो, ने राज करने वाले विश्व चैंपियन गो खिलाड़ी ली सेडोल को 4-1 से हराया।
लेकिन यह कुछ भी नहीं था: दो साल बाद, एक नया एआई सिस्टम, अल्फाज़ेरो, अल्फा गो के खिलाफ पिच किया गया था।
अपने पूर्ववर्ती के विपरीत, जिसमें गो सिद्धांत के महत्वपूर्ण डेटाबेस शामिल थे, सभी अल्फ़ाज़ेरो को पता था कि वे नियम थे, जिससे यह चालीस दिनों में लगातार खेला जाता था।
स्व-सीखने की इस अवधि के बाद, अल्फ़ाज़ेरो ने 4-1 नहीं, बल्कि 100-0 से अल्फा गो का सफाया कर दिया।
चालीस दिनों में अल्फाज़ेरो ने कुल मानव संचित ज्ञान के 2,500 वर्षों को पार कर लिया था और यहां तक कि रणनीतियों की एक श्रृंखला का आविष्कार किया था जो इतिहास में पहले कभी नहीं खोजा गया था।
इस बीच, शतरंज कंप्यूटर अब प्रतियोगिता का एक नया मोर्चा हैं, जिसमें प्रोग्रामर डिजिटल टाइटल जीतने के लिए अपने सिस्टम को एक दूसरे के खिलाफ खड़ा करते हैं। दुनिया का सबसे अच्छा शतरंज इंजन लिखने के समय स्टॉकफिश के रूप में जाना जाने वाला एक कार्यक्रम है, जो किसी भी मानव ग्रैंडमास्टर को आसानी से नष्ट करने में सक्षम है। दिसंबर 2017 में अल्फाफ़ेरो के खिलाफ स्टॉकफ़िश को ढेर कर दिया गया था।
फिर, अल्फ़ाज़ेरो केवल नियमों को जानता था। अल्फ़ाज़ेरो ने खुद को नौ घंटे की अवधि में शतरंज खेलना सिखाया। 100 से अधिक खेलों का परिणाम? अल्फाजो अट्ठाईस जीत, शून्य हार, बहत्तर ड्रा।
न केवल कृत्रिम बुद्धि मानव खिलाड़ियों को कुचल सकती है, बल्कि यह उन सर्वोत्तम कंप्यूटर कार्यक्रमों को भी दोहराती है जो मनुष्य डिजाइन कर सकते हैं।
कृत्रिम बुद्धिमत्ता और अमूर्तता
अधिकांश शतरंज कंप्यूटरों को हल करने के लिए अभी तक गेम में एक विशुद्ध रूप से गणितीय रणनीति खेली जाती है। वे कच्चे कैलकुलेटर हैं और इसे पसंद भी करते हैं। अल्फ़ाज़ेरो, कम से कम शैली में, हर एक इंसान की तरह खेलता हुआ दिखाई देता है। यह लंबे समय तक स्थितीय नाटक करता है जैसे कि यह बोर्ड की कल्पना कर सकता है; शानदार टुकड़ा बलिदान करता है कि कोई भी कंप्यूटर संभवतः खींच नहीं सकता है, और शोषणकारी आदान-प्रदान जो एक कंप्यूटर बना देगा, अगर यह सक्षम था, तो जटिलता के साथ उखड़ जाती है। संक्षेप में, अल्फ़ाज़ेरो एक वास्तविक बुद्धिमत्ता है। आत्म-जागरूक नहीं है, और सैंडबॉक्स वाली वास्तविकता से विवश है, लेकिन वास्तविक है।
जटिलता में अंतर होने के बावजूद एक सीमा है जो शतरंज और दोनों हिस्से को जाती है - वे पूरी जानकारी के खेल हैं।
नो-लिमिट टेक्सास होल्डम (यहां, "पोकर") दर्ज करें। यह अनिश्चितता और अधूरी जानकारी का अंतिम खेल है। पोकर में, आप जानते हैं कि आपके छेद कार्ड क्या हैं, प्रत्येक खिलाड़ी के लिए स्टैक आकार और अब तक सामने आए सामुदायिक कार्ड। हालाँकि, आप अपने प्रतिद्वंद्वी के कार्ड के बारे में नहीं जानते हैं, कि वे दांव लगाएंगे या बढ़ाएंगे या बाद में सट्टेबाजी की सड़कों पर क्या कार्ड निकलेंगे।
गणित, रणनीति, समय, मनोविज्ञान और भाग्य के संयोजन से पोकर यकीनन दुनिया का सबसे जटिल खेल है। शतरंज या गो के विपरीत, पोकर की संभावनाएं वास्तव में अनंत हैं और एक साथ कई खिलाड़ियों के पार हैं। यह विचार कि एक कंप्यूटर शीर्ष पोकर पेशेवरों को हरा सकता है अदृश्य लगता है।
सिवाय इसके कि यह पहले ही हो चुका है। 2017 में, AI सिस्टम "लाइब्रेटस" ने दुनिया में सर्वश्रेष्ठ हेड-अप (दो-खिलाड़ी) पोकर खिलाड़ियों को व्यापक रूप से हराया।
और अब, कुछ महीने पहले, एक और AI सिस्टम "प्लूरीबस" ने अकल्पनीय हासिल किया - इसने एक साथ कई शीर्ष पेशेवरों के खिलाफ सुपर उच्च दांव पोकर गेम को कुचल दिया, प्रति घंटे पांच बड़े अंधा की जीत दर पर ऐसा करना। परिप्रेक्ष्य के लिए, सबसे अच्छा इंग्लिश प्रीमियर लीग फुटबॉल टीम और सबसे खराब के बीच कौशल स्तर में अंतर इतना अधिक नहीं होगा।