Google फ़ोटो आज़माने वाला कोई भी व्यक्ति इस बात से सहमत होगा कि Google की यह निःशुल्क फ़ोटो संग्रहण और प्रबंधन सेवा स्मार्ट है। यह उन्नत खोज, स्थानों और तिथियों के आधार पर आपके चित्रों को वर्गीकृत करने की क्षमता, स्वचालित रूप से एल्बम और वीडियो को समानता के आधार पर बनाने और आपको कई वर्षों पहले उसी दिन की तस्वीरें दिखाते हुए मेमोरी लेन चलने की क्षमता प्रदान करता है। ऐसी कई चीजें हैं जो Google फ़ोटो कर सकती हैं जो कई साल पहले मशीन-लाइन्स असंभव होगी। Google फ़ोटो Google की कई "स्मार्ट" सेवाओं में से एक है जो TensorFlow नामक मशीन सीखने की तकनीक का उपयोग करती है। शब्द सीखने से संकेत मिलता है कि तकनीक समय के हिसाब से उस समय तक स्मार्ट हो जाएगी जो हमारे वर्तमान ज्ञान की कल्पना नहीं कर सकते हैं। लेकिन TensorFlow क्या है? मशीन कैसे सीख सकती है? तुम्हारे द्वारा इससे क्या किया जा सकता है? चलो पता करते हैं।
TensorFlow क्या है?
TensorFlow Google का ओपन-सोर्स और शक्तिशाली आर्टिफिशियल इंटेलिजेंस सॉफ्टवेयर है, जो Google की कई सेवाओं और पहलों को संचालित करता है। यह Google ब्रेन टीम द्वारा निर्मित बड़े पैमाने पर मशीन सीखने के कार्यान्वयन के लिए एक प्रणाली की दूसरी पीढ़ी है। एल्गोरिथ्म की यह लाइब्रेरी डिस्टलबेल को सफल करती है - पहली पीढ़ी।
तकनीक स्टेटफुल डेटा फ्लो ग्राफ के रूप में गणना का प्रतिनिधित्व करती है। क्या बनाता है TensorFlow अद्वितीय है हार्डवेयर की एक विशाल रेंज पर मॉडल-गणना करने की क्षमता, उपभोक्ता-स्तर के मोबाइल उपकरणों से लेकर विश्व-स्तरीय मल्टी-जीपीयू सर्वर तक। यह विभिन्न जीपीयू और सीपीयू पर चल सकता है और विभिन्न उपकरणों और गैजेट्स के बीच मशीन सीखने की मापनीयता का वादा करता है, ताकि कोड की एक महत्वपूर्ण राशि में बदलाव न हो।
TensorFlow की उत्पत्ति Google के कंप्यूटर सिस्टम को यह निर्देश देने की आवश्यकता से हुई कि मानव मस्तिष्क सीखने और तर्क करने में कैसे काम करता है। प्रणाली, जिसे तंत्रिका नेटवर्क के रूप में जाना जाता है, को “टेनर्स” के रूप में संदर्भित बहुआयामी डेटा सरणियों पर प्रदर्शन करने में सक्षम होना चाहिए। अंतिम लक्ष्य तंत्रिका नेटवर्क को पैटर्न और सहसंबंधों का पता लगाने और समझने के लिए प्रशिक्षित करना है।
नवंबर 2015 में, Google ने इस तकनीक को ओपन-सोर्स बनाया और इसे सभी प्रकार के उत्पादों और शोधों में अपनाने की अनुमति दी। कोई भी, जिसमें शोधकर्ता, इंजीनियर, और शौक शामिल हैं, मशीन सीखने की गति को बढ़ाने और कम समय में इसे उच्च स्तर तक ले जाने में मदद कर सकता है।
यह कदम सही निकला क्योंकि स्वतंत्र डेवलपर्स से टेन्सरफ्लो में इतने योगदान हैं कि वे Google के योगदान को पार कर गए हैं। विकिपीडिया का उल्लेख है कि "GitHub पर 1500 रिपॉजिटरी हैं जो TensorFlow का उल्लेख करते हैं, जिनमें से 5 Google से हैं।" ऐसा कहा जा रहा है, Quora पर चर्चाओं में से एक को संदेह है कि रिलीज़ किया गया ओपन-सोर्स कोड "क्लीन-अप" संस्करण है। Google जो अपनी सेवाओं में उपयोग करता है।
TraneFlow कैसे काम करता है?
सामान्य सामान्य मानव भाषा और भारी सरलीकरण का उपयोग करते हुए, हम TensorFlow के एक तरफ को एक उन्नत स्वायत्त फ़िल्टरिंग तकनीक के रूप में देख सकते हैं। इसके दिल में, प्रौद्योगिकी मशीन सीखने का एक विशाल सॉफ्टवेयर लाइब्रेरी है। यह "निर्णय लेने" में मदद करने के लिए डेटाबेस का उपयोग करता है।
उदाहरण के लिए, कोई व्यक्ति Google फ़ोटो पर एक फ़ोटो अपलोड करता है। तकनीक तस्वीर के सभी विवरणों की तुलना अपने डेटाबेस से करेगी और यह तय करेगी कि यह किसी जानवर या इंसान की तस्वीर है या नहीं। फिर यदि यह एक मानव है, तो यह लिंग को निर्धारित करने की कोशिश करेगा, उम्र सभी तरह से व्यक्ति कौन है। फोटो में अन्य वस्तुओं के लिए भी यही प्रक्रिया दोहराई जाती है।
यह उपयोगकर्ता के डेटा का उपयोग भी करता है जैसे कि चित्र में व्यक्ति की पहचान और वह स्थान जहाँ चित्र लिया गया है, अपनी लाइब्रेरी को बढ़ाने के लिए ताकि यह भविष्य में बेहतर परिणाम दे सके - फोटो अपलोड करने वाले व्यक्ति के लिए और सभी के लिए अन्य। इसलिए शब्द "सीखने"। लेकिन यह केवल फोटो से डेटा जानने और सीखने पर ही नहीं रुकता है। वहाँ बहुत कुछ है कि प्रौद्योगिकी एक तस्वीर से जानकारी के साथ कर सकते हैं। उदाहरण के लिए, यह एक ही व्यक्ति, एक ही स्थान, एक ही तिथि जैसे समान विवरणों के साथ फ़ोटो को समूहित कर सकता है; चेहरे के पैटर्न को देखें कि फोटो में व्यक्ति किस परिवार और दोस्तों से संबंधित है, और निरंतर शॉट्स से परिवार की छुट्टी या एनीमेशन के वीडियो बनाने के लिए जानकारी का उपयोग करें।
TensorFlow कैसे काम करता है इसकी सतह को मुश्किल से खरोंचता है, लेकिन मुझे उम्मीद है कि यह आपको तकनीक की एक सामान्य तस्वीर दे सकता है। इसके अलावा, केवल एक उदाहरण का उपयोग करना न्याय करने में सक्षम नहीं है कि यह क्या करने में सक्षम है।
और सभी आर्टिफिशियल इंटेलिजेंस उत्साही लोगों के लिए, यह ध्यान देने योग्य है कि Google ने पहले से ही मशीन सीखने के लिए अनुकूलित एक कंप्यूटर चिप तकनीक बनाई और इसमें TensorFlow को एकीकृत किया। इसे Tensor Processing Unit (TPU) ASIC चिप कहा जाता है।
जो लोग TensorFlow के बारे में अधिक जानना चाहते हैं, वे इसके ट्यूटोरियल पेज पर जा सकते हैं।
TensorFlow के अनुप्रयोग
हम मशीन लर्निंग तकनीक के शुरुआती चरण में हैं, इसलिए किसी को नहीं पता कि यह हमें कहां ले जाएगी। लेकिन कुछ प्रारंभिक अनुप्रयोग हैं जो हमें भविष्य में झाँक सकते हैं। जैसा कि यह Google से उत्पन्न होता है, यह स्पष्ट है कि Google अपनी कई सेवाओं के लिए प्रौद्योगिकी का उपयोग करता है।
छवि विश्लेषण पर अधिक
हमने Google फ़ोटो में छवि विश्लेषण के लिए तकनीक का उपयोग करने के उदाहरण पर चर्चा की है। लेकिन छवि विश्लेषण एप्लिकेशन का उपयोग Google मैप्स स्ट्रीट व्यू फीचर में भी किया जाता है। उदाहरण के लिए, TensorFlow का उपयोग मानचित्र के निर्देशांक के साथ छवि को जोड़ने और गलती से छवि में शामिल किसी भी कार की लाइसेंस प्लेट संख्या को स्वचालित रूप से धुंधला करने के लिए किया जाता है।
वाक् पहचान
Google अपने वॉयस असिस्टेंट स्पीच रिकग्निशन सॉफ्टवेयर के लिए TensorFlow का भी उपयोग कर रहा है। उपयोगकर्ताओं को निर्देश देने की अनुमति देने वाली तकनीक नई नहीं है, लेकिन मिश्रण में टेन्सरफ्लो की बढ़ी हुई लाइब्रेरी सहित यह सुविधा कुछ पायदान ऊपर ला सकती है। वर्तमान में, भाषण मान्यता तकनीक 80 से अधिक भाषाओं और वेरिएंट को पहचानती है।
गतिशील अनुवाद
मशीन सीखने की तकनीक के "सीखने" भाग का एक और उदाहरण Google की अनुवाद सुविधा है। Google अपने उपयोगकर्ताओं को नई शब्दावली जोड़ने और Google अनुवाद में गलतियों को ठीक करने की अनुमति देता है। कभी-कभी बढ़ते डेटा का उपयोग उस इनपुट भाषा का स्वचालित रूप से पता लगाने के लिए किया जा सकता है जिसे अन्य उपयोगकर्ता अनुवाद करना चाहते हैं। यदि मशीन भाषा का पता लगाने की प्रक्रिया में गलती करती है, तो उपयोगकर्ता उन्हें सही कर सकते हैं। और मशीन अपने भविष्य के प्रदर्शन को बेहतर बनाने के लिए उन गलतियों से सीख लेगी। और चक्र चलता रहता है।
अल्फा गो
TensorFlow उपयोग का एक मजेदार उदाहरण अल्फा गो है। यह गो खेलने के लिए प्रोग्राम किया गया एक एप्लिकेशन है। गो के साथ अपरिचित लोगों के लिए, यह दो खिलाड़ियों के लिए एक सार मंडल का खेल है जो चीन में पांच हजार पांच सौ साल से अधिक पहले उत्पन्न हुआ था, और यह सबसे पुराना बोर्ड खेल है जो आज भी लगातार खेला जाता है। जबकि नियम सरल हैं - प्रतिद्वंद्वी की तुलना में अधिक क्षेत्र को घेरने के लिए, खेल अविश्वसनीय रूप से जटिल है और, विकिपीडिया के अनुसार: "दृश्य ब्रह्मांड में परमाणुओं की कुल संख्या की तुलना में अधिक संभावनाएं हैं।"
तो, यह दिलचस्प है कि एक सीखने की मशीन तकनीक अनंत संभावनाओं के साथ क्या कर सकती है। ली सेडोल के खिलाफ अपने मैचों में - 18 बार के गो विश्व चैंपियन, अल्फा गो ने 5 में से 4 गेम जीते और उन्हें मानद सर्वोच्च गो ग्रैंडमास्टर रैंक दिया गया।
मजेंटा प्रोजेक्ट
TensorFlow का एक और दिलचस्प आवेदन मैजेंटा प्रोजेक्ट है। यह मशीन बनाने वाली कला बनाने की महत्वाकांक्षी परियोजना है। प्रयोग के शुरुआती मूर्त परिणामों में से एक 90 सेकंड का पियानो राग है। दीर्घावधि में, Google अपने मैजेंटा प्रोजेक्ट के माध्यम से अधिक उन्नत मशीन-जनित कला उत्पन्न करने और इसके चारों ओर कलाकारों के समुदाय का निर्माण करने की उम्मीद करता है।
फरवरी 2016 को, Google ने सैन फ्रान्सिस्को में एक कला प्रदर्शनी और नीलामी आयोजित की, जिसमें 29 कंप्यूटरों को उत्पन्न किया गया था - जो मानव - कला के टुकड़ों से थोड़ी मदद के साथ। सबसे बड़े कार्यों में से छह को $ 8, 000 के लिए बेचा गया था। कंप्यूटर के पास अभी भी एक बहुत लंबा रास्ता हो सकता है इससे पहले कि वह एक वास्तविक कलाकार की नकल कर सके, लेकिन जितना पैसा लोग कला दिखाने के लिए देने को तैयार हैं, वह यह है कि तकनीक कितनी दूर चली गई है।
IOS के लिए समर्थन
जबकि हमने एंड्रॉइड पर TraneFlow की क्षमताओं को पहले ही देख लिया है, इसके नवीनतम संस्करण के साथ, TensorFlow आखिरकार iOS उपकरणों के लिए समर्थन जोड़ता है। चूंकि आईओएस के लिए विशेष रूप से उपलब्ध महान मोबाइल एप्लिकेशन के टन हैं, या पहले आईओएस पर जारी किया गया है, इसका मतलब है कि हम निकट भविष्य में मशीन लर्निंग को अपनाने वाले अधिक महान मोबाइल एप्लिकेशन की उम्मीद कर सकते हैं। एक ही बात को TensorFlow के व्यापक रूप से अपनाने और अनुप्रयोगों की संभावनाओं के लिए कहा जा सकता है।
TensorFlow का भविष्य
एक मशीन के साथ संभवतः कोई क्या कर सकता है जो सीखने और अपना निर्णय लेने में सक्षम है? एक व्यक्ति के रूप में जो दैनिक जीवन के हिस्से के रूप में एक से अधिक भाषाओं के साथ व्यवहार करता है, पहली चीज जो मेरे दिमाग में आती है वह है भाषा अनुवाद। शब्द स्तर से शब्द में नहीं, बल्कि अधिक पाठ स्तर जैसे दस्तावेज़ या यहां तक कि पुस्तकों में। आज की अनुवाद तकनीक शब्दसंग्रह तक सीमित है। आप आसानी से पता लगा सकते हैं कि चीनी और इसके विपरीत "सो" क्या है, लेकिन अपने मूल जापानी में इजी योशिकावा के मुशीशी के एक अध्याय में फेंकने का प्रयास करें और अध्याय का अंग्रेजी में अनुवाद करें। आप देखेंगे कि मुझे क्या मिल रहा है।
यह देखना भी मजेदार है कि आर्टिफिशियल इंटेलिजेंस का भविष्य संगीत के साथ क्या कर सकता है। जबकि यह अभी भी बहुत बुनियादी है, Apple का म्यूजिक मेमो ऐप पहले से ही आपके रिकॉर्ड किए गए गायन को स्वचालित बास और ड्रम संगत दे सकता है। मुझे एक SciFi टीवी शो का एक एपिसोड याद है, जहां शो में एक चरित्र ने एक मशीन बनाई थी जो चार्ट के सभी शीर्ष गीतों का विश्लेषण करती है और अपने स्वयं के हिट गाने लिखने में सक्षम होती है। क्या हम कभी वहां पहुंचेंगे?
और जैसा कि समापन सोचा था, मैं सनस्प्रिंग का उल्लेख करना चाहूंगा । यह एक लघु विज्ञान कथा फिल्म है जो पूरी तरह से एक एआई पटकथा लेखक द्वारा लिखी गई है, जो खुद को बेंजामिन कहते हैं - जिसने पॉप-गीत संगीत की धुन भी बनाई थी। फिल्म को निर्देशक ऑस्कर शार्प द्वारा 48 घंटे की फिल्म चैलेंज ऑफ साइंस-फाई लंदन इवेंट के लिए एक साथ रखा गया था।
अब मैं टर्मिनेटर के बारे में सोचना बंद नहीं कर सकता। आने वाला कल आपका स्वागत करता है।
इमेज क्रेडिट: विकिपीडिया, TechInsider, द वर्ज, वॉल स्ट्रीट जर्नल