Computer Teaching Blog: Introduction to WWW, Concept of Internet, Web Browsers, internet servers and search engines.

Introduction to WWW

विश्व व्यापी वेब(जिसे सामान्यत: वेब कहा जाता है) आपस में परस्पर जुड़े हाइपरटेक्स्ट दस्तावेजों को इन्टरनेट द्वारा प्राप्त करने की प्रणाली है। एक वेब ब्राउजर की सहायता से हम उन वेब पन्नों को देख सकते हैं जिनमें टेक्स्ट, छवि (image), वीडियो, एंवं अन्य मल्टीमीडिया होते हैं तथा हाइपरलिंक की सहायता से उन पन्नों के बीच में आवागमन कर सकते है। विश्व व्यापी वेब को टिम बर्नर्स ली द्वारा 1989 में यूरोपीय नाभिकीय अनुसंधान संगठन जो की जेनेवा, स्वीट्ज़रलैंड में है, में काम करते वक्त बनाया गया था और 1992 में जारी किया गया था। उसके बाद से बरनर्स-ली नें वेब के स्तरों के विकास (जैसे की मार्कअप भाषाएँ जिनमें की वेब पन्ने लिखे जाते हैं) में एक सक्रीय भूमिका अदा की है और हाल के वर्षों में उन्होनें सीमेंटिक (अर्थ) वेब (Semantic Web) विकसित करने के अपने स्वप्न की वकालत की है।

वेब कैसे काम करता है

विश्व व्यापी वेब पर एक वेब पन्ने को देखने की शुरुआत सामान्यत: वेब ब्राउजर में उसका यूआरएल लिख कर अथवा उस पन्ने या संसाधन के हाइपरलिंक का पीछा करते हुए होती है। तब उस पन्ने को ढूंढ कर प्रर्दशित करने के लिए वेब ब्राउजर अंदर ही अंदर संचार संदेशों की एक श्रृंखला आरंभ करता है।

सबसे पहले यूआरएल के सर्वर-नाम वाले हिस्से को विश्व में वितरित इन्टरनेट डाटा-बेस, जिसे डोमेन नाम प्रणाली के नाम से जाना जाता है, की सहायता से आईपी पते में परिवर्तित कर दिया जाता है। वेब सर्वर से संपर्क साधने और डाटा पैकेट भेजने के लिए ये आईपी पता जरुरी है।

उसके बाद ब्राउजर वेब सर्वर के उस विशिष्ट पते पर हाइपरटेक्स्ट ट्रांसफर प्रोटोकॉल की प्रार्थना भेज कर रिसोर्स से अनुरोध करता है। एक आम वेब पन्ने की बात करें तो, वेब ब्राउजर सबसे पहले उस पन्ने के एच.टी.एम.एल. टेक्स्ट के लिए अनुरोध करता है और तुंरत ही उसका पदच्छेद कर देता है। उसके बाद वेब ब्राउजर पुनः अनुरोध करता है उन छवियों और संचिकाओं के लिए जो उस पन्ने के भाग हैं। एक वेबसाइट की लोकप्रियता सामान्यत: इस बात से मापी जाती है कि कितनी बार उसके पन्नों को देखा गया या कितनी बार उसके सर्वर को हिट किया गया या फिर कितनी बार उसकी संचिकाओं के लिए अनुरोध किया गया।

वेब सेवक से आवश्यक संचिकाएँ प्राप्त करने के बाद ब्राउज़र उस पन्ने को स्क्रीन पर एच.टी.एम.एल., कैस्केडिंग स्टाइल शीट्स एंवं अन्य वेब भाषाओँ के निर्देश के अनुसार प्रर्दशित करता है। जिस वेब पन्ने को हम स्क्रीन पर देखते हैं उसके निर्माण के लिए अन्य छवियों एंवं संसाधनों का भी इस्तेमाल होता है।

अधिकांश वेब पृष्ठों में उनसे संबंधित अन्य पृष्ठों और शायद डाउनलोड करने लायक वस्तु, स्रोत दस्तावेजों, परिभाषाएँ और अन्य वेब संसाधनों के हाइपरलिंक स्वयं शामिल होंगे। इस उपयोगी और सम्बंधित संसाधनों के समागम को, जो की आपस में हाइपरटेक्स्ट लिंक के द्वारा जुड़े हुए हों, को जानकारी का "वेब" कहा गया। इसको इन्टरनेट पर उपलब्ध कराने को टिम बर्नर्स ली नें सर्वप्रथम 1990 में विश्वव्यापीवेब का नाम दिया।

इतिहास

वेब की उत्पत्ति के अन्तर्निहित विचारों के लक्षण 1980 में मिलने शुरू हो गए थे जब सर्न में टिम बरनर्स-ली नें एंक्वाइयर (ENQUIRE) की रचना की थी (यहाँ उनका इशारा एक किताब, एंक्वाइयर विदिन अपॉन एव्री-थिंग (Enquire Within Upon Everything), की तरफ़ था जो उन्होनें बचपन में पढ़ी थी। हालाँकि आज इस्तेमाल होने वाली प्रणाली से ये भिन्न था लेकिन इसके मूल विचार काफी हद तक सामान थे (यहाँ तक की विश्व व्यापी वेब के बाद की परियोजना सीमेंटिक वेब (Semantic Web) के विचार भी)

मार्च 1989 में टिम बरनर्स-ली नें एक प्रस्ताव लिखा जिसमें एंक्वाइयर का जिक्र किया गया और एक अधिक विस्तृत सूचना प्रणाली का वर्णन किया गया। रॉबर्ट कैल्लिअउ (Robert Cailliau) की मदद से उन्होनें नवम्बर 12, 1990[3] में विश्व व्यापी वेब का एक अधिक औपचारिक प्रस्ताव प्रकाशित किया। इसका आदर्श नमूना EBT के DYNATEXT SGML रीडर, जिसे की सर्न द्वारा अनुबंधित किया गया था, द्वारा प्रदान किया गया था। EBT(इलेक्ट्रॉनिक बुक टेक्नोलॉजी, जिसका विकास ब्राउन यूनिवर्सिटी के इंस्टिट्यूट फॉर रिसर्च इन इन्फोर्मेशन एंड स्कॉलरशिप द्वारा किया गया था)। हालाँकि ये DYNATEXT (Dynatext) (HYTIME (HyTime) के अंतर्गत SGML ISO 8879:1986 के हाइपरमीडिया में विस्तार में इसका मुख्य योगदान था) प्रणाली काफी उच्च तकनीक की मानी जाती थी, परन्तु इसे बहुत महंगा समझा जाता था और HEP(हाई एनर्जी फिजिक्स) के समाज के इस्तेमाल के लिए जो लाइसेंसिंग नीति थी उसे भी अनुचित समझा जाता था।

नेक्स्ट क्यूब (NeXTcube) का इस्तेमाल बरनर्स-ली द्वारा 1990 में दुनिया के पहले वेब सर्वर की तरह और पहले वेब ब्राउजर, वर्ल्ड वाइड वेब, को लिखने के लिए किया गया था। 1990 के क्रिसमस तक बरनर्स-ली ने एक चालू वेब के लिए आवश्यक सभी उपकरणों का निर्माण कर लिया था:[4]पहला वेब ब्राउजर (जो की एक अच्छा वेब संपादक भी था), पहला वेब सेवक और प्रथम वेब पृष्ठ[5] जो इस परियोजना का वर्णन करते थे।

6 अगस्त 1991 को उन्होंने विश्व व्यापी वेब परियोजना का एक संक्षिप्त सार alt.hypertext न्यूज़ग्रुप (newsgroup)[6] पर पोस्ट किया था। इस तिथि को वेब के इंटरनेट पर एक सार्वजनिक रूप से उपलब्ध सेवा के शुरुआत के रूप में भी याद किया जाता है।

यूरोप के बाहर पहला सर्वर SLAC (SLAC) में दिसम्बर 1991 में बनाया गया था।

हाइपरटेक्स्ट जैसे महत्त्वपूर्ण बुनियादी विचार की उत्पत्ति 1960 की पुरानी परियोजनाओं (जैसे की ब्राउन यूनिवर्सिटी का हाइपरटेक्स्ट एडिटिंग सिस्टम, HES) से ही हो गई थी- टेड नेल्सन (Ted Nelson) और एंड्रियस वेन डेम (Andries van Dam)- टेड नेल्सन (Ted Nelson) की परियोजना ज़नाडू (Project Xanadu) और डगलस एन्गेल्बर्ट (Douglas Engelbart) की ऑन-लाइन सिस्टम्स (oN-Line System) (NLS).दोनों नेल्सन और एन्गेल्बर्ट को वन्नेवर बुश (Vannevar Bush) की माइक्रोफिल्म (microfilm) पर आधारित "मेमेक्स (memex)" से प्रेरणा मिली थी, जिसका वर्णन 1945 के एक निबंध में इस प्रकार किया गया था " जैसा हम सोंचें (As We May Think)"।

बेर्नेर्स-ली की एक बड़ी सफलता थी हाइपरटेक्सट और इन्टरनेट का आपस में मेल कराना.अपनी किताब वीविंग द वेब में उन्होंने वर्णन किया है कि कैसे उन्होंने बार बार दोनों तकनीकी समुदायों के सदस्यों को ये सुझाव दिया था की इन दोनों तकनीकों का आपस में मेल हो सकता है, लेकिन किसी ने उनका न्योता स्वीकार नहीं किया और अंत में इस परियोजना में उन्हें स्वयं हाँथ डालना पड़ा। वेब और अन्य जगहों पर इस्तेमाल होने वाले संसाधनों की विश्व में एकमात्र पहचान वाली प्रणाली विकसित की: यूनिफ़ॉर्म रिसोर्स अभिज्ञापक।

वेब में उस समय मौजूद अन्य हाइपरटेक्स्ट प्रणालियों से काफी सारी भिन्नाताएँ थीं। वेब में दो दिशाओं की कड़ियों की बजाय केवल एक दिशा वाली कड़ियों की आवश्यकता थी। यदि किसी को किसी संसाधन से जुड़ना हो, बिना उस संसाधन के मालिक की मदद के, तो ये भी सम्भव हो गया। पहले की प्रणालियों की तुलना में इसने वेब ब्राउज़र्स और सर्वरों को लागू करने में आने वाली दिक्कतों को काफी हद तक कम कर दिया। लेकिन बदले में लिंक रोट (link rot) की भीषण समस्या को पैदा का दिया। पूर्वाधिकारीयों, जैसे की हाइपर कार्ड (HyperCard), की तुलना में ये वेब गैर मालिकाना था। जिससे की लाईसेन्स प्रतिबंधों के बिना ही सर्वरों और ग्राहकों को स्वतंत्र रूप से विकसित करना और अन्य विस्तारों को जोड़ना सम्भव हो गया।

30 अप्रैल 1993 को सर्न ने घोषणा की कि विश्व व्यापी वेब सबके लिए निःशुल्क होगा और कोई शुल्क बकाया नहीं रहेगा। गोफर (Gopher) प्रोटोकॉल कि इस घोषणा कि अब उसकी सेवा निःशुल्क नहीं है, लोगों का रुझान बहुत तेज़ी से गोफर की बजाय वेब की तरफ़ हो गया। ViolaWWW (ViolaWWW) एक शुरुआती लोकप्रिय वेब ब्राउसर था, जो कि हाइपर कार्ड (HyperCard) पर आधारित था।

विद्वान आमतौर पर इस बात से सहमत हैं कि विश्व व्यापी वेब के जीवन में नया मोड़ (turning point) 1993 में मोजेक (Mosaic) वेब ब्राउज़र के आने के साथ शुरू हुआ, इस सुचित्रित ब्राउज़र का विकास अर्बाना शम्पैग्न के इलिनोइस विश्वविद्यालय (University of Illinois at Urbana-Champaign) के सुपरकंप्यूटिंग के अनुप्रयोगों के लिए राष्ट्रीय केन्द्र (National Center for Supercomputing Applications) (NCSA-UIUC) के एक दल द्वारा मार्क एंड्रिस्सें (Marc Andreessen) कि अगुवाई में किया गया। मोज़ेक के लिए अनुदान उच्च निष्पादन कम्प्यूटिंग और संचार पहल की तरफ़ से आया, ये एक वित्त पोषण कार्यक्रम था जिसकी शुरुआत उच्च निष्पादन कम्प्यूटिंग और संचार अधिनियम 1991 (High Performance Computing and Communication Act of 1991) के तहत हुई थी। ये सेनेटर अल गोर[11] द्वारा शुरू किए गए अनेकों कंप्यूटिंग विकास (several computing developments) के कार्यक्रमों में से एक था। मोजैक के बाहर आने से पहले चित्रित (ग्राफिक्स) और लिखित शब्दों का मिश्रण वेब पन्नों पर आम तौर पर नहीं होता था और इसकी लोकप्रियता इन्टनेट के पुराने प्रोटोकॉलों, जैसे की गोफर (Gopher) और वाइड एरिया इन्फोर्मेशन सर्वर्स (Wide Area Information Servers)(WAIS), से कम थी। मोजैक अब तक का सबसे लोकप्रिय इन्टरनेट प्रोटोकॉल इसके चित्रमय उपयोगकर्ता इंटरफ़ेस की वजह से बना।

विश्व व्यापी वेब संघ के टिम बेर्नेर्स-ली द्वारा अक्टूबर 1994 में यूरोपीय संगठन परमाणु अनुसंधान (सर्न) छोड़ने के बाद स्थापित किया गया था। इसकी स्थापना मसाचुसेट्स तकनीकी संस्थान की कंप्यूटर विज्ञान की प्रयोगशाला में रक्षा उन्नत अनुसंधान परियोजनाओं एजेंसी (Defense Advanced Research Projects Agency) (DARPA) समर्थन से की गई थी - जिसने इन्टनेट और यूरोपीय आयोग (European Commission) की शुरुआत की थी।

साहित्य में इतिहास

घर में स्थापित वैश्विक सूचना प्रणाली का विचार को कम से कम इसाक असिमोव (Isaac Asimov) की मार्च 1959 की लघु कहानी "एनिवर्सरी" अमेजिंग स्टोरीज (Amazing Stories) तक पीछे खिंचा जा सकता है। इसमें पात्र "मल्टीवाक (Multivac) आउटलेट" नामक एक होम कंप्यूटर के द्वारा जानकारी प्राप्त करते हैं। ये ग्रह कंप्यूटर पूरे ग्रह पर फैले सर्किट्स के एक जाल द्वारा एक मील लंबे सुपर कंप्यूटर से जुडा हुआ था, जो की पृथ्वी के अंदर कहीं स्थापित था। एक चरित्र अपने बच्चों के लिए एक मल्टीवाक, जूनियर मॉडल स्थापित करने की सोच रहा है।

इस कहानी में भविष्य के उस समय की कल्पना की गई जब व्यावसायिक अंतरिक्ष यात्रा एक आम बात होगी, फ़िर भी मशीन उत्तर को एक टेप की पर्ची पर प्रिंट करती है जो की किसी खाने में से बाहर आता है- कोई विडियो दिखाई नहीं देता है- और कंप्यूटर का मालिक कहता है कि उसने इतना खर्चा इसलिए तो नहीं किया था की उसे एक मल्टीवाक आउटलेट मिले जो सिर्फ़ बोलता हो।

मानक

विश्व व्यापी वेब, इंटरनेट और कंप्यूटर जानकारी विनिमय के विभिन्न पहलुओं के संचालन को कई औपचारिक मानक और अन्य तकनीकी विशेषताएं परिभाषित करती हैं। कई दस्तावेजों को विश्व व्यापी वेब संघ (W3C) ने बरनर्स-ली के नेतृत्व में बनाया है, लेकिन कुछ अन्य को इंटरनेट इंजीनियरिंग टास्क फोर्स (Internet Engineering Task Force) (IETF) और अन्य संगठनों द्वारा बनाया गया है।

आमतौर पर, जब वेब मानकों पर चर्चा होती है तब निम्नलिखित प्रकाशनों मूलभूत के रूप में देखा जाता है:

W3C की तरफ़ से मार्कउप भाषाओँ (markup languages)- खासकर HTML और XHTML (XHTML)- के लिए सलाह.ये हाइपरटेक्स्ट (hypertext) दस्तावेजों की संरचना और व्याख्या को परिभाषित करती हैं।

1 W3C की तरफ़ से स्टाइलशीट (stylesheets), खासकर CSS (CSS), के लिए सलाह।

2 ECMA (ECMAScript) स्क्रिप्ट के मानक (सामान्यत: जावा स्क्रिप्ट के रूप में), द्वारा Ecma अंतर्राष्ट्रीय (Ecma International)।

3 दस्तावेज़ ऑब्जेक्ट मॉडल (Document Object Model) के लिए अनुशंसाएँ, W3C से।

अतिरिक्त प्रकाशन विश्व व्यापी वेब की अन्य आवश्यक तकनीकों की परिभाषा प्रदान करते हैं, जिनमें निम्नलिखित (परन्तु इसी तक सीमित नहीं) शामिल हैं:

यूनिफ़ॉर्म रिसोर्स पहचानकर्ता (यूआरआइ (URI)), जो की इन्टरनेट पर संसाधनों, जैसे की हायपरटेक्स्ट दस्तावेज़ और तस्वीरें, को संदर्भित करने की एक सार्वभौमिक प्रणाली है। यूआरआइ, जिन्हें की अक्सर URL भी कहा जाता है, IETF's RFC 3986 / STD 66 द्वारा परिभाषित किए जाते हैं: यूनिफ़ॉर्म रिसोर्स आइडेंटिफाइयर (यूआरआइ): जेनेरिक सिंटेक्स , साथ ही अपने पूर्ववर्ती तथा अनेकों यूआरआइ योजना (URI scheme)-परिभाषित RFC (RFCs);

हायपर टेक्स्ट ट्रांसफर प्रोटोकॉल (HTTP), खासतौर पर RFC 2616 द्वारा परिभाषित: एचटीटीपी/१.1 तथा RFC २६१७: एचटीटीपी प्रमाणीकरण, जो ये बताते हैं कि ब्राउज़र और सर्वर कैसे एक दूसरे को प्रमाणित करते हैं।

इंटरनेट

वेब पर सूचना तक पहुँचने के लिए इंटरनेट को सूचना सुपर राजमार्ग के रूप में परिभाषित किया गया है। हालाँकि, इसे कई तरीकों से परिभाषित किया जा सकता है:

1 इंटरनेट इंटरकनेक्टेड कंप्यूटर नेटवर्क की एक विश्वव्यापी वैश्विक प्रणाली है।

2 इंटरनेट मानक इंटरनेट प्रोटोकॉल (टीसीपी / आईपी) का उपयोग करता है।

3 इंटरनेट के प्रत्येक कंप्यूटर की पहचान एक विशिष्ट IP पते से होती है।

4 IP पता संख्याओं का एक अनूठा सेट है (जैसे 110.22.33.114) जो कंप्यूटर स्थान की पहचान करता है।

5 IP पते को नाम देने के लिए एक विशेष कंप्यूटर DNS (डोमेन नाम सर्वर) का उपयोग किया जाता है ताकि उपयोगकर्ता एक नाम से कंप्यूटर का पता लगा सके।

उदाहरण के लिए, एक DNS सर्वर एक विशेष आईपी पते के लिए http://www.compusang.blogspot.com नाम का निराकरण करेगा, जिस पर यह वेबसाइट होस्ट की गई है।

पूरी दुनिया में इंटरनेट हर उपयोगकर्ता के लिए सुलभ है।

क्रमागत उन्नति

1969 में इंटरनेट की अवधारणा की उत्पत्ति हुई थी और नीचे चर्चा की गई कई तकनीकी और बुनियादी ढाँचे में बदलाव आया है:

इंटरनेट की उत्पत्ति उन्नत अनुसंधान परियोजना एजेंसी नेटवर्क (ARPANET) की अवधारणा से विकसित हुई।

ARPANET को संयुक्त राज्य अमेरिका के रक्षा विभाग द्वारा विकसित किया गया था।

ARPANET का मूल उद्देश्य सरकार के विभिन्न निकायों के बीच संचार प्रदान करना था।

प्रारंभ में, केवल चार नोड थे, जिन्हें औपचारिक रूप से होस्ट कहा जाता था।

1972 में, ARPANET 23 देशों में विभिन्न देशों में स्थित है और इस प्रकार इंटरनेट के रूप में जाना जाता है।

तब तक, नई प्रौद्योगिकियों जैसे कि टीसीपी / आईपी प्रोटोकॉल, डीएनएस, डब्ल्यूडब्ल्यूडब्ल्यू, ब्राउज़र, स्क्रिप्टिंग भाषाओं आदि के आविष्कार के साथ, इंटरनेट ने वेब पर जानकारी प्रकाशित करने और उपयोग करने के लिए एक माध्यम प्रदान किया।

लाभ

इंटरनेट जीवन के लगभग हर पहलू को शामिल करता है, कोई भी सोच सकता है। यहां, हम इंटरनेट के कुछ लाभों पर चर्चा करेंगे:

इंटरनेट हमें दूरस्थ स्थानों पर बैठे लोगों के साथ संवाद करने की अनुमति देता है। वेद पर विभिन्न ऐप उपलब्ध हैं जो संचार के लिए इंटरनेट का उपयोग माध्यम के रूप में करते हैं। विभिन्न सामाजिक नेटवर्किंग साइटें जैसे:

फेसबुक

ट्विटर

याहू

गूगल +

फ़्लिकर

ऑर्कुट

इंटरनेट पर किसी भी तरह की जानकारी के लिए कोई भी व्यक्ति सर्फ कर सकता है। प्रौद्योगिकी, स्वास्थ्य और विज्ञान, सामाजिक अध्ययन, भौगोलिक सूचना, सूचना प्रौद्योगिकी, उत्पाद आदि जैसे विभिन्न विषयों के बारे में जानकारी खोज इंजन की मदद से सर्फ की जा सकती है।

संचार और सूचना के स्रोत के अलावा, इंटरनेट मनोरंजन के लिए भी एक माध्यम है। इंटरनेट पर मनोरंजन के लिए विभिन्न तरीके निम्नलिखित हैं।

ऑनलाइन टेलीविजन

ऑनलाइन खेल

गीत

वीडियो

सोशल नेटवर्किंग ऐप्स

इंटरनेट हमें कई सेवाओं का उपयोग करने की अनुमति देता है जैसे:

इंटरनेट बैंकिंग

वैवाहिक सेवाएं

ऑनलाइन खरीदारी

ऑनलाइन टिकट बुकिंग

ऑनलाइन बिल भुगतान

डेटा साझा करना

ईमेल

इंटरनेट इलेक्ट्रॉनिक कॉमर्स की अवधारणा प्रदान करता है, जो इलेक्ट्रॉनिक सिस्टम पर व्यापार सौदों का संचालन करने की अनुमति देता है

नुकसान

हालाँकि, इंटरनेट ने लगभग हर क्षेत्र में सूचना का एक शक्तिशाली स्रोत होने का दावा किया है, फिर भी नीचे चर्चा की गई कई असमानताएं मौजूद हैं:

हमेशा नाम, पता, क्रेडिट कार्ड नंबर जैसी व्यक्तिगत जानकारी को ढीला करने की संभावना होती है। इसलिए, इस तरह की जानकारी साझा करते समय बहुत सावधानी बरतनी चाहिए। किसी को केवल प्रमाणित साइटों के माध्यम से क्रेडिट कार्ड का उपयोग करना चाहिए।

एक और नुकसान Spamming.Spamming थोक में अवांछित ई-मेल से मेल खाता है। ये ई-मेल बिना किसी उद्देश्य के काम करते हैं और पूरी प्रणाली में बाधा उत्पन्न करते हैं।

वायरस को इंटरनेट से जुड़े कंप्यूटरों में आसानी से फैलाया जा सकता है। इस तरह के वायरस के हमले से आपका सिस्टम क्रैश हो सकता है या आपका महत्वपूर्ण डेटा डिलीट हो सकता है।

साथ ही इंटरनेट पर सबसे बड़ा खतरा पोर्नोग्राफी है। ऐसी कई अश्लील साइटें हैं, जो आपके बच्चों को इंटरनेट का उपयोग करने की अनुमति देती हैं, जो अप्रत्यक्ष रूप से बच्चों के स्वस्थ मानसिक जीवन को प्रभावित करती हैं।

विभिन्न वेबसाइटें हैं जो प्रमाणित जानकारी प्रदान नहीं करती हैं। इससे कई लोगों में गलत धारणा पैदा होती है।

Web Browser

एक वेब ब्राउज़र, या बस "ब्राउज़र", वेबसाइटों को एक्सेस करने और देखने के लिए उपयोग किया जाने वाला एप्लिकेशन है। सामान्य वेब ब्राउज़रों में Microsoft इंटरनेट एक्सप्लोरर, Google क्रोम, मोज़िला फ़ायरफ़ॉक्स और Apple सफारी शामिल हैं।

वेब ब्राउजर का प्राथमिक कार्य HTML को रेंडर करना है, जो कोड वेबपेजों को डिजाइन या "मार्क" करने के लिए उपयोग किया जाता है। जब भी कोई ब्राउज़र किसी वेब पेज को लोड करता है, तो वह HTML को प्रोसेस करता है, जिसमें टेक्स्ट, लिंक और इमेज और अन्य आइटम जैसे कि कैस्केडिंग स्टाइल शीट और जावास्क्रिप्ट फ़ंक्शंस शामिल हो सकते हैं। ब्राउज़र इन वस्तुओं को संसाधित करता है, फिर उन्हें ब्राउज़र विंडो में प्रस्तुत करता है।

प्रारंभिक वेब ब्राउज़र, जैसे मोज़ेक और नेटस्केप नेविगेटर, सरल अनुप्रयोग थे जो HTML, प्रसंस्कृत फॉर्म इनपुट और समर्थित बुकमार्क्स का प्रतिपादन करते थे। चूंकि वेबसाइटें विकसित हो चुकी हैं, इसलिए वेब ब्राउज़र की आवश्यकताएं हैं। आज के ब्राउज़र कहीं अधिक उन्नत हैं, कई प्रकार के HTML (जैसे XHTML और HTML 5), गतिशील जावास्क्रिप्ट और सुरक्षित वेबसाइटों द्वारा उपयोग किए जाने वाले एन्क्रिप्शन का समर्थन करते हैं।

आधुनिक वेब ब्राउज़र की क्षमताएं वेब डेवलपर्स को अत्यधिक इंटरैक्टिव वेबसाइट बनाने की अनुमति देती हैं। उदाहरण के लिए, अजाक्स एक ब्राउज़र को पृष्ठ को फिर से लोड करने की आवश्यकता के बिना वेब पेज पर गतिशील रूप से जानकारी अपडेट करने में सक्षम बनाता है। CSS में अग्रिम ब्राउज़र एक उत्तरदायी वेबसाइट लेआउट और दृश्य प्रभावों की एक विस्तृत सरणी प्रदर्शित करने की अनुमति देता है। कुकीज़ विशिष्ट वेबसाइटों के लिए आपकी सेटिंग्स को याद रखने की अनुमति देती हैं।

जबकि नेटस्केप के बाद से वेब ब्राउज़र तकनीक एक लंबा सफर तय कर चुकी है, ब्राउज़र संगतता समस्याएँ बनी हुई हैं। चूंकि ब्राउज़र विभिन्न रेंडरिंग इंजनों का उपयोग करते हैं, इसलिए वेबसाइट कई ब्राउज़रों में समान नहीं दिखाई दे सकती हैं। कुछ मामलों में, एक वेबसाइट एक ब्राउज़र में ठीक काम कर सकती है, लेकिन दूसरे में ठीक से काम नहीं करती है। इसलिए, अपने कंप्यूटर पर कई ब्राउज़र स्थापित करना स्मार्ट है ताकि आप यदि आवश्यक हो तो एक वैकल्पिक ब्राउज़र का उपयोग कर सकें।

Web search engine

एक वेब सर्च इंजन या इंटरनेट सर्च इंजन एक सॉफ्टवेयर सिस्टम है, जिसे वेब सर्च (इंटरनेट सर्च) को अंजाम देने के लिए बनाया गया है, जिसका मतलब है कि वर्ल्ड वाइड वेब को एक व्यवस्थित वेब सर्च क्वेरी में निर्दिष्ट विशेष जानकारी के लिए व्यवस्थित तरीके से सर्च करना। खोज परिणाम आमतौर पर परिणामों की एक पंक्ति में प्रस्तुत किए जाते हैं, जिन्हें अक्सर खोज इंजन परिणाम पृष्ठों (SERPs) के रूप में संदर्भित किया जाता है। जानकारी वेब पेज, चित्र, वीडियो, इन्फोग्राफिक्स, लेख, शोध पत्र और अन्य प्रकार की फ़ाइलों के लिंक का मिश्रण हो सकती है। कुछ सर्च इंजन डेटाबेस या ओपन डायरेक्टरी में उपलब्ध डेटा को भी माइन करते हैं। वेब निर्देशिकाओं के विपरीत, जो केवल मानव संपादकों द्वारा बनाए रखी जाती हैं, खोज इंजन भी वेब क्रॉलर पर एक एल्गोरिथ्म चलाकर वास्तविक समय की जानकारी को बनाए रखते हैं। इंटरनेट सामग्री जो वेब खोज इंजन द्वारा खोजे जाने में सक्षम नहीं है, उसे आमतौर पर गहरी वेब के रूप में वर्णित किया जाता है।

Timeline (full list)
Year	Engine	Current status
1993	W3Catalog	Active
	Aliweb	Active
	JumpStation	Inactive
	WWW Worm	Inactive
1994	WebCrawler	Active
	Go.com	Inactive, redirects to Disney
	Lycos	Active
	Infoseek	Inactive, redirects to Disney
1995	Yahoo! Search	Active, initially a search function for Yahoo! Directory
	Daum	Active
	Magellan	Inactive
	Excite	Active
	SAPO	Active
	MetaCrawler	Active
	AltaVista	Inactive, acquired by Yahoo! in 2003, since 2013 redirects to Yahoo!
1996	RankDex	Inactive, incorporated into Baidu in 2000
	Dogpile	Active, Aggregator
	Inktomi	Inactive, acquired by Yahoo!
	HotBot	Active
	Ask Jeeves	Active (rebranded ask.com)
1997	AOL NetFind	Active (rebranded AOL Search since 1999)
	Northern Light	Inactive
	Yandex	Active
1998	Google	Active
	Ixquick	Active as Startpage.com
	MSN Search	Active as Bing
	empas	Inactive (merged with NATE)
1999	AlltheWeb	Inactive (URL redirected to Yahoo!)
	GenieKnows	Active, rebranded Yellowee (redirection to justlocalbusiness.com)
	Naver	Active
	Teoma	Active (© APN, LLC)
2000	Baidu	Active
	Exalead	Inactive
	Gigablast	Active
2001	Kartoo	Inactive
2003	Info.com	Active
2003	Scroogle	Inactive
2004	A9.com	Inactive
	Clusty	Active (as Yippy)
	Mojeek	Active
	Sogou	Active
2005	SearchMe	Inactive
2005	KidzSearch	Active, Google Search
2006	Soso	Inactive, merged with Sogou
	Quaero	Inactive
	Search.com	Active
	ChaCha	Inactive
	Ask.com	Active
	Live Search	Active as Bing, rebranded MSN Search
2007	wikiseek	Inactive
	Sproose	Inactive
	Wikia Search	Inactive
	Blackle.com	Active, Google Search
2008	Powerset	Inactive (redirects to Bing)
	Picollator	Inactive
	Viewzi	Inactive
	Boogami	Inactive
	LeapFish	Inactive
	Forestle	Inactive (redirects to Ecosia)
	DuckDuckGo	Active
2009	Bing	Active, rebranded Live Search
	Yebol	Inactive
	Mugurdy	Inactive due to a lack of funding
	Scout (Goby)	Active
	NATE	Active
	Ecosia	Active
	Startpage.com	Active, sister engine of Ixquick
2010	Blekko	Inactive, sold to IBM
	Cuil	Inactive
	Yandex (English)	Active
	Parsijoo	Active
2011	YaCy	Active, P2P
2012	Volunia	Inactive
2013	Qwant	Active
2014	Egerin	Active, Kurdish / Sorani
2014	Swisscows	Active
2015	Yooz	Active
2015	Cliqz	Active, Browser integrated
2016	Kiddle	Active, Google Search

एक खोज इंजन निकट वास्तविक समय में निम्नलिखित प्रक्रियाओं को बनाए रखता है:

1 वेब क्रॉलिंग

2 इंडेक्सिंग

वेब सर्च इंजन अपनी जानकारी वेब साइट से साइट पर क्रॉल करके प्राप्त करते हैं। मानक फ़ाइल नाम robots.txt के लिए "मकड़ी" जांच करता है, इसे संबोधित किया जाता है। Robots.txt फ़ाइल में खोज मकड़ियों के लिए निर्देश हैं, जिसमें यह बताया गया है कि कौन से पृष्ठ क्रॉल करने के लिए हैं। Robots.txt की जाँच करने के बाद या तो इसे खोजा जा सकता है या नहीं, मकड़ी कुछ सूचनाओं को कई कारकों, जैसे शीर्षक, पृष्ठ सामग्री, जावास्क्रिप्ट, कैस्केडिंग स्टाइल शीट्स (सीएसएस), शीर्षकों या उसके मेटाडेटा के आधार पर अनुक्रमित होने के लिए वापस भेजती है। HTML मेटा टैग। एक निश्चित संख्या में पृष्ठों के क्रॉल होने के बाद, डेटा का अनुक्रमित या वेबसाइट पर बिताया गया समय, मकड़ी रेंगना बंद कर देती है और आगे बढ़ जाती है। " ओ वेब क्रॉलर वास्तव में पूरी तरह से उपलब्ध वेब को क्रॉल कर सकता है। अनंत वेबसाइटों, मकड़ी के जाल, स्पैम और वास्तविक वेब के अन्य कारणों के कारण, क्रॉलर्स एक क्रॉल नीति लागू करते हैं यह निर्धारित करने के लिए कि किसी साइट के क्रॉलिंग को कब समझा जाना चाहिए? पर्याप्त। कुछ वेबसाइटों को पूरी तरह से क्रॉल किया जाता है, जबकि अन्य को केवल आंशिक रूप से क्रॉल किया जाता है।

'वेब सर्वर' की परिभाषा

परिभाषा: एक वेब सर्वर एक कंप्यूटर है जो वेबसाइटों को चलाता है। यह एक कंप्यूटर प्रोग्राम है जो वेब पेज वितरित करता है क्योंकि वे अपेक्षित हैं। वेब सर्वर का मूल उद्देश्य उपयोगकर्ताओं के लिए वेब पेजों को संग्रहीत, संसाधित और वितरित करना है। यह इंटर कम्यूनिकेशन हाइपरटेक्स्ट ट्रांसफर प्रोटोकॉल (HTTP) का उपयोग करके किया जाता है। ये वेब पेज ज्यादातर स्टैटिक कंटेंट होते हैं जिनमें HTML डॉक्यूमेंट, इमेज, स्टाइल शीट, टेस्ट आदि शामिल होते हैं। HTTP के अलावा, एक वेब सर्वर एसएमटीपी (सिंपल मेल ट्रांसफर प्रोटोकॉल) और एफ़टीपी (फाइल ट्रांसफर प्रोटोकॉल) प्रोटोकॉल को ईमेल करने और फाइल ट्रांसफर के लिए भी सपोर्ट करता है। और भंडारण।

विवरण: वेब सर्वर का मुख्य काम वेबसाइट की सामग्री को प्रदर्शित करना है। यदि किसी वेब सर्वर को जनता के सामने नहीं लाया जाता है और आंतरिक रूप से उपयोग किया जाता है, तो इसे इंट्रानेट सर्वर कहा जाता है। जब कोई वेब ब्राउज़र (जैसे क्रोम या फ़ायरफ़ॉक्स) एड्रेस बार (जैसे www.economictimes.com) पर URL या वेब एड्रेस जोड़कर वेबसाइट के लिए अनुरोध करता है, तो ब्राउज़र उसके लिए संबंधित वेब पेज को देखने के लिए इंटरनेट पर एक अनुरोध भेजता है पता। एक डोमेन नेम सर्वर (DNS) इस URL को एक IP एड्रेस (उदाहरण के लिए 192.168.216.345) में परिवर्तित करता है, जो बदले में एक वेब सर्वर को इंगित करता है।

वेब सर्वर से सामग्री वेबसाइट को उपयोगकर्ता के ब्राउज़र में प्रस्तुत करने का अनुरोध किया जाता है। इंटरनेट पर सभी वेबसाइटों के पास आईपी पते के संदर्भ में एक विशिष्ट पहचानकर्ता है। यह इंटरनेट प्रोटोकॉल एड्रेस इंटरनेट में विभिन्न सर्वरों के बीच संचार करने के लिए उपयोग किया जाता है। इन दिनों, Apache सर्वर बाजार में उपलब्ध सबसे आम वेब सर्वर है। अपाचे एक ओपन सोर्स सॉफ्टवेयर है जो आज उपलब्ध सभी वेबसाइटों का लगभग 70 प्रतिशत संभालता है। अधिकांश वेब-आधारित अनुप्रयोग Apache को उनके डिफ़ॉल्ट वेब सर्वर वातावरण के रूप में उपयोग करते हैं। एक अन्य वेब सर्वर जो आम तौर पर उपलब्ध होता है वह है इंटरनेट सूचना सेवा (IIS)। IIS Microsoft के स्वामित्व में है।

Menu

Introduction to WWW, Concept of Internet, Web Browsers, internet servers and search engines.

No comments:

Post a Comment