Introduction to WWW, Concept of Internet, Web Browsers, internet servers and search engines.


Introduction to WWW
विश्व व्यापी वेब(जिसे सामान्यत: वेब कहा जाता है) आपस में परस्पर जुड़े हाइपरटेक्स्ट दस्तावेजों को इन्टरनेट द्वारा प्राप्त करने की प्रणाली है। एक वेब ब्राउजर की सहायता से हम उन वेब पन्नों को देख सकते हैं जिनमें टेक्स्ट, छवि (image), वीडियो, एंवं अन्य मल्टीमीडिया होते हैं तथा हाइपरलिंक की सहायता से उन पन्नों के बीच में आवागमन कर सकते है। विश्व व्यापी वेब को टिम बर्नर्स ली द्वारा 1989 में यूरोपीय नाभिकीय अनुसंधान संगठन जो की जेनेवा, स्वीट्ज़रलैंड में है, में काम करते वक्त बनाया गया था और 1992 में जारी किया गया था। उसके बाद से बरनर्स-ली नें वेब के स्तरों के विकास (जैसे की मार्कअप भाषाएँ जिनमें की वेब पन्ने लिखे जाते हैं) में एक सक्रीय भूमिका अदा की है और हाल के वर्षों में उन्होनें सीमेंटिक (अर्थ) वेब (Semantic Web) विकसित करने के अपने स्वप्न की वकालत की है।

वेब कैसे काम करता है

विश्व व्यापी वेब पर एक वेब पन्ने को देखने की शुरुआत सामान्यत: वेब ब्राउजर में उसका यूआरएल लिख कर अथवा उस पन्ने या संसाधन के हाइपरलिंक का पीछा करते हुए होती है। तब उस पन्ने को ढूंढ कर प्रर्दशित करने के लिए वेब ब्राउजर अंदर ही अंदर संचार संदेशों की एक श्रृंखला आरंभ करता है।

सबसे पहले यूआरएल के सर्वर-नाम वाले हिस्से को विश्व में वितरित इन्टरनेट डाटा-बेस, जिसे डोमेन नाम प्रणाली के नाम से जाना जाता है, की सहायता से आईपी पते में परिवर्तित कर दिया जाता है। वेब सर्वर से संपर्क साधने और डाटा पैकेट भेजने के लिए ये आईपी पता जरुरी है।

उसके बाद ब्राउजर वेब सर्वर के उस विशिष्ट पते पर हाइपरटेक्स्ट ट्रांसफर प्रोटोकॉल की प्रार्थना भेज कर रिसोर्स से अनुरोध करता है। एक आम वेब पन्ने की बात करें तो, वेब ब्राउजर सबसे पहले उस पन्ने के एच.टी.एम.एल. टेक्स्ट के लिए अनुरोध करता है और तुंरत ही उसका पदच्छेद कर देता है। उसके बाद वेब ब्राउजर पुनः अनुरोध करता है उन छवियों और संचिकाओं के लिए जो उस पन्ने के भाग हैं। एक वेबसाइट की लोकप्रियता सामान्यत: इस बात से मापी जाती है कि कितनी बार उसके पन्नों को देखा गया या कितनी बार उसके सर्वर को हिट किया गया या फिर कितनी बार उसकी संचिकाओं के लिए अनुरोध किया गया।

वेब सेवक से आवश्यक संचिकाएँ प्राप्त करने के बाद ब्राउज़र उस पन्ने को स्क्रीन पर एच.टी.एम.एल., कैस्केडिंग स्टाइल शीट्स एंवं अन्य वेब भाषाओँ के निर्देश के अनुसार प्रर्दशित करता है। जिस वेब पन्ने को हम स्क्रीन पर देखते हैं उसके निर्माण के लिए अन्य छवियों एंवं संसाधनों का भी इस्तेमाल होता है।

अधिकांश वेब पृष्ठों में उनसे संबंधित अन्य पृष्ठों और शायद डाउनलोड करने लायक वस्तु, स्रोत दस्तावेजों, परिभाषाएँ और अन्य वेब संसाधनों के हाइपरलिंक स्वयं शामिल होंगे। इस उपयोगी और सम्बंधित संसाधनों के समागम को, जो की आपस में हाइपरटेक्स्ट लिंक के द्वारा जुड़े हुए हों, को जानकारी का "वेब" कहा गया। इसको इन्टरनेट पर उपलब्ध कराने को टिम बर्नर्स ली नें सर्वप्रथम 1990 में विश्वव्यापीवेब का नाम दिया।

इतिहास

वेब की उत्पत्ति के अन्तर्निहित विचारों के लक्षण 1980 में मिलने शुरू हो गए थे जब सर्न में टिम बरनर्स-ली नें एंक्वाइयर (ENQUIRE) की रचना की थी (यहाँ उनका इशारा एक किताब, एंक्वाइयर विदिन अपॉन एव्री-थिंग (Enquire Within Upon Everything), की तरफ़ था जो उन्होनें बचपन में पढ़ी थी। हालाँकि आज इस्तेमाल होने वाली प्रणाली से ये भिन्न था लेकिन इसके मूल विचार काफी हद तक सामान थे (यहाँ तक की विश्व व्यापी वेब के बाद की परियोजना सीमेंटिक वेब (Semantic Web) के विचार भी)

मार्च 1989 में टिम बरनर्स-ली नें एक प्रस्ताव लिखा जिसमें एंक्वाइयर का जिक्र किया गया और एक अधिक विस्तृत सूचना प्रणाली का वर्णन किया गया। रॉबर्ट कैल्लिअउ (Robert Cailliau) की मदद से उन्होनें नवम्बर 12, 1990[3] में विश्व व्यापी वेब का एक अधिक औपचारिक प्रस्ताव प्रकाशित किया। इसका आदर्श नमूना EBT के DYNATEXT SGML रीडर, जिसे की सर्न द्वारा अनुबंधित किया गया था, द्वारा प्रदान किया गया था। EBT(इलेक्ट्रॉनिक बुक टेक्नोलॉजी, जिसका विकास ब्राउन यूनिवर्सिटी के इंस्टिट्यूट फॉर रिसर्च इन इन्फोर्मेशन एंड स्कॉलरशिप द्वारा किया गया था)। हालाँकि ये DYNATEXT (Dynatext) (HYTIME (HyTime) के अंतर्गत SGML ISO 8879:1986 के हाइपरमीडिया में विस्तार में इसका मुख्य योगदान था) प्रणाली काफी उच्च तकनीक की मानी जाती थी, परन्तु इसे बहुत महंगा समझा जाता था और HEP(हाई एनर्जी फिजिक्स) के समाज के इस्तेमाल के लिए जो लाइसेंसिंग नीति थी उसे भी अनुचित समझा जाता था।

नेक्स्ट क्यूब (NeXTcube) का इस्तेमाल बरनर्स-ली द्वारा 1990 में दुनिया के पहले वेब सर्वर की तरह और पहले वेब ब्राउजर, वर्ल्ड वाइड वेब, को लिखने के लिए किया गया था। 1990 के क्रिसमस तक बरनर्स-ली ने एक चालू वेब के लिए आवश्यक सभी उपकरणों का निर्माण कर लिया था:[4]पहला वेब ब्राउजर (जो की एक अच्छा वेब संपादक भी था), पहला वेब सेवक और प्रथम वेब पृष्ठ[5] जो इस परियोजना का वर्णन करते थे।

6 अगस्त 1991 को उन्होंने विश्व व्यापी वेब परियोजना का एक संक्षिप्त सार alt.hypertext न्यूज़ग्रुप (newsgroup)[6] पर पोस्ट किया था। इस तिथि को वेब के इंटरनेट पर एक सार्वजनिक रूप से उपलब्ध सेवा के शुरुआत के रूप में भी याद किया जाता है।

यूरोप के बाहर पहला सर्वर SLAC (SLAC) में दिसम्बर 1991 में बनाया गया था

हाइपरटेक्स्ट जैसे महत्त्वपूर्ण बुनियादी विचार की उत्पत्ति 1960 की पुरानी परियोजनाओं (जैसे की ब्राउन यूनिवर्सिटी का हाइपरटेक्स्ट एडिटिंग सिस्टम, HES) से ही हो गई थी- टेड नेल्सन (Ted Nelson) और एंड्रियस वेन डेम (Andries van Dam)- टेड नेल्सन (Ted Nelson) की परियोजना ज़नाडू (Project Xanadu) और डगलस एन्गेल्बर्ट (Douglas Engelbart) की ऑन-लाइन सिस्टम्स (oN-Line System) (NLS).दोनों नेल्सन और एन्गेल्बर्ट को वन्नेवर बुश (Vannevar Bush) की माइक्रोफिल्म (microfilm) पर आधारित "मेमेक्स (memex)" से प्रेरणा मिली थी, जिसका वर्णन 1945 के एक निबंध में इस प्रकार किया गया था " जैसा हम सोंचें (As We May Think)"

बेर्नेर्स-ली की एक बड़ी सफलता थी हाइपरटेक्सट और इन्टरनेट का आपस में मेल कराना.अपनी किताब वीविंग द वेब में उन्होंने वर्णन किया है कि कैसे उन्होंने बार बार दोनों तकनीकी समुदायों के सदस्यों को ये सुझाव दिया था की इन दोनों तकनीकों का आपस में मेल हो सकता है, लेकिन किसी ने उनका न्योता स्वीकार नहीं किया और अंत में इस परियोजना में उन्हें स्वयं हाँथ डालना पड़ा। वेब और अन्य जगहों पर इस्तेमाल होने वाले संसाधनों की विश्व में एकमात्र पहचान वाली प्रणाली विकसित की: यूनिफ़ॉर्म रिसोर्स अभिज्ञापक।

वेब में उस समय मौजूद अन्य हाइपरटेक्स्ट प्रणालियों से काफी सारी भिन्नाताएँ थीं। वेब में दो दिशाओं की कड़ियों की बजाय केवल एक दिशा वाली कड़ियों की आवश्यकता थी। यदि किसी को किसी संसाधन से जुड़ना हो, बिना उस संसाधन के मालिक की मदद के, तो ये भी सम्भव हो गया। पहले की प्रणालियों की तुलना में इसने वेब ब्राउज़र्स और सर्वरों को लागू करने में आने वाली दिक्कतों को काफी हद तक कम कर दिया। लेकिन बदले में लिंक रोट (link rot) की भीषण समस्या को पैदा का दिया। पूर्वाधिकारीयों, जैसे की हाइपर कार्ड (HyperCard), की तुलना में ये वेब गैर मालिकाना था। जिससे की लाईसेन्स प्रतिबंधों के बिना ही सर्वरों और ग्राहकों को स्वतंत्र रूप से विकसित करना और अन्य विस्तारों को जोड़ना सम्भव हो गया।

30 अप्रैल 1993 को सर्न ने घोषणा की कि विश्व व्यापी वेब सबके लिए निःशुल्क होगा और कोई शुल्क बकाया नहीं रहेगा। गोफर (Gopher) प्रोटोकॉल कि इस घोषणा कि अब उसकी सेवा निःशुल्क नहीं है, लोगों का रुझान बहुत तेज़ी से गोफर की बजाय वेब की तरफ़ हो गया। ViolaWWW (ViolaWWW) एक शुरुआती लोकप्रिय वेब ब्राउसर था, जो कि हाइपर कार्ड (HyperCard) पर आधारित था।

विद्वान आमतौर पर इस बात से सहमत हैं कि विश्व व्यापी वेब के जीवन में नया मोड़ (turning point) 1993 में मोजेक (Mosaic) वेब ब्राउज़र के आने के साथ शुरू हुआ, इस सुचित्रित ब्राउज़र का विकास अर्बाना शम्पैग्न के इलिनोइस विश्वविद्यालय (University of Illinois at Urbana-Champaign) के सुपरकंप्यूटिंग के अनुप्रयोगों के लिए राष्ट्रीय केन्द्र (National Center for Supercomputing Applications) (NCSA-UIUC) के एक दल द्वारा मार्क एंड्रिस्सें (Marc Andreessen) कि अगुवाई में किया गया। मोज़ेक के लिए अनुदान उच्च निष्पादन कम्प्यूटिंग और संचार पहल की तरफ़ से आया, ये एक वित्त पोषण कार्यक्रम था जिसकी शुरुआत उच्च निष्पादन कम्प्यूटिंग और संचार अधिनियम 1991 (High Performance Computing and Communication Act of 1991) के तहत हुई थी। ये सेनेटर अल गोर[11] द्वारा शुरू किए गए अनेकों कंप्यूटिंग विकास (several computing developments) के कार्यक्रमों में से एक था। मोजैक के बाहर आने से पहले चित्रित (ग्राफिक्स) और लिखित शब्दों का मिश्रण वेब पन्नों पर आम तौर पर नहीं होता था और इसकी लोकप्रियता इन्टनेट के पुराने प्रोटोकॉलों, जैसे की गोफर (Gopher) और वाइड एरिया इन्फोर्मेशन सर्वर्स (Wide Area Information Servers)(WAIS), से कम थी। मोजैक अब तक का सबसे लोकप्रिय इन्टरनेट प्रोटोकॉल इसके चित्रमय उपयोगकर्ता इंटरफ़ेस की वजह से बना।

विश्व व्यापी वेब संघ के टिम बेर्नेर्स-ली द्वारा अक्टूबर 1994 में यूरोपीय संगठन परमाणु अनुसंधान (सर्न) छोड़ने के बाद स्थापित किया गया था। इसकी स्थापना मसाचुसेट्स तकनीकी संस्थान की कंप्यूटर विज्ञान की प्रयोगशाला में रक्षा उन्नत अनुसंधान परियोजनाओं एजेंसी (Defense Advanced Research Projects Agency) (DARPA) समर्थन से की गई थी - जिसने इन्टनेट और यूरोपीय आयोग (European Commission) की शुरुआत की थी।

साहित्य में इतिहास

घर में स्थापित वैश्विक सूचना प्रणाली का विचार को कम से कम इसाक असिमोव (Isaac Asimov) की मार्च 1959 की लघु कहानी "एनिवर्सरी" अमेजिंग स्टोरीज (Amazing Stories) तक पीछे खिंचा जा सकता है। इसमें पात्र "मल्टीवाक (Multivac) आउटलेट" नामक एक होम कंप्यूटर के द्वारा जानकारी प्राप्त करते हैं। ये ग्रह कंप्यूटर पूरे ग्रह पर फैले सर्किट्स के एक जाल द्वारा एक मील लंबे सुपर कंप्यूटर से जुडा हुआ था, जो की पृथ्वी के अंदर कहीं स्थापित था। एक चरित्र अपने बच्चों के लिए एक मल्टीवाक, जूनियर मॉडल स्थापित करने की सोच रहा है।

इस कहानी में भविष्य के उस समय की कल्पना की गई जब व्यावसायिक अंतरिक्ष यात्रा एक आम बात होगी, फ़िर भी मशीन उत्तर को एक टेप की पर्ची पर प्रिंट करती है जो की किसी खाने में से बाहर आता है- कोई विडियो दिखाई नहीं देता है- और कंप्यूटर का मालिक कहता है कि उसने इतना खर्चा इसलिए तो नहीं किया था की उसे एक मल्टीवाक आउटलेट मिले जो सिर्फ़ बोलता हो।

मानक
विश्व व्यापी वेब, इंटरनेट और कंप्यूटर जानकारी विनिमय के विभिन्न पहलुओं के संचालन को कई औपचारिक मानक और अन्य तकनीकी विशेषताएं परिभाषित करती हैं। कई दस्तावेजों को विश्व व्यापी वेब संघ (W3C) ने बरनर्स-ली के नेतृत्व में बनाया है, लेकिन कुछ अन्य को इंटरनेट इंजीनियरिंग टास्क फोर्स (Internet Engineering Task Force) (IETF) और अन्य संगठनों द्वारा बनाया गया है।

आमतौर पर, जब वेब मानकों पर चर्चा होती है तब निम्नलिखित प्रकाशनों मूलभूत के रूप में देखा जाता है:

W3C की तरफ़ से मार्कउप भाषाओँ (markup languages)- खासकर HTML और XHTML (XHTML)- के लिए सलाह.ये हाइपरटेक्स्ट (hypertext) दस्तावेजों की संरचना और व्याख्या को परिभाषित करती हैं।
1 W3C की तरफ़ से स्टाइलशीट (stylesheets), खासकर CSS (CSS), के लिए सलाह।
2 ECMA (ECMAScript) स्क्रिप्ट के मानक (सामान्यत: जावा स्क्रिप्ट के रूप में), द्वारा Ecma अंतर्राष्ट्रीय (Ecma International)
3 दस्तावेज़ ऑब्जेक्ट मॉडल (Document Object Model) के लिए अनुशंसाएँ, W3C से।
अतिरिक्त प्रकाशन विश्व व्यापी वेब की अन्य आवश्यक तकनीकों की परिभाषा प्रदान करते हैं, जिनमें निम्नलिखित (परन्तु इसी तक सीमित नहीं) शामिल हैं:

यूनिफ़ॉर्म रिसोर्स पहचानकर्ता (यूआरआइ (URI)), जो की इन्टरनेट पर संसाधनों, जैसे की हायपरटेक्स्ट दस्तावेज़ और तस्वीरें, को संदर्भित करने की एक सार्वभौमिक प्रणाली है। यूआरआइ, जिन्हें की अक्सर URL भी कहा जाता है, IETF's RFC 3986 / STD 66 द्वारा परिभाषित किए जाते हैं: यूनिफ़ॉर्म रिसोर्स आइडेंटिफाइयर (यूआरआइ): जेनेरिक सिंटेक्स , साथ ही अपने पूर्ववर्ती तथा अनेकों यूआरआइ योजना (URI scheme)-परिभाषित RFC (RFCs);
हायपर टेक्स्ट ट्रांसफर प्रोटोकॉल (HTTP), खासतौर पर RFC 2616 द्वारा परिभाषित: एचटीटीपी/१.1 तथा RFC २६१७: एचटीटीपी प्रमाणीकरण, जो ये बताते हैं कि ब्राउज़र और सर्वर कैसे एक दूसरे को प्रमाणित करते हैं।

इंटरनेट
वेब पर सूचना तक पहुँचने के लिए इंटरनेट को सूचना सुपर राजमार्ग के रूप में परिभाषित किया गया है। हालाँकि, इसे कई तरीकों से परिभाषित किया जा सकता है:

1 इंटरनेट इंटरकनेक्टेड कंप्यूटर नेटवर्क की एक विश्वव्यापी वैश्विक प्रणाली है।

2 इंटरनेट मानक इंटरनेट प्रोटोकॉल (टीसीपी / आईपी) का उपयोग करता है।

3 इंटरनेट के प्रत्येक कंप्यूटर की पहचान एक विशिष्ट IP पते से होती है।

4 IP पता संख्याओं का एक अनूठा सेट है (जैसे 110.22.33.114) जो कंप्यूटर स्थान की पहचान करता है।

5 IP पते को नाम देने के लिए एक विशेष कंप्यूटर DNS (डोमेन नाम सर्वर) का उपयोग किया जाता है ताकि उपयोगकर्ता एक नाम से कंप्यूटर का पता लगा सके।

उदाहरण के लिए, एक DNS सर्वर एक विशेष आईपी पते के लिए http://www.compusang.blogspot.com नाम का निराकरण करेगा, जिस पर यह वेबसाइट होस्ट की गई है।

पूरी दुनिया में इंटरनेट हर उपयोगकर्ता के लिए सुलभ है।

क्रमागत उन्नति
1969 में इंटरनेट की अवधारणा की उत्पत्ति हुई थी और नीचे चर्चा की गई कई तकनीकी और बुनियादी ढाँचे में बदलाव आया है:

इंटरनेट की उत्पत्ति उन्नत अनुसंधान परियोजना एजेंसी नेटवर्क (ARPANET) की अवधारणा से विकसित हुई।

ARPANET को संयुक्त राज्य अमेरिका के रक्षा विभाग द्वारा विकसित किया गया था।

ARPANET का मूल उद्देश्य सरकार के विभिन्न निकायों के बीच संचार प्रदान करना था।

प्रारंभ में, केवल चार नोड थे, जिन्हें औपचारिक रूप से होस्ट कहा जाता था।

1972 में, ARPANET 23 देशों में विभिन्न देशों में स्थित है और इस प्रकार इंटरनेट के रूप में जाना जाता है।

तब तक, नई प्रौद्योगिकियों जैसे कि टीसीपी / आईपी प्रोटोकॉल, डीएनएस, डब्ल्यूडब्ल्यूडब्ल्यू, ब्राउज़र, स्क्रिप्टिंग भाषाओं आदि के आविष्कार के साथ, इंटरनेट ने वेब पर जानकारी प्रकाशित करने और उपयोग करने के लिए एक माध्यम प्रदान किया।

लाभ
इंटरनेट जीवन के लगभग हर पहलू को शामिल करता है, कोई भी सोच सकता है। यहां, हम इंटरनेट के कुछ लाभों पर चर्चा करेंगे:

इंटरनेट हमें दूरस्थ स्थानों पर बैठे लोगों के साथ संवाद करने की अनुमति देता है। वेद पर विभिन्न ऐप उपलब्ध हैं जो संचार के लिए इंटरनेट का उपयोग माध्यम के रूप में करते हैं। विभिन्न सामाजिक नेटवर्किंग साइटें जैसे:

फेसबुक

ट्विटर

याहू

गूगल +

फ़्लिकर

ऑर्कुट

इंटरनेट पर किसी भी तरह की जानकारी के लिए कोई भी व्यक्ति सर्फ कर सकता है। प्रौद्योगिकी, स्वास्थ्य और विज्ञान, सामाजिक अध्ययन, भौगोलिक सूचना, सूचना प्रौद्योगिकी, उत्पाद आदि जैसे विभिन्न विषयों के बारे में जानकारी खोज इंजन की मदद से सर्फ की जा सकती है।

संचार और सूचना के स्रोत के अलावा, इंटरनेट मनोरंजन के लिए भी एक माध्यम है। इंटरनेट पर मनोरंजन के लिए विभिन्न तरीके निम्नलिखित हैं।

ऑनलाइन टेलीविजन

ऑनलाइन खेल

गीत

वीडियो

सोशल नेटवर्किंग ऐप्स

इंटरनेट हमें कई सेवाओं का उपयोग करने की अनुमति देता है जैसे:

इंटरनेट बैंकिंग

वैवाहिक सेवाएं

ऑनलाइन खरीदारी

ऑनलाइन टिकट बुकिंग

ऑनलाइन बिल भुगतान

डेटा साझा करना

ईमेल

इंटरनेट इलेक्ट्रॉनिक कॉमर्स की अवधारणा प्रदान करता है, जो इलेक्ट्रॉनिक सिस्टम पर व्यापार सौदों का संचालन करने की अनुमति देता है

नुकसान
हालाँकि, इंटरनेट ने लगभग हर क्षेत्र में सूचना का एक शक्तिशाली स्रोत होने का दावा किया है, फिर भी नीचे चर्चा की गई कई असमानताएं मौजूद हैं:

हमेशा नाम, पता, क्रेडिट कार्ड नंबर जैसी व्यक्तिगत जानकारी को ढीला करने की संभावना होती है। इसलिए, इस तरह की जानकारी साझा करते समय बहुत सावधानी बरतनी चाहिए। किसी को केवल प्रमाणित साइटों के माध्यम से क्रेडिट कार्ड का उपयोग करना चाहिए।

एक और नुकसान Spamming.Spamming थोक में अवांछित ई-मेल से मेल खाता है। ये ई-मेल बिना किसी उद्देश्य के काम करते हैं और पूरी प्रणाली में बाधा उत्पन्न करते हैं।

वायरस को इंटरनेट से जुड़े कंप्यूटरों में आसानी से फैलाया जा सकता है। इस तरह के वायरस के हमले से आपका सिस्टम क्रैश हो सकता है या आपका महत्वपूर्ण डेटा डिलीट हो सकता है।

साथ ही इंटरनेट पर सबसे बड़ा खतरा पोर्नोग्राफी है। ऐसी कई अश्लील साइटें हैं, जो आपके बच्चों को इंटरनेट का उपयोग करने की अनुमति देती हैं, जो अप्रत्यक्ष रूप से बच्चों के स्वस्थ मानसिक जीवन को प्रभावित करती हैं।

विभिन्न वेबसाइटें हैं जो प्रमाणित जानकारी प्रदान नहीं करती हैं। इससे कई लोगों में गलत धारणा पैदा होती है।
Web Browser

एक वेब ब्राउज़र, या बस "ब्राउज़र", वेबसाइटों को एक्सेस करने और देखने के लिए उपयोग किया जाने वाला एप्लिकेशन है। सामान्य वेब ब्राउज़रों में Microsoft इंटरनेट एक्सप्लोरर, Google क्रोम, मोज़िला फ़ायरफ़ॉक्स और Apple सफारी शामिल हैं।

वेब ब्राउजर का प्राथमिक कार्य HTML को रेंडर करना है, जो कोड वेबपेजों को डिजाइन या "मार्क" करने के लिए उपयोग किया जाता है। जब भी कोई ब्राउज़र किसी वेब पेज को लोड करता है, तो वह HTML को प्रोसेस करता है, जिसमें टेक्स्ट, लिंक और इमेज और अन्य आइटम जैसे कि कैस्केडिंग स्टाइल शीट और जावास्क्रिप्ट फ़ंक्शंस शामिल हो सकते हैं। ब्राउज़र इन वस्तुओं को संसाधित करता है, फिर उन्हें ब्राउज़र विंडो में प्रस्तुत करता है।

प्रारंभिक वेब ब्राउज़र, जैसे मोज़ेक और नेटस्केप नेविगेटर, सरल अनुप्रयोग थे जो HTML, प्रसंस्कृत फॉर्म इनपुट और समर्थित बुकमार्क्स का प्रतिपादन करते थे। चूंकि वेबसाइटें विकसित हो चुकी हैं, इसलिए वेब ब्राउज़र की आवश्यकताएं हैं। आज के ब्राउज़र कहीं अधिक उन्नत हैं, कई प्रकार के HTML (जैसे XHTML और HTML 5), गतिशील जावास्क्रिप्ट और सुरक्षित वेबसाइटों द्वारा उपयोग किए जाने वाले एन्क्रिप्शन का समर्थन करते हैं।

आधुनिक वेब ब्राउज़र की क्षमताएं वेब डेवलपर्स को अत्यधिक इंटरैक्टिव वेबसाइट बनाने की अनुमति देती हैं। उदाहरण के लिए, अजाक्स एक ब्राउज़र को पृष्ठ को फिर से लोड करने की आवश्यकता के बिना वेब पेज पर गतिशील रूप से जानकारी अपडेट करने में सक्षम बनाता है। CSS में अग्रिम ब्राउज़र एक उत्तरदायी वेबसाइट लेआउट और दृश्य प्रभावों की एक विस्तृत सरणी प्रदर्शित करने की अनुमति देता है। कुकीज़ विशिष्ट वेबसाइटों के लिए आपकी सेटिंग्स को याद रखने की अनुमति देती हैं।

जबकि नेटस्केप के बाद से वेब ब्राउज़र तकनीक एक लंबा सफर तय कर चुकी है, ब्राउज़र संगतता समस्याएँ बनी हुई हैं। चूंकि ब्राउज़र विभिन्न रेंडरिंग इंजनों का उपयोग करते हैं, इसलिए वेबसाइट कई ब्राउज़रों में समान नहीं दिखाई दे सकती हैं। कुछ मामलों में, एक वेबसाइट एक ब्राउज़र में ठीक काम कर सकती है, लेकिन दूसरे में ठीक से काम नहीं करती है। इसलिए, अपने कंप्यूटर पर कई ब्राउज़र स्थापित करना स्मार्ट है ताकि आप यदि आवश्यक हो तो एक वैकल्पिक ब्राउज़र का उपयोग कर सकें।
Web search engine

एक वेब सर्च इंजन या इंटरनेट सर्च इंजन एक सॉफ्टवेयर सिस्टम है, जिसे वेब सर्च (इंटरनेट सर्च) को अंजाम देने के लिए बनाया गया है, जिसका मतलब है कि वर्ल्ड वाइड वेब को एक व्यवस्थित वेब सर्च क्वेरी में निर्दिष्ट विशेष जानकारी के लिए व्यवस्थित तरीके से सर्च करना। खोज परिणाम आमतौर पर परिणामों की एक पंक्ति में प्रस्तुत किए जाते हैं, जिन्हें अक्सर खोज इंजन परिणाम पृष्ठों (SERPs) के रूप में संदर्भित किया जाता है। जानकारी वेब पेज, चित्र, वीडियो, इन्फोग्राफिक्स, लेख, शोध पत्र और अन्य प्रकार की फ़ाइलों के लिंक का मिश्रण हो सकती है। कुछ सर्च इंजन डेटाबेस या ओपन डायरेक्टरी में उपलब्ध डेटा को भी माइन करते हैं। वेब निर्देशिकाओं के विपरीत, जो केवल मानव संपादकों द्वारा बनाए रखी जाती हैं, खोज इंजन भी वेब क्रॉलर पर एक एल्गोरिथ्म चलाकर वास्तविक समय की जानकारी को बनाए रखते हैं। इंटरनेट सामग्री जो वेब खोज इंजन द्वारा खोजे जाने में सक्षम नहीं है, उसे आमतौर पर गहरी वेब के रूप में वर्णित किया जाता है।


Timeline (full list)
Year
Engine
Current status
1993
Active
Active
Inactive
Inactive
1994
Active
Inactive, redirects to Disney
Active
Inactive, redirects to Disney
1995
Active, initially a search function for Yahoo! Directory
Active
Inactive
Active
Active
Active
Inactive, acquired by Yahoo! in 2003, since 2013 redirects to Yahoo!
1996
Inactive, incorporated into Baidu in 2000
Active, Aggregator
Inactive, acquired by Yahoo!
Active
Active (rebranded ask.com)
1997
Active (rebranded AOL Search since 1999)
Inactive
Active
1998
Active
Active as Startpage.com
Active as Bing
Inactive (merged with NATE)
1999
Inactive (URL redirected to Yahoo!)
Active, rebranded Yellowee (redirection to justlocalbusiness.com)
Active
Active (© APN, LLC)
2000
Active
Inactive
Active
2001
Inactive
2003
Active
Inactive
2004
Inactive
Active (as Yippy)
Active
Active
2005
Inactive
Active, Google Search
2006
Inactive, merged with Sogou
Inactive
Active
Inactive
Active
Active as Bing, rebranded MSN Search
2007
Inactive
Inactive
Inactive
Active, Google Search
2008
Inactive (redirects to Bing)
Inactive
Inactive
Inactive
Inactive
Inactive (redirects to Ecosia)
Active
2009
Active, rebranded Live Search
Inactive
Inactive due to a lack of funding
Active
Active
Active
Active, sister engine of Ixquick
2010
Inactive, sold to IBM
Inactive
Yandex (English)
Active
Active
2011
Active, P2P
2012
Inactive
2013
Active
2014
Active, Kurdish / Sorani
Active
2015
Active
Active, Browser integrated
2016
Active, Google Search

एक खोज इंजन निकट वास्तविक समय में निम्नलिखित प्रक्रियाओं को बनाए रखता है:

1 वेब क्रॉलिंग
2 इंडेक्सिंग

वेब सर्च इंजन अपनी जानकारी वेब साइट से साइट पर क्रॉल करके प्राप्त करते हैं। मानक फ़ाइल नाम robots.txt के लिए "मकड़ी" जांच करता है, इसे संबोधित किया जाता है। Robots.txt फ़ाइल में खोज मकड़ियों के लिए निर्देश हैं, जिसमें यह बताया गया है कि कौन से पृष्ठ क्रॉल करने के लिए हैं। Robots.txt की जाँच करने के बाद या तो इसे खोजा जा सकता है या नहीं, मकड़ी कुछ सूचनाओं को कई कारकों, जैसे शीर्षक, पृष्ठ सामग्री, जावास्क्रिप्ट, कैस्केडिंग स्टाइल शीट्स (सीएसएस), शीर्षकों या उसके मेटाडेटा के आधार पर अनुक्रमित होने के लिए वापस भेजती है। HTML मेटा टैग। एक निश्चित संख्या में पृष्ठों के क्रॉल होने के बाद, डेटा का अनुक्रमित या वेबसाइट पर बिताया गया समय, मकड़ी रेंगना बंद कर देती है और आगे बढ़ जाती है। " ओ वेब क्रॉलर वास्तव में पूरी तरह से उपलब्ध वेब को क्रॉल कर सकता है। अनंत वेबसाइटों, मकड़ी के जाल, स्पैम और वास्तविक वेब के अन्य कारणों के कारण, क्रॉलर्स एक क्रॉल नीति लागू करते हैं यह निर्धारित करने के लिए कि किसी साइट के क्रॉलिंग को कब समझा जाना चाहिए? पर्याप्त। कुछ वेबसाइटों को पूरी तरह से क्रॉल किया जाता है, जबकि अन्य को केवल आंशिक रूप से क्रॉल किया जाता है। 

'वेब सर्वर' की परिभाषा

परिभाषा: एक वेब सर्वर एक कंप्यूटर है जो वेबसाइटों को चलाता है। यह एक कंप्यूटर प्रोग्राम है जो वेब पेज वितरित करता है क्योंकि वे अपेक्षित हैं। वेब सर्वर का मूल उद्देश्य उपयोगकर्ताओं के लिए वेब पेजों को संग्रहीत, संसाधित और वितरित करना है। यह इंटर कम्यूनिकेशन हाइपरटेक्स्ट ट्रांसफर प्रोटोकॉल (HTTP) का उपयोग करके किया जाता है। ये वेब पेज ज्यादातर स्टैटिक कंटेंट होते हैं जिनमें HTML डॉक्यूमेंट, इमेज, स्टाइल शीट, टेस्ट आदि शामिल होते हैं। HTTP के अलावा, एक वेब सर्वर एसएमटीपी (सिंपल मेल ट्रांसफर प्रोटोकॉल) और एफ़टीपी (फाइल ट्रांसफर प्रोटोकॉल) प्रोटोकॉल को ईमेल करने और फाइल ट्रांसफर के लिए भी सपोर्ट करता है। और भंडारण।

विवरण: वेब सर्वर का मुख्य काम वेबसाइट की सामग्री को प्रदर्शित करना है। यदि किसी वेब सर्वर को जनता के सामने नहीं लाया जाता है और आंतरिक रूप से उपयोग किया जाता है, तो इसे इंट्रानेट सर्वर कहा जाता है। जब कोई वेब ब्राउज़र (जैसे क्रोम या फ़ायरफ़ॉक्स) एड्रेस बार (जैसे www.economictimes.com) पर URL या वेब एड्रेस जोड़कर वेबसाइट के लिए अनुरोध करता है, तो ब्राउज़र उसके लिए संबंधित वेब पेज को देखने के लिए इंटरनेट पर एक अनुरोध भेजता है पता। एक डोमेन नेम सर्वर (DNS) इस URL को एक IP एड्रेस (उदाहरण के लिए 192.168.216.345) में परिवर्तित करता है, जो बदले में एक वेब सर्वर को इंगित करता है।

वेब सर्वर से सामग्री वेबसाइट को उपयोगकर्ता के ब्राउज़र में प्रस्तुत करने का अनुरोध किया जाता है। इंटरनेट पर सभी वेबसाइटों के पास आईपी पते के संदर्भ में एक विशिष्ट पहचानकर्ता है। यह इंटरनेट प्रोटोकॉल एड्रेस इंटरनेट में विभिन्न सर्वरों के बीच संचार करने के लिए उपयोग किया जाता है। इन दिनों, Apache सर्वर बाजार में उपलब्ध सबसे आम वेब सर्वर है। अपाचे एक ओपन सोर्स सॉफ्टवेयर है जो आज उपलब्ध सभी वेबसाइटों का लगभग 70 प्रतिशत संभालता है। अधिकांश वेब-आधारित अनुप्रयोग Apache को उनके डिफ़ॉल्ट वेब सर्वर वातावरण के रूप में उपयोग करते हैं। एक अन्य वेब सर्वर जो आम तौर पर उपलब्ध होता है वह है इंटरनेट सूचना सेवा (IIS)IIS Microsoft के स्वामित्व में है।

No comments:

Post a Comment

Please Do Not Enter Any Spam Link in the comment Box.