भाषाविज्ञान में गणितीय और सांख्यिकीय विधियों का अनुप्रयोग। भाषाविज्ञान में गणितीय तरीके

पिछली शताब्दी के दौरान, भाषाविज्ञान को हमेशा एक ऐसे विज्ञान के उदाहरण के रूप में उद्धृत किया गया है जो तेजी से विकसित हुआ और बहुत जल्दी पद्धतिगत परिपक्वता तक पहुंच गया। पिछली शताब्दी के मध्य में, युवा विज्ञान ने आत्मविश्वास से विज्ञान के उस चक्र में अपना स्थान बना लिया, जिसकी एक हजार साल की परंपरा थी, और इसके सबसे प्रमुख प्रतिनिधियों में से एक - ए। श्लीचर - में यह विश्वास करने का साहस था कि अपने कार्यों के साथ वह पहले से ही अंतिम पंक्ति को समेट रहा था।<113>हालाँकि, भाषाविज्ञान के इतिहास ने दिखाया है कि इस तरह की राय बहुत जल्दबाजी और अनुचित थी। सदी के अंत में, भाषाविज्ञान को नव-व्याकरणिक सिद्धांतों की आलोचना से जुड़ा अपना पहला बड़ा झटका लगा, उसके बाद अन्य। यह ध्यान दिया जाना चाहिए कि एक नियम के रूप में, भाषा विज्ञान के इतिहास में हम जिन सभी संकटों को उजागर कर सकते हैं, उन्होंने इसकी नींव को हिलाया नहीं, बल्कि, इसके विपरीत, मजबूत बनाने में योगदान दिया और अंततः अपने साथ एक शोधन और सुधार लाया। विषयों और वैज्ञानिक मुद्दों के साथ-साथ भाषाई अनुसंधान के तरीकों का विस्तार।

लेकिन भाषाविज्ञान के बाद, अन्य विज्ञान भी जीवित और विकसित हुए, जिनमें बड़ी संख्या में नए भी शामिल थे। भौतिक, रासायनिक और तकनीकी (तथाकथित "सटीक") विज्ञान ने हमारे समय में विशेष रूप से तेजी से विकास प्राप्त किया है, और उनके सैद्धांतिक आधार, गणित ने उन सभी पर शासन किया है। सटीक विज्ञान ने न केवल सभी मानविकी पर बहुत दबाव डाला है, बल्कि वर्तमान में वे "उन्हें अपने विश्वास में लाने" का प्रयास कर रहे हैं, उन्हें अपने रीति-रिवाजों के अधीन करने के लिए, उन पर अपनी शोध विधियों को थोपने का प्रयास कर रहे हैं। वर्तमान स्थिति में, एक जापानी अभिव्यक्ति का उपयोग करते हुए, कोई कह सकता है कि अब भाषाविद-भाषाविद चटाई के किनारे को परिभाषित कर रहे हैं, जहां गणित के नेतृत्व में सटीक विज्ञान विजयी और स्वतंत्र रूप से स्थित हैं।

क्या यह अधिक समीचीन नहीं होगा, सामान्य वैज्ञानिक हितों के दृष्टिकोण से, गणित के प्रति समर्पण, अपनी विधियों की शक्ति के लिए पूरी तरह से आत्मसमर्पण करने के लिए, जिसके लिए कुछ आवाजें खुले तौर पर 59 को बुला रही हैं, और इस तरह, शायद, नई ताकत हासिल करें ? इन सवालों का जवाब देने के लिए, हमें पहले यह देखना होगा कि इस मामले में गणित क्या दावा करता है, भाषा विज्ञान के किस क्षेत्र में गणितीय तरीके अपना आवेदन पाते हैं, वे किस हद तक भाषा सामग्री की बारीकियों के अनुरूप हैं और क्या वे देने में सक्षम हैं या यहाँ तक कि केवल उन प्रश्नों के उत्तर सुझाएँ जिन्हें भाषा विज्ञान द्वारा निर्धारित किया गया है।

शुरू से ही, यह ध्यान दिया जाना चाहिए कि भाषा विज्ञान में नए, गणितीय प्रवृत्ति के उत्साही लोगों के बीच<114>स्थैतिक अनुसंधान में इसके लक्ष्यों और उद्देश्यों के संबंध में एकमत नहीं है। एकेड। ए.ए. मार्कोव, जो भाषा में गणितीय विधियों को लागू करने वाले पहले व्यक्ति थे, बोल्ड्रिनी, यूल, मारीओटी भाषा के तत्वों को मात्रात्मक तरीकों के निर्माण के लिए या सांख्यिकीय प्रमेयों के लिए उपयुक्त उदाहरण सामग्री के रूप में मानते हैं, बिना यह सोचे कि क्या इस तरह के अध्ययन के परिणाम रुचि के हैं भाषाविदों को 6 0 . रॉस का मानना ​​​​है कि संभाव्यता का सिद्धांत और गणितीय सांख्यिकी एक उपकरण प्रदान करते हैं या, जैसा कि वे अब कहना पसंद करते हैं, उन भाषाई निष्कर्षों के परीक्षण और पुष्टि के लिए एक गणितीय मॉडल जिन्हें संख्यात्मक रूप से व्याख्या किया जा सकता है। इस प्रकार, गणितीय विधियों को केवल भाषाई अनुसंधान के सहायक साधन के रूप में माना जाता है 6 1 . हेर्डन ने बहुत अधिक दावा किया है, जिन्होंने अपनी पुस्तक में न केवल भाषा की समस्याओं के गणितीय अध्ययन के सभी प्रयासों को सारांशित और व्यवस्थित किया, बल्कि आगे के काम के संबंध में उन्हें एक स्पष्ट अभिविन्यास देने का भी प्रयास किया। वह अपनी पुस्तक की संपूर्ण सामग्री को "साहित्यिक आँकड़ों को समझने" पर केंद्रित करता है (जैसा कि वह गणितीय आँकड़ों के तरीकों से ग्रंथों का अध्ययन कहता है। - 3 में)भाषा विज्ञान के एक अभिन्न अंग के रूप में" 6 2, और निम्नलिखित शब्दों में भाषाविज्ञान में इस नए खंड के सार और कार्यों को तैयार करता है: "भाषा के मात्रात्मक दर्शन के रूप में साहित्यिक आंकड़े भाषाविज्ञान की सभी शाखाओं पर लागू होते हैं। हमारी राय में, साहित्यिक सांख्यिकी संरचनात्मक भाषाविज्ञान है जिसे मात्रात्मक विज्ञान या मात्रात्मक दर्शन के स्तर तक बढ़ाया जाता है। इस प्रकार, इसके परिणामों को दायरे से बाहर होने के रूप में परिभाषित करना भी उतना ही गलत है<115>भाषाविज्ञान या इसे अनुसंधान के लिए एक सहायक उपकरण के रूप में मानें" 6 3।

इस मामले में भाषाविज्ञान की एक नई शाखा के उद्भव के बारे में बात करना और इसके दावों के मुद्दे को हल करना, इस पर विचार किए बिना कि वास्तव में क्या किया गया है, इस पर विचार करना उचित नहीं है। इस क्षेत्र में, और किस दिशा में नई विधियों के आवेदन 6 4 स्पष्ट करने के लिए। इससे हमें विचारों के अंतर को समझने में मदद मिलेगी।

भाषाई समस्याओं को हल करने के लिए गणितीय (या, अधिक सटीक, सांख्यिकीय) मानदंड का उपयोग भाषा विज्ञान के लिए किसी भी तरह से नया नहीं है और, एक डिग्री या किसी अन्य के लिए, लंबे समय से भाषाविदों द्वारा उपयोग किया जाता है। आखिरकार, वास्तव में, भाषाविज्ञान की ऐसी पारंपरिक अवधारणाएं ध्वन्यात्मक कानून (और संबंधित .) के रूप में हैं<116>इसके साथ नी - कानून का अपवाद), व्याकरणिक तत्वों की उत्पादकता (उदाहरण के लिए, व्युत्पन्न प्रत्यय), या यहां तक ​​​​कि भाषाओं के बीच संबंधित संबंधों के मानदंड, कुछ हद तक, सापेक्ष सांख्यिकीय विशेषताओं पर आधारित होते हैं। आखिरकार, देखे गए मामलों का सांख्यिकीय विरोध जितना तेज और स्पष्ट होगा, उतने ही अधिक कारण हमें उत्पादक और अनुत्पादक प्रत्ययों के बारे में, ध्वन्यात्मक कानून और इसके अपवादों के बारे में, भाषाओं के बीच रिश्तेदारी की उपस्थिति या अनुपस्थिति के बारे में बात करनी होगी। लेकिन अगर ऐसे मामलों में सांख्यिकीय सिद्धांत का कम या ज्यादा अनायास उपयोग किया जाता है, तो भविष्य में इसे सचेत रूप से और पहले से ही एक निश्चित लक्ष्य निर्धारण के साथ लागू किया जाने लगा। इसलिए, हमारे समय में, शब्दावली के तथाकथित आवृत्ति शब्दकोश और व्यक्तिगत भाषाओं के भाव 6 5 या यहां तक ​​\u200b\u200bकि "वास्तविकता पर सामान्य ध्यान" के साथ बहुभाषी शब्दों के अर्थ 6 6 बहुत व्यापक हो गए हैं। इन शब्दकोशों के डेटा का उपयोग विदेशी भाषा की पाठ्यपुस्तकों (जिनके पाठ सबसे अधिक इस्तेमाल की जाने वाली शब्दावली पर बनाए गए हैं) और न्यूनतम शब्दकोशों को संकलित करने के लिए किया जाता है। सांख्यिकीय कलन को एम. स्वदेश द्वारा लेक्सिकोस्टैटिस्टिक्स या ग्लोटोक्रोनोलॉजी की विधि में एक विशेष भाषाई उपयोग मिला, जहां, सांख्यिकीय सूत्रों के आधार पर जो मुख्य निधि के शब्दों की भाषाओं से गायब होने के मामलों को ध्यान में रखते हैं, यह है भाषा परिवारों के विघटन के पूर्ण कालक्रम को स्थापित करना संभव है 6 7 .

हाल के वर्षों में, भाषाई सामग्री में गणितीय तरीकों को लागू करने के मामलों में काफी वृद्धि हुई है, और इस तरह के प्रयासों के द्रव्यमान में, कमोबेश निश्चित दिशाओं को रेखांकित किया गया है। चलो मुड़ें<117>विवरण में जाने के बिना, उनके क्रमिक विचार के लिए।

आइए उस दिशा से शुरू करें जिसे स्टाइलोस्टैटिस्टिक्स का नाम दिया गया है। इस मामले में, हम इस्तेमाल किए गए भाषाई तत्वों के मात्रात्मक संबंधों के माध्यम से व्यक्तिगत कार्यों या लेखकों की शैलीगत विशेषताओं की परिभाषा और विशेषता के बारे में बात कर रहे हैं। शैलीगत घटनाओं के अध्ययन के लिए सांख्यिकीय दृष्टिकोण भाषा के साधनों में महारत हासिल करने के एक व्यक्तिगत तरीके के रूप में साहित्यिक शैली की समझ पर आधारित है। उसी समय, शोधकर्ता गणनीय भाषाई तत्वों के गुणात्मक महत्व के सवाल से पूरी तरह से विचलित हो जाता है, अपना सारा ध्यान केवल मात्रात्मक पक्ष पर केंद्रित करता है; शोध का शब्दार्थ पक्ष भाषा इकाइयाँ, उनका भावनात्मक और अभिव्यंजक भार, साथ ही कला के एक काम के ताने-बाने में उनका हिस्सा - यह सब खाते से बाहर रहता है, तथाकथित निरर्थक घटना को संदर्भित करता है। इस प्रकार, कला का एक काम एक यांत्रिक समुच्चय के रूप में प्रकट होता है, जिसके निर्माण की विशिष्टता इसके तत्वों के संख्यात्मक संबंधों के माध्यम से ही अभिव्यक्ति पाती है। शैली-सांख्यिकी के प्रतिनिधि उन सभी परिस्थितियों से मुंह नहीं मोड़ते हैं, जो पारंपरिक शैली के तरीकों का विरोध करते हैं, जिसमें निस्संदेह गणितीय पद्धति के एक गुण के साथ व्यक्तिपरकता के तत्व शामिल हैं, जो उनकी राय में, इसकी सभी कमियों की भरपाई करता है - प्राप्त परिणामों की निष्पक्षता। "हम प्रयास करते हैं," लिखते हैं, उदाहरण के लिए, वी। फुच्स, "... गणितीय साधनों द्वारा भाषाई अभिव्यक्ति की शैली को चित्रित करने के लिए। इस उद्देश्य के लिए, विधियों का निर्माण किया जाना चाहिए, जिसके परिणाम सटीक विज्ञान के परिणामों के समान उद्देश्यपूर्ण होने चाहिए ... इससे पता चलता है कि, कम से कम शुरुआत में, हम केवल औपचारिक संरचनात्मक गुणों से निपटेंगे, न कि शब्दार्थ सामग्री के साथ भाषाई अभिव्यक्ति के.. इस तरह हम क्रमिक संबंधों की एक प्रणाली प्राप्त करेंगे, जो इसकी समग्रता में शैली के गणितीय सिद्धांत का आधार और प्रारंभिक बिंदु होगा ”6 8।<118>

लेखकों या व्यक्तिगत कार्यों की भाषा का अध्ययन करने के लिए सबसे सरल प्रकार का सांख्यिकीय दृष्टिकोण इस्तेमाल किए गए शब्दों की गणना करना है, क्योंकि शब्दकोश की समृद्धि, जाहिरा तौर पर, लेखक को एक निश्चित तरीके से खुद को भी चित्रित करना चाहिए। हालांकि, इस तरह की गणना के परिणाम इस संबंध में कुछ अप्रत्याशित परिणाम देते हैं और किसी भी तरह से सौंदर्य ज्ञान और साहित्यिक कार्य के मूल्यांकन में योगदान नहीं करते हैं, जो कि शैलीविज्ञान के कार्यों में से कम से कम एक नहीं है। यहां कई कार्यों में प्रयुक्त शब्दों की कुल संख्या पर कुछ आंकड़े दिए गए हैं:

बाइबिल (लैटिन)। . . . . . . . . . 5649 शब्द

बाइबिल (हिब्रू)। . . . 5642 शब्द

डेमोस्थनीज (भाषण)। . . . . . . . . . . . 4972 शब्द

सैलस्ट। . . . . . . . . . . . . . . . . 3394 शब्द

होरेस। . . . . . . . . . . . . . . . . . . .6084 शब्द

दांते (डिवाइन कॉमेडी) 5860 शब्द

(इसमें 1615 उचित नाम और भौगोलिक नाम शामिल हैं)

टैसो (उग्र ऑरलैंड)। . . . 8474 शब्द

मिल्टन। . . . . . . . . . . . . . . . . . . . .8000 शब्द (लगभग दिया गया)

शेक्सपियर. . . . . . . . . . . . . . . . . . .15000 शब्द

(लगभग, अन्य स्रोतों के अनुसार 20,000 शब्द)

ओ जेस्पर्सन बताते हैं कि ज़ोला, किपलिंग और जैक लंदन का शब्दकोश मिल्टन के शब्दकोश से काफी अधिक है, यानी संख्या 8000 6 9 है। अमेरिकी राष्ट्रपति डब्ल्यू विल्सन के भाषणों के शब्दकोश की गणना में पाया गया कि यह शेक्सपियर की तुलना में अधिक समृद्ध है। इसमें मनोवैज्ञानिकों के डेटा को जोड़ा जाना चाहिए। इस प्रकार, बड़ी संख्या में मामलों की टिप्पणियों के आधार पर, टर्मन ने पाया कि एक औसत बच्चे की शब्दावली लगभग 3600 शब्द है, और 14 साल की उम्र में - पहले से ही 9000। औसत वयस्क 11700 शब्दों का उपयोग करता है, और एक व्यक्ति "बढ़ी हुई" बुद्धि" 13500 7 0 तक। इस प्रकार, इस तरह के संख्यात्मक डेटा अपने आप में कार्यों के शैलीगत गुणों की पहचान करने के लिए कोई आधार प्रदान नहीं करते हैं और केवल "उद्देश्यपूर्ण" हैं।<119>वे अलग-अलग लेखकों द्वारा शब्दों की एक अलग संख्या के उपयोग को बताते हैं, जैसा कि उपरोक्त गणना से पता चलता है, उनके कार्यों के सापेक्ष कलात्मक मूल्य से संबंधित नहीं है।

अलग-अलग लेखकों द्वारा शब्दों के उपयोग की सापेक्ष आवृत्ति की गणना कुछ अलग तरीके से की जाती है। इस मामले में, न केवल शब्दों की कुल मात्रा को ध्यान में रखा जाता है, बल्कि व्यक्तिगत शब्दों के उपयोग की आवृत्ति को भी ध्यान में रखा जाता है। इस तरह से प्राप्त सामग्री के सांख्यिकीय प्रसंस्करण में यह तथ्य शामिल है कि उपयोग की समान आवृत्ति वाले शब्दों को वर्गों (या रैंक) में वर्गीकृत किया जाता है, जो किसी दिए गए लेखक द्वारा उपयोग किए गए सभी शब्दों के आवृत्ति वितरण की स्थापना की ओर जाता है। इस तरह की गणना का एक विशेष मामला विशेष शब्दों की सापेक्ष आवृत्ति का निर्धारण है (उदाहरण के लिए, चौसर के कार्यों में रोमांस शब्दावली, जैसा कि मेरसेंड 7 1 द्वारा किया गया था)। लेखकों द्वारा उपयोग किए गए शब्दों की सापेक्ष आवृत्ति में व्यक्तिगत लेखकों की शैली के बारे में समान उद्देश्य जानकारी होती है, जैसा कि उपरोक्त कुल गणनाओं में होता है, केवल अंतर यह है कि परिणाम अधिक सटीक संख्यात्मक डेटा है। लेकिन इसका उपयोग एक ही लेखक के व्यक्तिगत कार्यों को उसके जीवन के विभिन्न अवधियों में शब्दों के उपयोग की सापेक्ष आवृत्ति की प्रारंभिक गणना के आधार पर भी किया जाता है (स्वयं लेखक द्वारा दिनांकित कार्यों के अनुसार)। इस तरह की गणना से डेटा का एक अन्य प्रकार का उपयोग कार्यों के लेखकत्व की प्रामाणिकता स्थापित करना है जिसके लिए यह प्रश्न संदिग्ध लगता है 7 2 . इस अंतिम मामले में, सब कुछ वास्तविक और विवादास्पद कार्यों में उपयोग की आवृत्ति के लिए सांख्यिकीय सूत्रों की तुलना पर आधारित है। ऐसी विधियों द्वारा प्राप्त परिणामों की बहुत बड़ी सापेक्षता और सन्निकटता के बारे में बात करने की आवश्यकता नहीं है। आखिरकार, उपयोग की सापेक्ष आवृत्ति न केवल लेखक की उम्र के साथ बदलती है, बल्कि काम की शैली, कथानक और ऐतिहासिक वातावरण पर भी निर्भर करती है (cf।, उदाहरण के लिए, "ब्रेड" और "पीटर I" ए द्वारा टॉल्स्टॉय)।<120>

ऊपर वर्णित विधि को गहरा करते हुए, स्टाइलोस्टैटिस्टिक्स ने एक शैली विशेषता के रूप में सबसे अधिक इस्तेमाल किए जाने वाले शब्दों की सापेक्ष आवृत्ति की स्थिरता की कसौटी का सहारा लेना शुरू कर दिया। इस मामले में इस्तेमाल की जाने वाली विधि को डेट्रॉइट विश्वविद्यालय (यूएसए) 7 3 में स्लावोनिक भाषा संस्थान में एस्सेलसन और एपस्टीन द्वारा पुश्किन की कहानी "द कैप्टन की बेटी" के सांख्यिकीय प्रसंस्करण द्वारा चित्रित किया जा सकता है। कहानी का पूरा पाठ (शब्दों की लगभग 30,000 बारंबारता) सर्वेक्षण के अधीन था, और फिर लगभग 10,000 और 5,000 घटनाओं वाले अंश। इसके अलावा, शब्दों के उपयोग की सापेक्ष आवृत्ति की स्थिरता को निर्धारित करने के लिए, 102 सबसे सामान्य शब्दों (1160 से 35 की आवृत्ति के साथ) की तुलना परिकलित सापेक्ष आवृत्ति (चयनात्मक मार्ग के आधार पर बनाई गई) के साथ की गई थी। वास्तविक एक। उदाहरण के लिए, संघ "और" का प्रयोग पूरी कहानी में 1,160 बार किया गया था। सभी शब्दों के 5,000 बार आने वाले गद्यांश में, इस संयोजन के 5,000 x 1,160:30,000, या 193 बार पूर्णांकित किए जाने की अपेक्षा की जाएगी, और सभी शब्दों के 10,000 बार आने वाले गद्यांश में, 10,000 x के उपयोग की अपेक्षा की जाएगी। 1,160: 30,000, या 386 बार। वास्तविक डेटा के साथ इस तरह की गणनाओं का उपयोग करके प्राप्त आंकड़ों की तुलना बहुत मामूली विचलन (5% के भीतर) दिखाती है। इस तरह की गणना के आधार पर, यह पाया गया कि पुश्किन की इस कहानी में, पूर्वसर्ग "k" का प्रयोग "y" की तुलना में दो बार किया जाता है, और सर्वनाम "आप" का उपयोग "उन्हें" आदि से तीन गुना अधिक बार किया जाता है। इस प्रकार , कथानक के सभी उलटफेरों के बावजूद, पूरी कहानी में और इसके अलग-अलग हिस्सों में, शब्दों के उपयोग की सापेक्ष आवृत्ति में स्थिरता है। कुछ (सबसे सामान्य) शब्दों के संबंध में जो देखा जाता है वह संभवतः काम में प्रयुक्त सभी शब्दों पर लागू होता है। यह इस प्रकार है कि लेखक की शैली को किसी दिए गए भाषा के लिए सामान्य आवृत्ति के लिए एक शब्द का उपयोग करने की औसत आवृत्ति की परिवर्तनशीलता के एक निश्चित अनुपात की विशेषता हो सकती है।<121>इसके उपयोग की आवृत्ति। इस अनुपात को लेखक की शैली की वस्तुनिष्ठ मात्रात्मक विशेषता माना जाता है।

भाषा संरचना के अन्य औपचारिक तत्वों का भी इसी तरह अध्ययन किया जाता है। इसलिए, उदाहरण के लिए, वी। फुच्स ने तुलनात्मक-सांख्यिकीय विचार के लिए गोएथे, रिल्के, सीज़र, सल्स्ट, आदि के कार्यों की मीट्रिक विशेषताओं के अधीन किया। 7 4

शब्दों के उपयोग की सापेक्ष आवृत्ति की स्थिरता की कसौटी, शैली के मात्रात्मक लक्षण वर्णन की तकनीक को स्पष्ट करते हुए, ऊपर विश्लेषण किए गए अधिक आदिम तरीकों की तुलना में मौलिक रूप से कुछ भी नया नहीं पेश करती है। स्टाइलोस्टैटिस्टिक्स के सभी तरीके अंततः समान रूप से निष्पक्ष "उद्देश्य" परिणाम उत्पन्न करते हैं, जीभ की सतह पर ग्लाइडिंग करते हैं और केवल विशुद्ध रूप से बाहरी संकेतों से चिपके रहते हैं। मात्रात्मक तरीके, जाहिरा तौर पर, अध्ययन के तहत सामग्री में गुणात्मक अंतर पर ध्यान केंद्रित करने में सक्षम नहीं हैं और वास्तव में अध्ययन के तहत सभी वस्तुओं को समतल करते हैं।

जहां अधिकतम विनिर्देश की आवश्यकता होती है, वहां सबसे सामान्यीकृत मानदंड पेश किए जाते हैं; गुणात्मक विशेषताओं को मात्रा की भाषा में व्यक्त किया जाता है। यह न केवल एक तार्किक विरोधाभास है, बल्कि चीजों की प्रकृति से भी असहमति है। वास्तव में, क्या होता है यदि हम उनके कैनवस पर लाल और काले रंग के मात्रात्मक अनुपात के आधार पर अलेक्जेंडर गेरासिमोव और रेम्ब्रांट के कार्यों की तुलनात्मक शैलीगत (अर्थात, गुणात्मक) विशेषता प्राप्त करने का प्रयास करते हैं? ऐसा लगता है कि यह बिल्कुल बकवास है। किसी व्यक्ति के भौतिक डेटा के बारे में पूरी तरह से "उद्देश्य" मात्रात्मक जानकारी किस हद तक हमें उस सब कुछ का एक विचार देने में सक्षम हो सकती है जो किसी व्यक्ति की विशेषता है और उसके वास्तविक सार का गठन करती है? जाहिर है कोई नहीं। वे केवल एक व्यक्तिगत संकेत के रूप में सेवा कर सकते हैं जो एक व्यक्ति को दूसरे से अलग करता है, जैसे कि अंगूठे पर संकल्प की छाप। साहित्यिक शैली की मात्रात्मक विशेषताओं के साथ स्थिति समान है। यदि आप बारीकी से देखें, तो वे वास्तविक शैली का निर्धारण करने के लिए बहुत कम डेटा प्रदान करते हैं<122>लेखक की भाषा के गुण, साथ ही मानव मनोविज्ञान के अध्ययन के लिए उंगली पर संकल्पों का विवरण।

जो कुछ कहा गया है, उसमें यह जोड़ा जाना चाहिए कि अतीत में, साहित्यिक आलोचना के तथाकथित औपचारिक स्कूल में, लेखकों की शैली का मात्रात्मक अध्ययन करने का प्रयास पहले ही किया जा चुका था, जब विशेषण, रूपक और लयबद्ध - पद्य के मधुर तत्व गिने जाते थे। हालाँकि, यह प्रयास आगे विकसित नहीं हुआ था।

भाषाई घटनाओं के अध्ययन के लिए गणितीय विधियों के अनुप्रयोग के एक अन्य क्षेत्र को भाषाई सांख्यिकी के नाम से वर्गीकृत किया जा सकता है। यह भाषा के सिद्धांत के मूलभूत प्रश्नों में घुसपैठ करना चाहता है और इस प्रकार उचित भाषाई क्षेत्र में एक व्यवसाय प्राप्त करना चाहता है। इस दिशा से परिचित होने के लिए, इसके कई समीक्षकों में से एक के शब्दों में, हेर्डन के पहले से ही उल्लेख किए गए काम की ओर मुड़ना सबसे अच्छा है, "एक राक्षसी रूप से दिखावा करने वाली पुस्तक" 7 5 , हालांकि, भाषाविदों के बीच व्यापक प्रतिक्रिया मिली 7 6 . इस तथ्य को ध्यान में रखते हुए कि हेरडन (जैसा कि पहले ही ऊपर उल्लेख किया गया है) ने अपनी पुस्तक में भाषाई समस्याओं के लिए गणितीय तरीकों के आवेदन के क्षेत्र में सबसे महत्वपूर्ण सब कुछ एकत्र करने की मांग की, उनकी पुस्तक में हम वास्तव में खेरदान के साथ इतना अधिक नहीं कर रहे हैं जितना कि समग्र रूप से रुझान। जैसा कि पुस्तक के शीर्षक से ही पता चलता है - "भाषा के रूप में पसंद और संभावना", - इसका मुख्य ध्यान यह स्पष्ट करने के लिए निर्देशित किया जाता है कि भाषा में स्पीकर की स्वतंत्र पसंद के लिए क्या बचा है और भाषा की आसन्न संरचना के कारण क्या है, उसी तरह जैसे पहले और दूसरे क्रम के तत्वों के मात्रात्मक अनुपात को निर्धारित करने के लिए। खेरदान की पुस्तक इस क्षेत्र में विभिन्न विशिष्टताओं के प्रतिनिधियों द्वारा किए गए सभी कार्यों के बारे में लगभग संपूर्ण जानकारी प्रदान करती है।<123>(दार्शनिक, भाषाविद, गणितज्ञ, तकनीशियन), लेकिन यह यहीं तक सीमित नहीं है और इसमें स्वयं लेखक के कई मूल अवलोकन, विचार और निष्कर्ष शामिल हैं। सारांशित कार्य के रूप में, यह उपयोग की जाने वाली मात्रात्मक विधियों और उनकी सहायता से प्राप्त परिणामों का एक अच्छा विचार देता है। जिन प्रश्नों को हम सशर्त रूप से भाषाई आँकड़ों के खंड में जोड़ते हैं, उन्हें पुस्तक के दूसरे और चौथे भाग में माना जाता है।

भाषाई मुद्दों के अध्ययन के लिए गणितीय आँकड़ों के तरीकों को लागू करने के कई मामलों में से, हम सबसे सामान्य लोगों पर ध्यान केंद्रित करेंगे, जिन्हें सबसे विशिष्ट भी माना जा सकता है। अन्य लेखकों के डेटा का उपयोग करना - बोल्ड्रिनी 7 7 , मैथेसियस 7 8, मारीओटी 7 9, ज़िपफ 8 0, डेवे 8 1 और अन्य, साथ ही साथ अपने स्वयं के अध्ययनों का हवाला देते हुए, जो स्वरों, अक्षरों, शब्द लंबाई (अक्षरों और अक्षरों की संख्या से मापा जाता है) के वितरण की सापेक्ष आवृत्ति निर्धारित करते हैं। , लैटिन और ग्रीक हेक्सामीटर में व्याकरणिक रूप और मीट्रिक तत्व, हेरडन सभी भाषाई संरचनाओं की एक सामान्य विशेषता के रूप में भाषाई तत्वों की सापेक्ष आवृत्ति की स्थिरता के तथ्य को स्थापित करता है। वह निम्नलिखित नियम प्राप्त करता है: "भाषाई कोडिंग के एक या दूसरे स्तर या क्षेत्र से संबंधित भाषाई तत्वों का अनुपात - ध्वन्यात्मकता, व्याकरण, मैट्रिक्स - किसी दिए गए भाषा के लिए, उसके विकास की एक निश्चित अवधि में और उसके भीतर कमोबेश स्थिर रहता है। पर्याप्त रूप से व्यापक और निष्पक्ष रूप से आयोजित टिप्पणियों की सीमाएं। »8 2। यह नियम, जिसे हेरडन भाषा का मूल नियम कहते हैं, वह एक निश्चित तरीके से व्याख्या और विस्तार करना चाहता है। "वह," हेर्डन इस कानून के बारे में लिखते हैं, "इस तथ्य की अभिव्यक्ति है कि यहां भी, जहां मानव इच्छा और पसंद की स्वतंत्रता प्रदान की जाती है<124>व्यापक ढांचा, जहां सचेत विकल्प और लापरवाह एक दूसरे के साथ वैकल्पिक रूप से खेलते हैं, व्याकरण में, लेकिन विशिष्ट स्वरों, शाब्दिक इकाइयों (शब्दों) और व्याकरणिक स्वरों के उपयोग की आवृत्ति के संबंध में भी पूरी तरह से स्थिरता है। निर्माण; दूसरे शब्दों में, समानता न केवल उपयोग की जाने वाली सामग्री में है, बल्कि यह भी है कि कितनी बार इसका उपयोग किया जाता है" 8 3। यह स्थिति समझने योग्य कारणों से है, लेकिन इससे नए निष्कर्ष निकलते हैं। उदाहरण के लिए, किसी दी गई भाषा के विभिन्न ग्रंथों या खंडों की जांच करते समय, यह पाया जाता है कि अलग-अलग लोगों द्वारा किसी विशेष ध्वनि (या अन्य भाषण तत्वों) के उपयोग की सापेक्ष आवृत्ति मूल रूप से समान रहती है। यह भाषण के व्यक्तिगत रूपों की व्याख्या की ओर जाता है क्योंकि किसी दिए गए भाषा में विचारित ध्वनि का उपयोग करने की निरंतर संभावना में कुछ उतार-चढ़ाव होते हैं। इस प्रकार, यह पता चला है कि एक व्यक्ति अपनी भाषण गतिविधि में उपयोग किए जाने वाले भाषाई तत्वों की संख्या के संबंध में संभाव्यता के कुछ नियमों के अधीन है। और फिर, जब हम ग्रंथों या भाषण खंडों के एक बड़े समूह में भाषाई तत्वों की एक बड़ी संख्या का निरीक्षण करते हैं, तो हमें इस अर्थ में कारण निर्भरता का आभास होता है कि इस मामले में कुछ भाषाई तत्वों के उपयोग के संबंध में भी एक दृढ़ संकल्प है। . दूसरे शब्दों में, यह दावा करने के लिए स्वीकार्य हो जाता है कि जो सहज रूप से एक कारण संबंध प्रतीत होता है वह मात्रात्मक रूप से एक संभाव्यता 8 4 है। यह स्पष्ट है कि कुल जितना बड़ा होगा<125>परीक्षण किए गए ग्रंथों या भाषण खंडों की विशिष्टता, अधिक स्पष्ट रूप से भाषाई तत्वों के उपयोग की सापेक्ष आवृत्ति की स्थिरता व्यक्तिगत उपयोग (बड़ी संख्या का कानून) में भी प्रकट होगी। यहाँ से एक नया बनाया जाता है सामान्य निष्कर्षवह भाषा एक सामूहिक घटना है और इसे उसी रूप में माना जाना चाहिए।

ये निष्कर्ष, ध्वन्यात्मक तत्वों, शब्दों और व्याकरणिक रूपों की आवृत्ति गणना के आधार पर पहुंचे, जो एक साथ एक भाषा का गठन करते हैं, फिर सॉसर के विभाजन की "सांख्यिकीय व्याख्या" पर "भाषा" (लालांगू) और "भाषण" (लैपरोल) में लागू होते हैं। ) सॉसर के अनुसार, "भाषा" भाषाई आदतों का एक समूह है जो किसी दिए गए भाषाई समुदाय के सदस्यों के बीच संचार को संभव बनाता है। यह एक सामाजिक वास्तविकता है, एक "सामूहिक घटना", जो इस भाषा को बोलने वाले सभी लोगों के लिए अनिवार्य है। जैसा कि संकेत दिया गया है, हर्डन यह साबित करता है कि एक भाषा समुदाय के सदस्य एक दूसरे के समान हैं, न केवल वे एक ही स्वर, शाब्दिक इकाइयों और व्याकरणिक रूपों का उपयोग करते हैं, बल्कि इस तथ्य में भी कि इन सभी तत्वों का उपयोग समान आवृत्ति के साथ किया जाता है। . इस प्रकार, "भाषा" की उनकी सांख्यिकीय परिभाषा निम्नलिखित रूप लेती है: "भाषा" (लालांगू) सामान्य भाषाई तत्वों की समग्रता है और साथ ही उनके इस्तेमाल होने की सापेक्ष संभावना है।

"भाषा" की यह परिभाषा "भाषण" की संबंधित सांख्यिकीय व्याख्या के लिए प्रारंभिक बिंदु भी है, जो कि सॉसर के अनुसार, एक व्यक्तिगत कथन है। एक व्यक्तिगत घटना के रूप में "भाषण" की सामाजिक घटना के रूप में "भाषा" की तुलना करते हुए, सौसुर ने लिखा: "भाषण इच्छा और समझ का एक व्यक्तिगत कार्य है, जिसमें अंतर करना आवश्यक है: 1. संयोजन जिसके साथ बोलने वाला विषय भाषा का उपयोग करता है अपने व्यक्तिगत विचार व्यक्त करने के लिए कोड; 2. एक मनोभौतिक तंत्र जो उसे इन संयोजनों को वस्तुनिष्ठ बनाने की अनुमति देता है" 8 5 । चूंकि भाषाई आंकड़ों में "भाषा" को एक निश्चित रिश्तेदार के साथ तत्वों का एक समूह माना जाता है<126>उनके उपयोग की निश्चित संभावना, जहां तक ​​​​इसमें सांख्यिकीय समग्रता या पहनावा (जनसंख्या) सबसे आवश्यक विशेषता के रूप में शामिल है और इस पहलू पर विचार किया जा सकता है। इसके अनुसार, "भाषण" एक सांख्यिकीय समुच्चय के रूप में "भाषा" से लिए गए एक अलग नमूने में बदल जाता है। इस मामले में संभावना "भाषण" से "भाषा" (उनकी "मात्रात्मक" समझ में) के संबंध से निर्धारित होती है, और भाषा के विभिन्न तत्वों के उपयोग की सापेक्ष आवृत्ति के वितरण को एक के परिणाम के रूप में व्याख्या किया जाता है भाषा के अस्तित्व की एक निश्चित कालानुक्रमिक अवधि में सामूहिक "पसंद" (पसंद)। यह समझते हुए कि "भाषा" और "भाषण" के बीच के अंतरों की इस तरह की व्याख्या फिर भी सॉसर की तुलना में पूरी तरह से अलग आधार पर बनाई गई है, हेरडन इस संबंध में लिखते हैं: "सॉसुरे की अवधारणा के इस मामूली संशोधन का महत्वपूर्ण परिणाम है कि" भाषा "( लालांगु ) अब एक सांख्यिकीय समुच्चय (जनसंख्या) के रूप में एक आवश्यक विशेषता प्राप्त कर लेता है। यह आबादी कुछ सापेक्ष आवृत्तियों या उतार-चढ़ाव की संभावनाओं की विशेषता है, जिसका अर्थ है कि प्रत्येक भाषाई तत्व एक निश्चित भाषाई स्तर से संबंधित है। इस मामले में, "भाषण" (लैपरोल), अपने अर्थ के अनुसार, "भाषा" से लिए गए सांख्यिकीय नमूनों को सांख्यिकीय सेट के रूप में परिभाषित करने के लिए एक शब्द बन जाता है। यह स्पष्ट हो जाता है कि चुनाव (पसंद) यहां "भाषण" से "भाषा" के अनुपात के रूप में प्रकट होता है, जो यादृच्छिक रूप से सांख्यिकीय समुच्चय (जनसंख्या) में लिए गए नमूने का अनुपात है। सदियों से भाषाई समुदाय की भाषण गतिविधि के जमा के रूप में आवृत्ति वितरण का क्रम पसंद (पसंद) का एक तत्व है, लेकिन व्यक्तिगत पसंद का नहीं, जैसा कि शैली में है, लेकिन सामूहिक पसंद का है। एक रूपक का उपयोग करते हुए, हम यहां भाषा की भावना द्वारा किए गए चुनाव के बारे में बात कर सकते हैं, अगर हम भाषाई संचार के सिद्धांतों को समझते हैं, जो एक विशेष भाषाई समुदाय के सदस्यों के मानसिक डेटा के परिसर के अनुसार हैं। श्रृंखला की स्थिरता प्रायिकता (मौका)» 8 6 का परिणाम है।

घोषित सिद्धांत के आवेदन का एक विशेष मामला<127>पा "अपवाद" (विचलन) से मानक घटना की भाषा में परिसीमन है। भाषाई आंकड़ों में, यह तर्क दिया जाता है कि सांख्यिकीय पद्धति आपको मौजूदा को खत्म करने की अनुमति देती है इस मुद्देअस्पष्टता और इन घटनाओं के बीच अंतर करने के लिए स्पष्ट मानदंड स्थापित करना। यदि मानदंड को सांख्यिकीय आबादी (उपरोक्त अर्थ में) के रूप में समझा जाता है, और अपवाद (या त्रुटि) सांख्यिकीय आबादी द्वारा दिखाए गए आवृत्तियों से विचलन है, तो प्रश्न का मात्रात्मक समाधान स्वयं ही सुझाता है। यह सब "जनसंख्या" और "बाहरी" के बीच एक सांख्यिकीय संबंध के लिए उबलता है। यदि किसी व्यक्तिगत नमूने में देखी गई आवृत्तियाँ सांख्यिकीय जनसंख्या के कारण संभावनाओं से विचलित होती हैं, तो नमूना गणना की एक श्रृंखला द्वारा निर्धारित की जाती है, तो हमारे पास यह निष्कर्ष निकालने का कारण है कि "समान" (मानक) और "नहीं" के बीच की सीमा रेखा वही" (अपवाद) का उल्लंघन किया जाता है।

"भाषा" और "भाषण" के बीच मात्रात्मक अंतर का उपयोग दो प्रकार के भाषाई तत्वों को अलग करने के लिए भी किया जाता है: व्याकरणिक और शाब्दिक। इस समस्या को हल करने के लिए प्रारंभिक बिंदु, जो अक्सर भाषाई दृष्टिकोण से बड़ी कठिनाइयाँ प्रस्तुत करता है, यह धारणा है कि व्याकरणिक तत्वों की आवृत्ति की डिग्री शाब्दिक इकाइयों की तुलना में भिन्न होती है। यह कथित रूप से व्याकरणिक तत्वों के "सामान्यीकरण" से जुड़ा है, वे शाब्दिक इकाइयों द्वारा निर्धारित अवधारणाओं से कैसे भिन्न होते हैं। इसके अलावा, व्याकरणिक तत्व माना जाता है, एक नियम के रूप में, मात्रा में बहुत छोटा: स्वतंत्र शब्दों के रूप में (उनमें सर्वनाम, पूर्वसर्ग, संयोजन और सहायक शब्द शामिल हैं) वे आम तौर पर कम संख्या में स्वरों से मिलकर होते हैं, और "जुड़े रूपों के रूप में" "- एक या दो स्वरों से 8 7 . भाषाई तत्व जितना छोटा होता है, उसकी "लंबाई" (मात्रात्मक क्षण) उतनी ही कम सक्षम होती है, जो एक परिभाषित विशेषता के रूप में काम करती है, और इस उद्देश्य के लिए स्वरों की "गुणवत्ता" अधिक महत्वपूर्ण होती है। विचाराधीन समस्या को हल करने के लिए कौन से तरीके प्रस्तावित हैं? इसे व्याकरणिक की विशुद्ध रूप से मात्रात्मक अवधारणा का हवाला देकर हल किया जाता है<128>लोड, "मान लीजिए," इस संबंध में हेरडन लिखते हैं, "कि हम इस संबंध में दो भाषाओं की तुलना करने में रुचि रखते हैं। हम एक निश्चित डिग्री निष्पक्षता के साथ "व्याकरणिक भार" का निर्धारण कैसे करते हैं जो एक भाषा वहन करती है? स्पष्ट है कि यह भार व्याकरण को शब्दावली से अलग करने वाली सीमांकन रेखा की स्थिति पर निर्भर करेगा। हमारे दिमाग में आने वाला पहला विचार यह निर्धारित करना है कि किसी भाषा का व्याकरण कितना "जटिल" है। आखिरकार, "जटिलता" एक गुणात्मक विशेषता है, और "व्याकरणिक भार" की अवधारणा एक मात्रात्मक विशेषता है। सच है, भार कुछ हद तकजटिलता पर निर्भर करता है, लेकिन पूरी तरह से नहीं। एक भाषा को एक अत्यंत जटिल व्याकरण से पुरस्कृत किया जा सकता है, लेकिन भाषा की गतिविधि में इसका केवल एक तुलनात्मक रूप से छोटा हिस्सा ही प्रयोग किया जाता है। हम "व्याकरणिक भार" को व्याकरण की समग्रता के रूप में परिभाषित करते हैं जो एक भाषा कार्रवाई में होने पर होती है, जो हमारी समस्या को संरचनात्मक भाषाविज्ञान के दायरे में तुरंत लाती है जिसमें अनुशासन को सॉसर द्वारा परिभाषित किया गया था। निम्नलिखित प्रस्तुति में, भाषा के बीच अंतर को निर्धारित करने के लिए मात्रात्मक तरीकों का उपयोग किया जाता है, जहां सीमा स्थित है, व्याकरण को शब्दावली से अलग करती है" 8 8। दूसरे शब्दों में, इस मामले में भाषा के अंतर को व्याकरणिक और शाब्दिक तत्वों के बीच संख्यात्मक संबंधों में अंतर तक कम किया जाना चाहिए।

हमारे निपटान में सामग्री निम्नलिखित चित्र को चित्रित करती है। अंग्रेजी में (केवल "व्याकरणिक शब्दों" को ध्यान में रखा गया था: सर्वनाम, या, जैसा कि उन्हें "विकल्प", पूर्वसर्ग, संयोजन और सहायक क्रिया भी कहा जाता है), एक खंड में जिसमें सभी शब्दों के उपयोग के 78633 मामले शामिल हैं (1027) अलग-अलग शब्द), 53,102 व्याकरणिक तत्वों के उपयोग का मामला, या, अधिक सटीक रूप से, "व्याकरणिक शब्द" (149 अलग-अलग शब्द), जो कि 67.53% है, जिसमें 15.8% विभिन्न शब्द हैं। Deway 8 9 के आंकड़े ऐसे हैं। अन्य डेटा एक अलग प्रतिशत दिखाते हैं<129>अनुपात: 57.1% 5.4% विभिन्न शब्दों के साथ 9 0। इस महत्वपूर्ण विसंगति को लिखित और बोली जाने वाली भाषा के बीच के अंतर से समझाया गया है। भाषा के लिखित रूप (पहला डेटा) माना जाता है कि मौखिक (दूसरा मामला) की तुलना में अधिक व्याकरणिक तत्वों का उपयोग करता है। दांते की डिवाइन कॉमेडी (इतालवी मूल के बाद) में, मारियोटी ने "व्याकरणिक शब्दों" की घटनाओं का 54.4% स्थापित किया।

किसी भाषा के व्याकरणिक भार को निर्धारित करने का एक और और स्पष्ट रूप से अधिक सही तरीका व्याकरणिक तत्वों में शामिल स्वरों की गणना करना है। इस मामले में, न केवल स्वतंत्र व्याकरणिक शब्दों को ध्यान में रखा जाता है, बल्कि संबंधित रूपों को भी ध्यान में रखा जाता है। यहां विभिन्न विकल्प हैं। उदाहरण के लिए, व्याकरणिक तत्वों में व्यक्तिगत व्यंजन स्वरों के उपयोग की सापेक्ष आवृत्ति का निर्धारण करना और उनकी तुलना इन समान स्वरों के कुल उपयोग की आवृत्ति से करना (अंग्रेजी में इस तरह के अनुपात का अंतिम डेटा 99.9% से 100,000 का अनुपात देता है - कुल उपयोग); या अलग-अलग वर्गीकरण समूहों (प्रयोगशाला, तालु, वेलार और अन्य स्वर) के अनुसार व्यंजन की समान तुलना। यहां अंतिम अनुपात 56.47% (व्याकरणिक तत्वों में) से 60.25% (कुल उपयोग में) के अनुपात का रूप लेता है; या प्रारंभिक व्यंजन स्वरों की समान तुलना (इस मामले में, हमें व्याकरणिक शब्दों में कुल उपयोग में 100.2% और कुल उपयोग में 99.95 का अनुपात मिला)। अन्य अधिक जटिल सांख्यिकीय संचालन भी संभव हैं, हालांकि, अध्ययन के तहत समस्या के समान मात्रात्मक अभिव्यक्तियों के परिणामस्वरूप।

दिए गए मात्रात्मक डेटा एक सामान्य निष्कर्ष के आधार के रूप में कार्य करते हैं। यह इस तथ्य पर उबलता है कि व्याकरणिक तत्वों में स्वरों का वितरण समग्र रूप से भाषा में स्वरों के वितरण (संख्यात्मक शब्दों में, निश्चित रूप से) की प्रकृति को निर्धारित करता है। और यह, बदले में, हमें यह निष्कर्ष निकालने की अनुमति देता है कि व्याकरणिक तत्वों का कम से कम उपयोग व्यक्तिगत पसंद पर निर्भर करता है और भाषाई अभिव्यक्ति के उस हिस्से का गठन करता है जो संभावनाओं द्वारा नियंत्रित होता है।<130>नेस। इस सट्टा निष्कर्ष की पुष्टि एस्सेलसन 9 1 द्वारा बनाई गई रूसी भाषा में व्याकरणिक रूपों की गणना से होती है। अध्ययन स्रोत II से लिए गए 46896 शब्दों के अधीन था (ग्रिबॉयडोव, दोस्तोवस्की, गोंचारोव, साल्टीकोव-शेड्रिन, गार्शिन, बेलिंस्की, एम्फिटेट्रोव, गुसेव-ओरेनबर्गस्की, एहरेनबर्ग, सिमोनोव और एन। ओस्ट्रोव्स्की द्वारा काम करता है)। उन्हें बोलचाल के शब्दों (17,756 शब्द या 37.9%) और गैर-बोलचाल (29140 शब्द या 62.1%) में विभाजित किया गया था। फिर शब्दों के पूरे सेट को उनकी व्याकरणिक प्रकृति के आधार पर 4 समूहों में विभाजित किया गया था: पहले समूह में संज्ञा, विशेषण, संज्ञा, सर्वनाम और विभक्त अंकों के कार्य में विशेषण शामिल थे; दूसरे समूह में - क्रिया; तीसरे समूह में - मौखिक कृदंत, विशेषण और संज्ञा और गेरुंड के कार्य में भाग लेने वाले; 4 वें समूह में - क्रियाविशेषण, पूर्वसर्ग, संयोजन और कणों के अपरिवर्तनीय रूप। सारांश परिणाम (व्यक्तिगत लेखकों के लिए डेटा के साथ टेबल भी दिए गए हैं) निम्नलिखित अनुपात देते हैं:

पहला समूह

दूसरा समूह

तीसरा समूह

चौथा समूह

बोल-चाल का

अल्पभाषी

हेर्डन निम्नलिखित शब्दों में प्राप्त मात्रात्मक डेटा के विचार की विशेषता है: "वे इस निष्कर्ष को सही ठहराते हैं कि व्याकरणिक तत्वों को एक कारक के रूप में माना जाना चाहिए जो भाषाई अभिव्यक्ति की संभावना को निर्धारित करता है। इस तरह का निष्कर्ष इस्तेमाल किए गए प्रत्येक शब्द की बोझिल योग्यता से बचा जाता है। यह स्पष्ट है कि, चूंकि व्याकरण और शब्दावली निर्विवाद गोले में संग्रहीत नहीं हैं, न ही शुद्ध "पसंद" या शुद्ध "मौका" है। व्याकरण और शब्दावली दोनों में दोनों तत्व होते हैं, हालांकि काफी भिन्न अनुपात में" 9 2।<131>

हेरडन की पुस्तक का एक बड़ा भाग भाषा में द्वैत या द्वैत के अध्ययन के लिए समर्पित है, और द्वैत की अवधारणा गणितीय विशेषताओं पर आधारित है।

इस प्रकार, प्रक्षेप्य ज्यामिति में प्रमेयों को दो श्रृंखलाओं में व्यवस्थित किया जा सकता है, ताकि एक श्रृंखला के प्रत्येक प्रमेय को शब्दों के स्थान पर दूसरी श्रृंखला के किसी प्रमेय से प्राप्त किया जा सके। दूरसंचार विभागऔर सीधा।उदाहरण के लिए, यदि कथन दिया गया है: "कोई भी अलग-अलग बिंदु एक और केवल एक पंक्ति से संबंधित हैं," तो हम इससे संबंधित कथन प्राप्त कर सकते हैं: "कोई भी दो अलग-अलग रेखाएं एक और केवल एक बिंदु से संबंधित होती हैं।" द्वैत का निर्धारण करने की एक अन्य विधि भुज और y-अक्ष के अनुदिश आलेखित करना है विभिन्न योजनाएंअध्ययन के तहत घटना। इसलिए, जैसा कि यूल 9 3 करता है, उदाहरण के लिए, उपयोग की विभिन्न आवृत्तियों को एब्सिस्सा के साथ गिना जाता है, और शाब्दिक इकाइयों की संख्या जिनकी आवृत्ति निर्धारित की जाती है, आदि को कोर्डिनेट के साथ गिना जाता है। भाषाई अनुसंधान।

इस तरह से परिभाषित द्वैत की अवधारणा के तहत, जिसमें सभी मामलों में वास्तव में एक बाइनरी कोड का चरित्र होता है और जिसे भाषाई संरचना की सबसे आवश्यक विशेषता भी माना जाता है, अत्यंत भिन्न गुणों की घटनाएं सामने आती हैं, जिससे दो विमानों के साथ विरोध की अनुमति मिलती है। : शाब्दिक इकाइयों की प्रकृति के अनुसार शब्दों के उपयोग का वितरण और आवृत्ति के अनुसार शाब्दिक इकाइयों का वितरण। शब्दों का उपयोग; भाषण के लिखित और बोले गए रूप; शाब्दिक और व्याकरणिक तत्व; पर्यायवाची और विलोम; ध्वनि और इसका ग्राफिक प्रतिनिधित्व; निश्चित और परिभाषित करने योग्य (सॉसुरे का अर्थपूर्ण और महत्वपूर्ण), आदि।

एक विशेष, भाषाई घटना या सीमित "पाठ" के द्वंद्व के मात्रात्मक अध्ययन के बाद, एक नियम के रूप में, एक निष्कर्ष निकाला जाता है, जिसके लिए भाषाई सार्वभौमिकता के गुणों को जिम्मेदार ठहराया जाता है। इस तरह के निष्कर्षों की प्रकृति और उनके औचित्य के तरीके को उदाहरण में देखा जा सकता है<132>शब्द और अवधारणा के द्वैत का अध्ययन (वास्तव में, हम शब्द की लंबाई और अवधारणा की मात्रा के अनुपात के बारे में बात कर रहे हैं - यह ध्यान में रखना चाहिए कि भाषाई और अन्य शब्दों का अत्यंत मुक्त उपयोग ऐसे कार्य अक्सर समझ को बहुत कठिन बना देते हैं)। यहां यह ध्यान रखना महत्वपूर्ण है कि इस प्रकार के भाषाई द्वैत के अवलोकन के स्रोत के रूप में बीमारियों के अंतर्राष्ट्रीय नामकरण (लगभग 1000 नाम) और इंग्लैंड और वेल्स में बीमारियों के सामान्य रजिस्टर का उपयोग इस प्रकार के भाषाई द्वंद्व के अवलोकन के स्रोत के रूप में किया गया था। निष्कर्ष निकाला जाता है: "एक सामान्य विचार को दर्शाने वाली प्रत्येक अवधारणा में "गोला" या "वॉल्यूम" कहा जा सकता है। यह अपने माध्यम से कई वस्तुओं या अन्य अवधारणाओं के बारे में सोचने की अनुमति देता है जो इसके "क्षेत्र" के भीतर हैं। दूसरी ओर, एक अवधारणा को परिभाषित करने के लिए आवश्यक सभी वस्तुओं को इसकी "सामग्री" कहा जाता है। आयतन और सामग्री परस्पर सहसंबद्ध हैं - सामग्री जितनी छोटी होती है और, तदनुसार, अवधारणा जितनी अधिक अमूर्त होती है, उसका दायरा या आयतन उतना ही बड़ा होता है, अर्थात, अधिक वस्तुओं को इसके तहत लाया जाता है। इसे कोडिंग के सिद्धांतों के लिए एक सादृश्य (वैचारिक क्षेत्र में) के रूप में देखा जा सकता है, जिसके अनुसार प्रतीक की लंबाई और उपयोग की आवृत्ति अन्योन्याश्रित हैं ”9 4 ।

द्वैत का सिद्धांत विशेष समस्याओं पर भी लागू होता है। उदाहरण के लिए, दो अलग-अलग भाषाओं में शब्दों के अर्थों की समानता स्थापित करते समय। पुनरावृत्तियों की गणितीय पद्धति का उपयोग करते हुए म्यूरेट-ज़ेंडर्स के अंग्रेजी-जर्मन शब्दकोश का अध्ययन करने के परिणामस्वरूप, यह निष्कर्ष निकाला गया है कि जर्मन अनुवाद में एक या अधिक अर्थ वाले अंग्रेजी शब्द का उपयोग करने की संभावना पूरे शब्दकोश में प्रत्येक प्रारंभिक अक्षर के लिए स्थिर रहती है। 9 5. चीनी शब्दकोशों में शब्द क्रम पर विचार करने से यह निष्कर्ष निकलता है कि यह एक टैक्सोनॉमिक प्रकृति का है, क्योंकि चरित्र में स्ट्रोक की संख्या इसके स्थान को इंगित करती है (एक स्वतंत्र कट्टरपंथी या कट्टरपंथी के अधीनस्थ एक निश्चित उपवर्ग के रूप में)। वर्गीकरण प्राणीशास्त्र और वनस्पति विज्ञान में प्रयुक्त वर्गीकरण का एक अधीनस्थ सिद्धांत है। खेरदान का दावा है कि<133>चीनी शब्दावली की नींव भी टैक्सोनॉमी 9 6, आदि के सिद्धांतों पर बनी है।

भाषाई समस्याओं (यानी, भाषाई सांख्यिकी) के अध्ययन के लिए गणितीय तरीकों के आवेदन के इस क्षेत्र का एक सामान्य मूल्यांकन करना, जाहिरा तौर पर, एटिंगर द्वारा तैयार की गई स्थिति से आगे बढ़ना आवश्यक है: "गणित का प्रभावी ढंग से उपयोग किया जा सकता है भाषाविज्ञान की सेवा में तभी जब भाषाविद इसके अनुप्रयोग की वास्तविक सीमाओं के साथ-साथ उपयोग किए गए गणितीय मॉडल की संभावनाओं को स्पष्ट करते हैं" 9 7 । दूसरे शब्दों में, हम गणितीय भाषाविज्ञान के बारे में बात कर सकते हैं जब गणितीय विधियां उन भाषाई समस्याओं को हल करने के लिए उपयुक्त साबित होती हैं, जो उनकी समग्रता में भाषा के विज्ञान का गठन करती हैं। यदि ऐसा नहीं है, हालांकि यह वैज्ञानिक अनुसंधान के नए पहलुओं को खोल सकता है, तो इस मामले में हम कुछ भी बात कर सकते हैं, लेकिन भाषाविज्ञान के बारे में नहीं - इस मामले में, हमारा मतलब विभिन्न प्रकार के अनुप्रयुक्त भाषाविज्ञान से नहीं है (हम इसके बारे में बात करेंगे यह बाद में) भाषण नीचे), लेकिन वैज्ञानिक, या सैद्धांतिक, भाषाविज्ञान। इस स्थिति के आधार पर, यह ध्यान दिया जाना चाहिए कि भाषाविद् के दृष्टिकोण से, भाषाई आंकड़ों में बहुत कुछ संदिग्ध और यहां तक ​​​​कि चौंकाने वाला भी है।

आइए हम केवल दो उदाहरणों के विश्लेषण की ओर मुड़ें (ताकि प्रस्तुति को अव्यवस्थित न करें), यह निर्धारित करते हुए कि उनमें से प्रत्येक पर बहुत महत्वपूर्ण आपत्तियां की जा सकती हैं। यहां हमारे पास व्याकरणिक और शाब्दिक इकाइयों के बीच मात्रात्मक अंतर है। यह पता चला है कि इस तरह के अंतर को बनाने के लिए, पहले से ही यह जानना आवश्यक है कि व्याकरण के क्षेत्र से क्या संबंधित है, और शब्दावली का क्या है, क्योंकि भाषा के "व्याकरणिक भार" (यानी, व्याकरणिक तत्वों की समग्रता) भाषण में प्रयोग किया जाता है), जैसा कि ऊपर उद्धृत किया गया है, "सीमांकन की रेखा पर निर्भर करता है जो शब्दावली को व्याकरण से अलग करता है।" यह जाने बिना कि यह रेखा कहाँ है, इसलिए संकेतित अंतर को खींचना असंभव है। फिर व्याकरण से शाब्दिक भेद करने की मात्रात्मक विधि का क्या अर्थ है?<134>पागल? हालांकि, हेरडन के लिए, वह विशेष रूप से इस मुद्दे के बारे में नहीं सोचता है और व्याकरणिक तत्वों "संबंधित रूपों" का जिक्र करते हुए, भाषाई तत्वों को साहसपूर्वक वर्गीकृत करता है, जिसे प्रस्तुति के आधार पर, बाहरी विभक्ति और "व्याकरणिक शब्दों" के रूप में समझा जाना चाहिए। पूर्वसर्ग, संयोजन, सहायक क्रिया और सर्वनाम शामिल करें - उत्तरार्द्ध इस तथ्य के आधार पर कि वे "विकल्प" हैं। लेकिन अगर हम केवल सर्वनाम के इस गुण की बात करें और इस आधार पर उन्हें व्याकरणिक तत्वों से जोड़ दें, तो जाहिर है, "उपर्युक्त", "नाम", "दिया", आदि जैसे शब्दों को भी उनके लिए जिम्मेदार ठहराया जाना चाहिए, इसलिए वे भी कैसे डिप्टी के रूप में कार्य करते हैं। भाषाई आँकड़ों में प्रयुक्त व्याकरणिक तत्वों को अलग करने की विधि के संबंध में, यह प्रश्न स्वाभाविक रूप से उठता है कि इस मामले में शब्द क्रम, स्वर, शून्य मर्फीम, प्रतिमान संबंध (इनमें से कुछ घटनाएं) जैसी "गैर-औपचारिक" व्याकरणिक घटनाओं से कैसे निपटें। , वैसे, उन भाषाओं में प्रतिबिंब खोजें जिनका अध्ययन गणितीय विधियों द्वारा किया जाता है)? समृद्ध आंतरिक विभक्ति (जैसे, उदाहरण के लिए, सेमिटिक भाषाओं में) के साथ भाषाओं में अंतर कैसे आकर्षित करें, जहां यह न केवल व्याकरणिक रूप से जड़ (कट्टरपंथी) को संशोधित करता है, बल्कि इसे शाब्दिक अस्तित्व भी देता है, क्योंकि बिना क्रमपरिवर्तन के जड़ है भाषा में कोई वास्तविक अस्तित्व नहीं है? किसी भाषा की व्याकरणिक जटिलता से क्या समझा जाना चाहिए, यह किस मानदंड से निर्धारित होता है? यदि मात्रात्मक बिंदु, जिस पर इस मामले में हर संभव तरीके से जोर दिया गया है, तो सबसे व्याकरणिक रूप से कठिन भाषाओं में से एक अंग्रेजी होगी, जिसमें इस तरह के निर्माण हैं जैसे कि ईशाल कॉल कर रहा होगा या वह कॉल कर रहा होगा। इन वाक्यों में, केवल कॉल को लेक्सिकल के रूप में वर्गीकृत किया जा सकता है, और बाकी सब कुछ, इसलिए, व्याकरणिक माना जाना चाहिए। व्याकरणिक तत्वों के उपयोग की आवृत्ति को व्याकरणिक शब्दों के अर्थ की व्यापकता या अमूर्तता से जोड़ने के लिए कौन से आधार मौजूद हैं? आखिरकार, यह बिल्कुल स्पष्ट है कि व्याकरणिक तत्वों के उपयोग की अपेक्षाकृत बड़ी आवृत्ति वाक्यों के निर्माण में उनके कार्य से निर्धारित होती है, और जहां तक ​​​​अर्थों की अमूर्तता का संबंध है, एक बड़ा खोजना बहुत आसान है।<135>शाब्दिक तत्वों की संख्या जो इस संबंध में व्याकरणिक तत्वों के साथ आसानी से प्रतिस्पर्धा कर सकते हैं, आवृत्ति में उनसे काफी कम हैं (उदाहरण के लिए, अस्तित्व, अस्तित्व, विस्तार, स्थान, पदार्थआदि)।

इसी तरह की बेतुकी बात हमारे सामने शब्द और अवधारणा के द्वैत (द्वैत) की परिभाषा के मामले में पैदा होती है। रोगों के नामकरण और रोगों के अस्पताल रजिस्टर का उपयोग करके इसे शोध के अधीन करने के लिए भाषा के संरचनात्मक सार की एक अत्यंत विशिष्ट समझ होना आवश्यक है, जैसा कि ऊपर बताया गया है, बहुत महत्वपूर्ण भाषाई के लिए स्रोत सामग्री के रूप में कार्य करता है। निष्कर्ष ऐसे शब्दों के पूरी तरह से अस्पष्ट उपयोग पर ध्यान दिए बिना जिनका कोई भाषाई अस्तित्व नहीं है, जैसे कि एक अवधारणा का क्षेत्र, दायरा और सामग्री (वैसे, शब्द का शाब्दिक अर्थ और वैज्ञानिक शब्द द्वारा निरूपित अवधारणा स्थूल रूप से हैं भ्रमित), आइए हम उस निष्कर्ष की ओर मुड़ें जो इस मामले में किया गया है। जैसा कि ऊपर कहा गया है, हम इस दावे से निपट रहे हैं कि "दायरा और सामग्री परस्पर सहसंबद्ध हैं।" इस तरह के निष्कर्ष को जन्म देने वाले तर्क के पूरे पाठ्यक्रम के साथ-साथ भाषाई तथ्यों के गणितीय संचालन के तरीके से स्पष्ट रूप से पता चलता है कि इस मामले में भाषा के एक बहुत ही आवश्यक गुण को पूरी तरह से नजरअंदाज कर दिया जाता है, जो सभी गणनाओं को परेशान करता है। : अलग-अलग "मात्रा" की भाषाई इकाइयों द्वारा एक ही चीज़। सामग्री" को व्यक्त करने की क्षमता, जो निस्संदेह, इसके अलावा, उपयोग की अलग-अलग सापेक्ष आवृत्ति है। इसलिए, हम उसी व्यक्ति को पेट्रोव, मेरे परिचित, वह, एक मस्कोवाइट, एक युवक, एक विश्वविद्यालय कर्मचारी, मेरी पत्नी का भाई, एक आदमी जिसे हम पुल पर मिले थे, आदि के रूप में नामित कर सकते हैं। ऐसे तथ्यों के आलोक में, वहाँ इसमें कोई संदेह नहीं है कि केवल निजी निष्कर्ष हैं, हालांकि, जैसा कि बताया गया था, सार्वभौमिक महत्व जुड़ा हुआ है, लेकिन ऐसी भाषाई समस्याओं के लिए मात्रात्मक तरीकों को स्वयं लागू करने की उपयुक्तता भी है।

लेकिन कभी-कभी भाषाविदों को निष्कर्ष की पेशकश की जाती है, जिसकी वैधता संदेह में नहीं है। यह "भाषा का मूल नियम" है, जिसमें यह तथ्य शामिल है कि भाषा में इसके तत्वों की एक निश्चित स्थिरता और उनके उल्लेख की सापेक्ष आवृत्ति होती है।<136>उपभोग। हालाँकि, इस तरह की खोजों के साथ समस्या यह है कि वे लंबे समय से भाषाविदों के लिए जानी जाती हैं। आखिरकार, यह बिल्कुल स्पष्ट है कि यदि भाषा में एक निश्चित स्थिरता नहीं होती और किसी दिए गए भाषाई समुदाय का प्रत्येक सदस्य स्वतंत्र रूप से भाषा के तत्वों को अलग करता है, तो पारस्परिक संचार संभव नहीं होगा और भाषा का अस्तित्व ही अर्थहीन हो जाएगा। . भाषा के अलग-अलग तत्वों के उपयोग की सापेक्ष आवृत्ति के वितरण के लिए, इसने भाषा विज्ञान में निष्क्रिय और सक्रिय शब्दावली और व्याकरण की श्रेणियों के आवंटन के रूप में अपनी अभिव्यक्ति पाई है, जिस पर एल। वी। शचरबा ने इतना ध्यान दिया। इस मामले में, सांख्यिकीय विधियां केवल भाषाविदों को उनके उपयोग की सापेक्ष आवृत्ति की श्रेणियों के अनुसार विशिष्ट भाषाई तत्वों के वितरण में मदद कर सकती हैं, लेकिन उनके पास सैद्धांतिक भाषाविज्ञान के लिए मूल्यवान किसी भी नए पैटर्न की खोज करने का दावा करने का कोई कारण नहीं है।

दूसरी ओर, भाषाई आँकड़े वास्तव में कई "मूल" निष्कर्ष प्रस्तुत करते हैं जो इसके अनुयायियों की वैज्ञानिक सोच की प्रकृति का अत्यंत संकेत देते हैं। इस प्रकार, चर्चिल, बेन्स, हैलिफ़ैक्स, स्ट्रेसेमैन और अन्य के कार्यों में "राजनीतिक शब्दावली" का अध्ययन जटिल सांख्यिकीय विधियों के साथ किया जाता है, और उनके कार्यों का अंग्रेजी में अनुवाद गैर-अंग्रेजी भाषी लेखकों के लिए गणना में उपयोग किया जाता है। गणना के परिणाम कई तालिकाओं, गणितीय सूत्रों और समीकरणों के रूप में प्रस्तुत किए जाते हैं। इस मामले में मात्रात्मक डेटा की भाषाई व्याख्या इस तथ्य से उबलती है कि चर्चिल का "राजनीतिक शब्दावली" का उपयोग लेखकों के इस समूह के लिए सबसे विशिष्ट (?) अंग्रेजी भाषण समूह के 9 8।

एक अन्य मामले में, उपयुक्त सांख्यिकीय जोड़तोड़ के बाद, यह निष्कर्ष निकाला गया कि हिटलर ने नाजी जर्मनी के उपयोग में इन शर्तों के मात्रात्मक अर्थ में "भाषा" और "भाषण" के बीच द्वंद्व का उल्लंघन किया। इस द्वैत के विनाश का एक विशेष मामला है शाब्दिक समझ<137>रूपक मोड़ (उदाहरण के लिए, "खुले घावों में नमक डालना")। नाजी जर्मनी ने खुद को इतने अमानवीय कृत्यों के साथ ब्रांड किया कि इस भाषाई अत्याचार के लिए उसे दोषी ठहराने की शायद ही कोई जरूरत है 9 9. खेरदान के अनुसार, विचार की तात्कालिक वास्तविकता के रूप में भाषा की मार्क्स की परिभाषा भी भाषाई द्वैत के उल्लंघन की ओर ले जाती है, और एक घटना के इसके विपरीत में संक्रमण के बारे में द्वंद्वात्मकता का कानून, उनकी राय में, द्वैत के गलत समझा भाषाई कानून है। भाषा का। ऐसी व्याख्याएं अपने लिए बोलती हैं।

अंत में, भाषाई सामग्री का अध्ययन करने की मात्रात्मक विधि के उपरोक्त सभी मामलों में निहित एक सामान्य कमी और इस प्रकार एक पद्धतिगत चरित्र प्राप्त करना भाषाई तत्वों के लिए एक दूसरे से बिल्कुल स्वतंत्र तथ्यों के यांत्रिक सेट के रूप में दृष्टिकोण है, जिसके अनुसार, यदि कोई हो या पैटर्न, वे केवल स्वायत्त तथ्यों के वितरण के संख्यात्मक संबंधों को संदर्भित करते हैं, उनकी प्रणालीगत निर्भरता के बाहर। सच है, जे. वाटमो यह सुनिश्चित करने के लिए हर संभव तरीके से प्रयास कर रहा है कि यह गणित है जो किसी भी प्रकार के भाषाई संरचनात्मक विश्लेषण से बेहतर है, जो किसी भाषा की संरचनात्मक विशेषताओं को प्रकट करने में सक्षम है। "आधुनिक गणित," वे लिखते हैं, "माप और कलन से संबंधित नहीं है, जिसकी सटीकता उनकी प्रकृति से सीमित है, लेकिन मुख्य रूप से संरचना के साथ है। यही कारण है कि गणित भाषा सीखने की सटीकता के लिए अत्यधिक अनुकूल है - इस हद तक कि एक अलग विवरण, प्रकृति में और भी सीमित, सक्षम नहीं है ... जैसे भौतिकी में, गणितीय तत्वों का उपयोग भौतिक दुनिया का वर्णन करने के लिए किया जाता है, चूंकि उन्हें भौतिक दुनिया के तत्वों के अनुरूप माना जाता है, इसलिए गणितीय भाषाविज्ञान में गणितीय तत्वों को भाषण की दुनिया के तत्वों के अनुरूप माना जाता है" 101। लेकिन प्रश्न का ऐसा सूत्रीकरण किसी भी तरह से स्थिति को नहीं बचाता है, क्योंकि यह सबसे अच्छा हो सकता है<138>भाषा का विश्लेषण या तो एक भौतिक संरचना के रूप में करें, जो अभी भी एक भाषा के लिए पर्याप्त से दूर है, और अंतिम विश्लेषण में अभी भी एक ही यंत्रवत चरित्र का है, या एक तार्किक-गणितीय संरचना के रूप में है, और यह भाषा को एक अलग में स्थानांतरित करता है विमान, और कई मायनों में इसके लिए विदेशी। यह ध्यान रखना अतिश्योक्तिपूर्ण नहीं है कि वाटमो केवल भविष्य में और उनके लिए गणितीय भाषाविज्ञान की सफलता की भविष्यवाणी करता है वास्तविक परिणाम, तो वह उन्हें निम्नलिखित शब्दों में एक मूल्यांकन देता है: "... हेरडन, जिपफ, यूल, गुइरो (गुइरो) और अन्य द्वारा आज तक किए गए लगभग सभी कार्य भाषाविज्ञान और गणित दोनों की आलोचना के दायरे से बाहर नहीं हैं। ; वह बहुत हद तक शौकियापन की बू आती है ”103। इस प्रकार, यदि हम भाषाई अनुसंधान में गणितीय विधियों के भविष्य की भविष्यवाणी करने की कोशिश नहीं करते हैं, लेकिन आज हमारे पास जो कुछ है, उसकी सराहना करने का प्रयास करते हैं, तो हमें यह स्वीकार करना होगा कि वास्तव में, गणित अब तक सीमित है भाषाविज्ञान का क्षेत्र केवल "माप और गणना" के लिए, और मैं इसकी संरचना में तल्लीन करते हुए, भाषा का गुणात्मक विश्लेषण नहीं दे सका।<139>

आइए यथासंभव उद्देश्य बनने की कोशिश करें। एक निश्चित भाग में, मात्रात्मक डेटा, जाहिरा तौर पर, भाषाविज्ञान द्वारा उपयोग किया जा सकता है, लेकिन केवल सहायक के रूप में और मुख्य रूप से उन समस्याओं में जिनका व्यावहारिक अभिविन्यास है। व्यक्तिगत भाषाई घटनाओं के अध्ययन के अधिकांश मात्रात्मक तरीकों के संबंध में, आर। ब्राउन का सामान्य निष्कर्ष निस्संदेह उचित है: "उन्हें खेरदान के रूप में माना जा सकता है, लेकिन इस सब का अर्थ क्या है?" 104. आइए कल्पना करें कि हम प्रश्न पूछते हैं: "इस बगीचे में पेड़ क्या हैं?"। और जवाब में हमें मिलता है: "इस बगीचे में सौ पेड़ हैं।" क्या यह हमारे प्रश्न का उत्तर है, और क्या इसका वास्तव में कोई अर्थ है? लेकिन कई भाषाई प्रश्नों के संबंध में, गणितीय विधियां ऐसे ही उत्तर देती हैं।

हालांकि, मुख्य रूप से गणितीय विधियों का उपयोग करते हुए और साथ ही उन्हें भाषाई सामग्री पर उन्मुख करते हुए, अनुसंधान गतिविधि का एक विस्तृत क्षेत्र है, जहां इस तरह के संयोजन की उपयुक्तता संदेह से परे है। इस शोध गतिविधि का "अर्थ", इसका महत्व उन लक्ष्यों से निर्धारित होता है जिनकी वह आकांक्षा करता है। व्यवहार में इसका परीक्षण पहले ही किया जा चुका है। इस मामले में, हम सूचना मशीनों के निर्माण से जुड़ी समस्याओं के बारे में बात कर रहे हैं, लिखित वैज्ञानिक ग्रंथों के मशीनी अनुवाद के लिए संरचनाएं, एक भाषा से दूसरी भाषा में मौखिक भाषण के अनुवाद का स्वचालन और संयुक्त कार्यों की पूरी श्रृंखला के साथ। साइबरनेटिक्स के भाषाई मुद्दों में। ऐसी समस्याओं के पूरे सेट को आमतौर पर अनुप्रयुक्त भाषाविज्ञान का सामान्य नाम दिया जाता है। इस प्रकार, यह तथाकथित गणितीय भाषाविज्ञान से अलग है, जिसमें कार्य के उन क्षेत्रों को शामिल किया गया है जिन्हें स्टाइलोस्टैटिस्टिक्स और भाषाई आंकड़ों के रूप में ऊपर नामित किया गया है, हालांकि यह किसी भी तरह से भाषाई सामग्री के सांख्यिकीय प्रसंस्करण से बचा नहीं जाता है। शायद अनुप्रयुक्त भाषाविज्ञान की सबसे महत्वपूर्ण विशेषता, इसे गणितीय भाषाविज्ञान से अलग करना, जैसा कि ऊपर बताया गया है, यह है कि पूर्व की विपरीत दिशा है: भाषाविज्ञान के लिए गणित नहीं, बल्कि भाषाविज्ञान।<140>(गणितीय विधियों द्वारा औपचारिक) व्यावहारिक समस्याओं की एक विस्तृत श्रृंखला के लिए।

व्यक्तिगत समस्याओं की सामग्री का खुलासा करने की कोई आवश्यकता नहीं है जो अब लागू भाषाविज्ञान के अत्यंत व्यापक क्षेत्र में शामिल हैं। गणितीय भाषाविज्ञान के विपरीत, सोवियत भाषाई साहित्य में इन समस्याओं पर सक्रिय रूप से चर्चा की जाती है और अनुसंधान संस्थानों की वैज्ञानिक समस्याओं में तेजी से प्रमुख स्थान पर कब्जा करना शुरू कर देते हैं 105 . इस प्रकार, वे पहले से ही हमारे भाषाई समुदाय के लिए जाने जाते हैं। हालाँकि, यह परिस्थिति हमें भाषा विज्ञान के सिद्धांतों के दृष्टिकोण से, विशेष रूप से, उन्हें प्रतिबिंब के अधीन करने की आवश्यकता से मुक्त नहीं करती है। यह निस्संदेह उन गलतफहमियों को खत्म करने में मदद करेगा जो विज्ञान के प्रतिनिधियों के बीच अधिक से अधिक बार उत्पन्न होती हैं जो एक दूसरे से बहुत दूर हैं और लागू भाषाविज्ञान की समस्याओं पर काम में भाग लेते हैं, और एक तरफ उनके अभिसरण के तरीकों की रूपरेखा तैयार करेंगे। , और दूसरी ओर अनुसंधान के क्षेत्रों का परिसीमन। यह बिना कहे चला जाता है कि निम्नलिखित विचार भाषाविद् के दृष्टिकोण का प्रतिनिधित्व करेंगे, और यह आवश्यक है कि गणितज्ञ न केवल इसे आत्मसात करने का प्रयास करें, बल्कि, उठाए गए प्रश्नों के संबंध में, उन्हें उनकी व्याख्या दें।

भाषाविद्-सिद्धांतकार किसी भी तरह से इस तथ्य से संतुष्ट नहीं हो सकते कि सभी मामलों में<141>अनुप्रयुक्त भाषाविज्ञान द्वारा निर्धारित उद्देश्यों के लिए भाषा, उनका आधार एक गणितीय मॉडल है। इसके अनुसार, भाषा की परिघटनाओं और इस तरह से प्राप्त परिणामों पर टिप्पणियों को गणित के शब्दों और अवधारणाओं के रूप में व्यक्त किया जाता है, अर्थात गणितीय समीकरणों और सूत्रों के माध्यम से। आइए स्पष्टता के लिए एक उदाहरण देखें। Condon 1 06 और Zipf 1 07 ने स्थापित किया कि आवृत्ति के लघुगणक ( एफ) एक बड़े पाठ में शब्दों की घटनाएँ लगभग एक सीधी रेखा में स्थित होती हैं, यदि वे आरेख में रैंक या रैंक के लघुगणक के साथ सहसंबद्ध होते हैं ( आर) इन शब्दों के। समीकरण एफ = सी: आर,कहाँ पे साथएक स्थिरांक है जो इस संबंध को सीमित अर्थों में दर्शाता है कि करोड़निर्धारित मूल्य के लिए आरप्रेक्षित आवृत्ति को बड़े सन्निकटन के साथ पुन: पेश करता है। के बीच संबंध एफऔर आर,गणितीय सूत्र द्वारा व्यक्त, उपयोग की आवृत्ति और शब्दों के रैंक, या रैंक के देखे गए मूल्यों के बीच संबंध के लिए एक मॉडल है। यह गणितीय मॉडलिंग के मामलों में से एक है। मैं

सूचना का संपूर्ण सिद्धांत पूरी तरह से सी. शैनन 108 द्वारा विकसित संचार प्रक्रिया के गणितीय मॉडल पर आधारित है। इसे "एक गणितीय अनुशासन के रूप में परिभाषित किया गया है जो किसी भी डेटा में निहित जानकारी की मात्रा की गणना और अनुमान लगाने के तरीकों के लिए समर्पित है, और जानकारी संग्रहीत करने और संचारित करने की प्रक्रियाओं का अध्ययन" (टीएसबी, वॉल्यूम 51, पी। 128)। तदनुसार, सूचना सिद्धांत की मूल अवधारणाएं एक गणितीय अभिव्यक्ति प्राप्त करती हैं। सूचना को बिनिट्स या बाइनरी इकाइयों में मापा जाता है (एक कोड, जिससे भाषा की तुलना की जाती है, दो सशर्त समान रूप से संभावित संकेतों के साथ प्रत्येक वर्ण के प्रसारण के दौरान सूचना की एक बाइनरी इकाई को प्रसारित करता है। ) -या तो कोड और प्रेषित सूचना की औसत मात्रा<142>संरचनाएं अतिरेक को कोड की कुल संचारण क्षमता के प्रतिशत के रूप में व्यक्त किया जाता है", 1 09 आदि। उसी तरह, मशीन अनुवाद के लिए एक भाषा के तत्वों को दूसरी भाषा में प्रदर्शित करने के एल्गोरिथम विकास की आवश्यकता होती है, आदि। 1 10 । ये मॉडलिंग के अन्य मामले हैं।

किसी भी अर्थ के बिना मॉडल का उपयोग बहुत महत्वपूर्ण मदद कर सकता है, विशेष रूप से, सभी संभावनाओं में, उन समस्याओं को हल करने में जो लागू भाषाविज्ञान स्वयं को सेट करता है। हालांकि, सैद्धांतिक भाषाविज्ञान के लिए, यह बहुत महत्वपूर्ण है कि एक अमूर्त मॉडल, एक नियम के रूप में, एक वास्तविक घटना की सभी विशेषताओं, उसके सभी कार्यात्मक गुणों को पुन: पेश नहीं करता है। तो, एक वास्तुकार, एक घर बनाने से पहले, अपना मॉडल बना सकता है, जो घर के सभी छोटे विवरणों में डिजाइन किए जा रहे घर को पुन: पेश करता है, और इससे उसे घर के निर्माण से संबंधित कई व्यावहारिक मुद्दों को हल करने में मदद मिलती है। लेकिन घर का ऐसा मॉडल, चाहे वह कितना भी सटीक क्यों न हो, उस "कार्य" से रहित है और वह उद्देश्य जिसके लिए सभी घर सामान्य रूप से बनाए गए हैं - यह किसी व्यक्ति को आवास प्रदान करने में सक्षम नहीं है। भाषा के साथ भी स्थिति ऐसी ही है, जहां मॉडल हमेशा अपने सभी गुणों को पुन: पेश करने में सक्षम नहीं होता है। इस मामले में, मामला इस तथ्य से और जटिल है कि मॉडल बनाने के लिए भाषाई नहीं, बल्कि गणितीय मानदंडों का उपयोग किया जाता है। "गणितीय मॉडल ... - ए। एटिंगर लिखते हैं, - प्रौद्योगिकी के सभी क्षेत्रों में एक अत्यंत महत्वपूर्ण भूमिका निभाते हैं, लेकिन चूंकि वे संश्लेषण के लिए एक उपकरण हैं, भाषा विज्ञान के लिए उनका महत्व, जो मुख्य रूप से एक ऐतिहासिक और वर्णनात्मक अनुशासन है, स्वाभाविक रूप से सीमित है " 1 11 .<143>

किसी भाषा का गणितीय मॉडलिंग वास्तव में केवल उसकी स्थिर स्थिति पर लागू होता है, जो एक भाषाविद् के लिए सशर्त है और वास्तव में एक भाषा के मूल गुण के साथ सीधे संघर्ष में है, जिसका अस्तित्व ही विकास है। यह बिना कहे चला जाता है कि किसी भाषा का स्थिर अध्ययन किसी भी तरह से भाषाविज्ञान से अलग नहीं होता है और यह मानक व्याकरण और शब्दकोशों, वर्णनात्मक व्याकरण, व्यावहारिक व्याकरण और शब्दकोशों को संकलित करने का आधार है जो विदेशी भाषाओं के व्यावहारिक अध्ययन के लिए एक मार्गदर्शक के रूप में काम करते हैं, आदि। हालांकि, ऐसे सभी कार्यों में, जो मुख्य रूप से प्रकृति में लागू होते हैं, भाषाविद जानबूझकर अनुसंधान के क्षेत्र को सीमित करते हैं और किसी भी तरह से भाषा के अन्य पहलुओं के लिए अपनी आंखें बंद नहीं करते हैं। भाषा की एक स्थिर परीक्षा के साथ, विशेष रूप से, इसकी गतिशील प्रकृति से जुड़ी भाषा के ऐसे गुण, जैसे उत्पादकता, सोच के रूपों पर निर्भरता, और सांस्कृतिक, सामाजिक, राजनीतिक, ऐतिहासिक और अन्य कारकों के साथ व्यापक बातचीत पूरी तरह से गायब हो जाती है। शोधकर्ता के देखने का क्षेत्र। केवल समकालिक तल पर भाषा को पारंपरिक संकेतों या कोडों की एक प्रणाली के रूप में माना जा सकता है, हालांकि, जैसे ही हम भाषा के लिए अधिक उपयुक्त गतिशील दृष्टिकोण अपनाते हैं, पूरी तरह से अनुचित हो जाता है। यह विकास की प्रक्रियाओं में है कि भाषा के गुण जैसे प्रेरणा, शब्दों की बहुरूपता, जिनकी स्थिर सीमाएँ नहीं हैं, एक शब्द के अर्थ की गैर-स्वायत्तता और उसके ध्वनि खोल, और संदर्भ से जुड़े शब्द की रचनात्मक क्षमता हैं प्रकट होता है, और यह सब एक कोड या संकेत 1 13 की मुख्य विशेषताओं के साथ तीव्र विरोधाभास में है। जाहिर है, लागू भाषाविज्ञान में, कोई भी भाषा के इन सभी गुणों के बारे में सोच सकता है और व्यावहारिक उद्देश्यों के लिए, भाषा के "स्नैपशॉट" के साथ संतुष्ट हो सकता है, जो अभी भी काफी अनुमानित विचार देने में सक्षम है। इसके कामकाज का तंत्र।<144>निरोवानिया। हालांकि, इस तरह के प्रत्येक "स्नैपशॉट", यदि भाषा के एक तथ्य के रूप में माना जाता है, और पारंपरिक कोड की प्रणाली के तथ्य के रूप में नहीं, तो आंदोलन की अंतहीन प्रक्रिया में शामिल किया जाना चाहिए जिसमें भाषा हमेशा मौजूद होती है 1 14। इसका अध्ययन उन विशिष्ट परिस्थितियों के बाहर नहीं किया जा सकता है जो इस आंदोलन की विशेषता रखते हैं, जो भाषा की दी गई स्थिति पर अपनी छाप छोड़ता है और इसके आगे के विकास की संभावना को निर्धारित करता है। यहाँ एक व्यक्ति की क्षणिक तस्वीर और एक सच्चे कलाकार के ब्रश से चित्रित उसके चित्र के बीच समान अंतर है। कलाकार के काम में, हमारे सामने न केवल उसकी शारीरिक उपस्थिति, बल्कि उसकी आंतरिक आध्यात्मिक सामग्री की सभी मौलिकता में एक व्यक्ति की एक सामान्य छवि है। एक कलात्मक चित्र से, हम उस पर चित्रित व्यक्ति के अतीत को भी पढ़ सकते हैं और यह निर्धारित कर सकते हैं कि वह अपने कार्यों में क्या करने में सक्षम है। और एक स्नैपशॉट, हालांकि मूल की उपस्थिति की अधिक सटीक छवि देने में सक्षम है, इन गुणों से रहित है और अक्सर एक आकस्मिक दाना दोनों को पकड़ लेता है जो नाक पर कूद जाता है और<145>एक पूरी तरह से अस्वाभाविक मुद्रा या अभिव्यक्ति, जो अंततः मूल के विरूपण की ओर ले जाती है।

यह ध्यान दिया जाना चाहिए कि "स्नैपशॉट" की विधि, निश्चित रूप से, भाषा के विकास के तथ्यों पर लागू की जा सकती है। लेकिन इस मामले में, हम वास्तव में केवल भाषा के अलग-अलग राज्यों के साथ काम करेंगे, जो कि उनके मात्रात्मक लक्षण वर्णन में, विभिन्न भाषाओं के तुलनात्मक मात्रात्मक लक्षण वर्णन से अधिक नहीं जुड़ा हुआ है। इस प्रकार की मात्रात्मक "गतिशीलता" में कुछ भी कार्बनिक नहीं होगा, और भाषा के अलग-अलग राज्यों के बीच संबंध केवल संख्यात्मक संबंधों की तुलना पर निर्भर करेगा। यदि इस मामले में भी, एक सादृश्य का सहारा लेना है, तो हम बच्चे के विकास का उल्लेख कर सकते हैं। उनके विकास, निश्चित रूप से, उनके वजन, ऊंचाई, उनके शरीर के कुछ हिस्सों की मात्रा के बदलते अनुपात के बारे में संख्यात्मक डेटा की गतिशीलता के रूप में प्रतिनिधित्व किया जा सकता है, लेकिन ये सभी डेटा उन सभी चीजों से बिल्कुल अलग हैं जो मुख्य रूप से व्यक्तिगत सार का गठन करते हैं। किसी व्यक्ति का - उसका चरित्र, झुकाव, आदतें। , स्वाद आदि।

भाषा के गणितीय "मॉडलिंग" का एक और नकारात्मक पक्ष यह है कि यह सामान्य सिद्धांत के रूप में काम नहीं कर सकता है जिसके आधार पर भाषा का व्यापक और व्यापक - व्यवस्थित विवरण करना संभव है। उदाहरण के लिए, भाषा की घटनाओं के लिए केवल एक गणितीय दृष्टिकोण, ऐसे मौलिक प्रश्नों का उत्तर देना संभव नहीं होगा (जिसके बिना भाषा के विज्ञान का अस्तित्व ही अकल्पनीय है), जैसे: भाषा क्या है, क्या घटना होनी चाहिए उचित भाषाई लोगों के लिए जिम्मेदार, एक शब्द या वाक्य को कैसे परिभाषित किया जाता है, मूल अवधारणाएं और भाषा की श्रेणियां क्या हैं, आदि। भाषा के अध्ययन के गणितीय तरीकों की ओर मुड़ने से पहले, पहले से ही उत्तर होना आवश्यक है (यहां तक ​​​​कि के रूप में भी) एक कामकाजी परिकल्पना) इन सभी सवालों के लिए अग्रिम रूप से। इस तथ्य से आंखें मूंदने की आवश्यकता नहीं है कि गणितीय विधियों द्वारा भाषाई घटनाओं के अध्ययन के बारे में हमें ज्ञात सभी मामलों में, इन सभी अवधारणाओं और श्रेणियों को अनिवार्य रूप से स्वीकार किया जाना था क्योंकि उन्हें पारंपरिक या अपेक्षाकृत बोलने से परिभाषित किया गया था, गुणात्मक तरीके।

उनके भाषाई अनुप्रयोग में गणितीय विधियों की यह विशेषता स्पैंग-हैनसेन द्वारा नोट की गई थी जब pi<146>सैल: "यह ध्यान में रखा जाना चाहिए कि अवलोकन किए गए तथ्य जो मात्रात्मक अभिव्यक्ति प्राप्त करते हैं ... कोई मूल्य नहीं है यदि वे विवरण का हिस्सा नहीं बनते हैं, और भाषाई उद्देश्यों के लिए यह एक व्यवस्थित विवरण होना चाहिए, जो गुणात्मक भाषाई से निकटता से संबंधित है। विवरण और सिद्धांत ”1 15। स्पैंग-हैनसेन के एक अन्य भाषण में, हम इस विचार का स्पष्टीकरण पाते हैं: "जब तक एक मात्रात्मक प्रणाली के निर्माण की संभावना साबित नहीं हो जाती है, और जब तक अध्ययन के किसी दिए गए क्षेत्र, आवृत्ति गणना और अन्य के लिए आम तौर पर स्वीकृत गुणात्मक प्रणाली होती है। संख्यात्मक विशेषताओं के साथ भाषाई बिंदुदृष्टि का कोई मतलब नहीं है" 1 16 . इसी तरह के विचार उल्डल द्वारा व्यक्त किए गए हैं, कुछ अप्रत्याशित रूप से उन्हें ग्लोसेमेटिक्स की सामान्य सैद्धांतिक नींव के विकास के साथ जोड़ते हैं: "जब एक भाषाविद् वह सब कुछ गिनता या मापता है जिसे वह गिनता है और मापता है, तो वह अपने आप में मात्रात्मक रूप से निर्धारित नहीं होता है; उदाहरण के लिए, शब्द, जब वे गिने जाते हैं, परिभाषित होते हैं, यदि वे बिल्कुल अलग शब्दों में परिभाषित होते हैं।<147>

इस प्रकार, यह पता चला है कि दोनों सैद्धांतिक शब्दों में और उनके व्यावहारिक अनुप्रयोग में, गणितीय तरीके सीधे भाषाई अवधारणाओं और पारंपरिक, भाषाविज्ञान, या, जैसा कि ऊपर उल्लेख किया गया है, गुणात्मक विधियों द्वारा परिभाषित श्रेणियों पर निर्भर हैं। व्यावहारिक भाषाविज्ञान के संदर्भ में, इस निर्भरता को महसूस करना महत्वपूर्ण है, और, परिणामस्वरूप, पारंपरिक भाषाविज्ञान की मुख्य श्रेणियों की समग्रता से परिचित होना।

सच है, आधुनिक भाषाविज्ञान के डेटा का उपयोग नहीं करने के लिए लागू भाषाविज्ञान के क्षेत्र में काम कर रहे सटीक विज्ञान के प्रतिनिधियों को फटकारने का कोई कारण नहीं है। यह चीजों की वास्तविक स्थिति के अनुरूप नहीं है। वे न केवल पूरी तरह से अच्छी तरह से जानते हैं, बल्कि अपने काम में व्यापक रूप से भाषाविदों द्वारा स्थापित विभेदक विशेषताओं की प्रणालियों का भी उपयोग करते हैं जो विभिन्न भाषाओं की विशेषता हैं, विशिष्ट भाषा प्रणालियों के भीतर भाषाई तत्वों का वितरण और व्यवस्था, ध्वनिक ध्वन्यात्मकता की उपलब्धियां आदि। लेकिन इस मामले में, एक बहुत ही महत्वपूर्ण आरक्षण आवश्यक है। । वास्तव में, सटीक विज्ञान के प्रतिनिधि भाषाविज्ञान में केवल एक दिशा के डेटा का उपयोग करते हैं - तथाकथित वर्णनात्मक भाषाविज्ञान, जो जानबूझकर खुद को सैद्धांतिक भाषाविज्ञान की पारंपरिक समस्याओं से अलग करता है, भाषाई अनुसंधान के पूरे क्षेत्र को एक उचित से कवर करने से दूर है। भाषाई दृष्टिकोण से, इसमें महत्वपूर्ण पद्धतिगत कमियां हैं, जिसके कारण यह हाल ही में सामने आया संकट 1 18 , और, इसके अलावा, एक विशुद्ध रूप से व्यावहारिक अभिविन्यास है, जो लागू भाषाविज्ञान के हितों के अनुरूप है। भाषा के स्थिर विचार के खिलाफ ऊपर किए गए सभी आरक्षण और निंदा वर्णनात्मक भाषाविज्ञान पर लागू होते हैं। वर्णनात्मक भाषाविज्ञान का ऐसा एकतरफा दृष्टिकोण, अन्वेषक<148>हालाँकि, इसे केवल उन कार्यों द्वारा उचित ठहराया जा सकता है जो लागू भाषाविज्ञान स्वयं निर्धारित करते हैं, लेकिन यह भाषा विज्ञान की संपूर्ण सामग्री को समाप्त नहीं करता है।

व्यावहारिक भाषाविज्ञान के प्रश्नों को विकसित करने की प्रक्रिया में, नई सैद्धांतिक समस्याएं उत्पन्न हो सकती हैं, और वास्तव में पहले ही उत्पन्न हो चुकी हैं। इनमें से कुछ समस्याएं व्यावहारिक भाषाविज्ञान के विशिष्ट कार्यों से निकटता से संबंधित हैं और इन समस्याओं को हल करने में आने वाली कठिनाइयों को दूर करने के उद्देश्य से हैं। अन्य समस्याएं सीधे सैद्धांतिक भाषाविज्ञान से संबंधित हैं, जो पारंपरिक विचारों पर एक नए दृष्टिकोण की अनुमति देती हैं या भाषाई अनुसंधान के नए क्षेत्रों, नई अवधारणाओं और सिद्धांतों को खोलती हैं। इनमें से, उदाहरण के लिए, एक "मशीन" भाषा (या मध्यस्थ भाषा) बनाने की समस्या है, जो सैद्धांतिक भाषाविज्ञान के ऐसे कार्डिनल मुद्दों के एक जटिल सेट से सबसे अधिक निकटता से संबंधित है, जैसे कि अवधारणाओं और शाब्दिक अर्थ, तर्क और व्याकरण, द्वंद्वात्मकता और समकालिकता, भाषा की सांकेतिक प्रकृति, भाषाई अर्थ का सार, कृत्रिम भाषाओं के निर्माण के सिद्धांत आदि। 1 19. इस मामले में, भाषाई विषयों और सटीक विज्ञान के प्रतिनिधियों के सामान्य कार्य में आपसी समझ और सामान्य ज्ञान स्थापित करना विशेष रूप से महत्वपूर्ण है। भाषाई पक्ष के लिए, इस मामले में, जाहिरा तौर पर, हमें पहले से ही प्रयासों को सीमित करने के बारे में बात नहीं करनी चाहिए, उदाहरण के लिए, अनुवाद मशीनों के डिजाइनर पहले से ही" और एन के छंदों के साथ ऐसी मशीनों की कार्य क्षमताओं को स्थापित करने की कोशिश कर रहे हैं। ग्रिबाचेव या वी। कोचेतोव का गद्य 1 20। मशीन स्वयं अपनी क्षमताओं की सीमा और लाभप्रदता - इसके उपयोग की सीमा को खोज लेगी। लेकिन भाषाविदों को, सामान्य कारण में उनके योगदान के रूप में, भाषा की संरचना की विशेषताओं, इसकी बहुमुखी प्रतिभा, इसके तत्वों के आंतरिक प्रतिच्छेदन संबंधों के साथ-साथ भौतिक, शारीरिक के साथ भाषा के व्यापक और बहुपक्षीय संबंधों के बारे में अपना ज्ञान लाना चाहिए। , मानसिक और तार्किक<149>मील घटना, भाषा के कामकाज और विकास के विशिष्ट पैटर्न। संबंधित मशीनों के डिजाइनरों के लिए इस ज्ञान की समग्रता गलत दिशाओं में भटकने के लिए नहीं, बल्कि खोज को उद्देश्यपूर्ण और स्पष्ट रूप से उन्मुख बनाने के लिए आवश्यक है। यहां तक ​​​​कि भाषाई समस्याओं के लिए गणितीय तरीकों को लागू करने के मामलों की बहुत संक्षिप्त समीक्षा, जो इस निबंध में की गई थी, यह आश्वस्त करती है कि सटीक विज्ञान के प्रतिनिधियों के लिए ऐसा ज्ञान किसी भी तरह से अनावश्यक नहीं होगा।

उपरोक्त सभी विचारों के आधार पर, कोई भी स्पष्ट रूप से कुछ सामान्य निष्कर्षों पर आ सकता है।

तो, गणितीय भाषाविज्ञान? यदि इसका अर्थ सभी भाषाई समस्याओं को हल करने के लिए सार्वभौमिक मास्टर कुंजी के रूप में गणितीय विधियों का उपयोग करना है, तो ऐसे दावों को बिल्कुल अनुचित माना जाना चाहिए। इस दिशा में अब तक जो कुछ भी किया गया है, उसने भाषा विज्ञान की पारंपरिक समस्याओं को हल करने के लिए बहुत कम या बिल्कुल भी नहीं किया है। कम से कम, गणितीय विधियों का प्रयोग स्पष्ट बेतुकापनों के साथ होता है या, एक भाषाई दृष्टिकोण से, बिल्कुल अर्थहीन है। सबसे अच्छा, गणितीय विधियों का उपयोग भाषाई अनुसंधान के सहायक तरीकों के रूप में किया जा सकता है, जिन्हें विशिष्ट और सीमित भाषाई कार्यों की सेवा में रखा जाता है। इस मामले में किसी भी "भाषा के मात्रात्मक दर्शन" का कोई सवाल ही नहीं हो सकता। भौतिकी, मनोविज्ञान, शरीर विज्ञान, तर्कशास्त्र, समाजशास्त्र और नृविज्ञान ने अपने समय में भाषा विज्ञान की स्वतंत्रता का अतिक्रमण किया, लेकिन वे भाषा विज्ञान को अपने अधीन नहीं कर सके। इसके विपरीत हुआ - भाषा विज्ञान ने इन विज्ञानों की उपलब्धियों का लाभ उठाया और अपने लिए आवश्यक सीमा तक, उनकी मदद का उपयोग करना शुरू कर दिया, जिससे इसकी अनुसंधान तकनीकों के शस्त्रागार को समृद्ध किया गया। अब, जाहिरा तौर पर, यह गणित की बारी है। उम्मीद की जानी चाहिए कि यह नया समुदाय भाषा विज्ञान को मजबूत करने, इसके काम करने के तरीकों में सुधार और उनकी विविधता में वृद्धि में भी योगदान देगा। इसलिए, गणितीय भाषाविज्ञान की बात करना उतना ही वैध है जितना कि भौतिक भाषाविज्ञान, शारीरिक भाषाविज्ञान, तार्किक भाषाविज्ञान, मनोवैज्ञानिक भाषाविज्ञान, और<150>आदि। ऐसी कोई भाषाविज्ञान नहीं है, केवल एक भाषाविज्ञान है, जो अन्य विज्ञानों के डेटा को सहायक अनुसंधान उपकरण के रूप में लाभकारी रूप से उपयोग करता है। इस प्रकार, नए विज्ञान के हमले से पहले पीछे हटने और आसानी से उसके द्वारा जीते गए पदों को प्राप्त करने का कोई कारण नहीं है। यहां ए. मार्टिनेट के शब्दों को याद करना बहुत उपयुक्त है: "शायद यह कुछ अच्छी तरह से चुने गए शब्दों का उपयोग करके विचार के एक या दूसरे बड़े आंदोलन में शामिल होने के लिए, या किसी गणितीय सूत्र के साथ किसी के तर्क की कठोरता की घोषणा करने के लिए मोहक है। हालाँकि, भाषाविदों के लिए अपने विज्ञान की स्वतंत्रता का एहसास करने और खुद को उस हीन भावना से मुक्त करने का समय आ गया है जो उन्हें अपने किसी भी कार्य को एक या दूसरे सामान्य वैज्ञानिक सिद्धांत से जोड़ता है, जिसके परिणामस्वरूप वास्तविकता की रूपरेखा हमेशा बन जाती है। केवल और अधिक अस्पष्ट, स्पष्ट होने के बजाय 21 .

इसलिए अपने आप में गणित और अपने आप में भाषाविज्ञान। यह किसी भी तरह से उनकी पारस्परिक सहायता या मैत्रीपूर्ण बैठक को शामिल नहीं करता है संयुक्त कार्यआम समस्याओं पर। दो विज्ञानों के सम्मिलित प्रयासों को लागू करने का इस प्रकार का स्थान समस्याओं की पूरी विस्तृत श्रृंखला है जो अनुप्रयुक्त भाषाविज्ञान का हिस्सा हैं और महान राष्ट्रीय आर्थिक महत्व के हैं। किसी को केवल यह कामना करनी चाहिए कि दोनों विज्ञान अपने संयुक्त कार्य में अधिकतम पारस्परिक समझ प्रदर्शित करें, जो निस्संदेह उनके सहयोग की अधिकतम फलदायी में योगदान देगा।<151>

गणितीय विधियों और "गणितीय भावना" के भाषाविज्ञान में प्रवेश ने सटीकता और निष्पक्षता की दिशा में भाषाविज्ञान के विकास में योगदान दिया। हालांकि, इस दिशा में इसके आगे के विकास के रास्ते में गंभीर बाधाएं खड़ी हैं। लेखक भाषाविज्ञान और गणित के अभिसरण के कारणों पर, भाषाविज्ञान में गणितीय विधियों की प्रयोज्यता की सीमा पर, और गणितज्ञों और भाषाविदों के बीच आपसी समझ को रोकने वाले कारकों की प्रकृति पर प्रतिबिंबित करता है।

जब 1950 के दशक के उत्तरार्ध में, कुछ युवा भाषाविदों ने भाषा की संरचना का अध्ययन करने के लिए गणितीय तरीकों को लागू करने के बारे में सोचा और गणितज्ञों के साथ सहयोग करना शुरू किया, तो इससे उनके बहुत से सहयोगियों को आश्चर्य हुआ और यहां तक ​​​​कि झटका भी लगा - आखिरकार, वे आश्वस्त थे बचपन से ही मानविकी, जिनमें से एक भाषाविज्ञान है, का गणित और अन्य "सटीक" विज्ञानों के साथ कुछ भी सामान्य नहीं है और न ही हो सकता है।

इस बीच, प्राकृतिक भाषा और गणित के बीच घनिष्ठ संबंध का अस्तित्व उस समय कोई नई खोज नहीं थी। एल.एस. वायगोत्स्की ने 1934 में प्रकाशित अपनी पुस्तक "थिंकिंग एंड स्पीच" में लिखा: "गणित में देखने वाला पहला व्यक्ति जो भाषा से उत्पन्न होता है, लेकिन उस पर काबू पाता है, जाहिरा तौर पर, डेसकार्टेस" था और जारी रखा: "हमारी सामान्य बोलचाल की भाषा, इसके कारण व्याकरणिक और मनोवैज्ञानिक के अंतर्निहित उतार-चढ़ाव और विसंगतियां, गणितीय और शानदार सामंजस्य के आदर्शों और निरंतर गति के बीच मोबाइल संतुलन की स्थिति में हैं, जिसे हम विकास कहते हैं।

प्राचीन ग्रीस में उत्पन्न होने वाली व्याकरणिक श्रेणियों का सिद्धांत पहले से ही उन मॉडलों के करीब अमूर्त मॉडल का उपयोग करके भाषा की संरचना के कई सबसे महत्वपूर्ण पहलुओं का वर्णन था जो प्राचीन यूनानी गणितज्ञों द्वारा स्थानिक रूपों का वर्णन करने के लिए बनाए गए थे; केवल मामले, लिंग, आदि जैसी अवधारणाओं की परिचितता, जो बन गई है, जैसा कि एच। स्टीन्थल ने लिखा, "हमारा दूसरा स्वभाव", हमें यह समझने से रोकता है कि क्या ऊँचा स्तरअमूर्त सोच को उनके निर्माण की आवश्यकता थी। इसलिए, किसी को आश्चर्य होना चाहिए कि भाषाई "गणितीय सद्भाव के आदर्श" का वर्णन करने के लिए वास्तविक गणितीय उपकरणों का उपयोग करने का पहला प्रयास केवल 20 वीं शताब्दी के मध्य में किया गया था।

इस "देरी" के दो कारण हैं। सबसे पहले, प्राचीन काल में उठाए गए महत्वपूर्ण कदमों के बाद, भाषा विज्ञान वास्तव में केवल 19 वीं शताब्दी में फिर से विकसित होना शुरू हुआ, लेकिन इस पूरी शताब्दी में भाषाविदों का मुख्य ध्यान भाषा के इतिहास की ओर था, और केवल अगली शताब्दी में, जो सामान्य तौर पर मानविकी के लिए संरचनावाद की सदी थी, प्राचीन काल के बाद पहली बार भाषाविज्ञान ने भाषाई संरचनाओं के अध्ययन की ओर रुख किया, लेकिन एक नए स्तर पर। जब भाषाविदों ने महसूस किया कि भाषा, एफ डी सॉसर के शब्दों में, "शुद्ध संबंधों की प्रणाली" है, यानी संकेतों की एक प्रणाली, जिसकी भौतिक प्रकृति महत्वहीन है, और केवल उनके बीच संबंध महत्वपूर्ण हैं, के बीच समानांतर भाषा और गणितीय निर्माण काफी स्पष्ट हो गए, जो "शुद्ध संबंधों की प्रणाली" भी हैं, और पहले से ही बीसवीं शताब्दी की शुरुआत में, वही डी सौसुर ने गणितीय तरीकों से भाषा का अध्ययन करने का सपना देखा था।

दूसरे, नए युग की शुरुआत में गणित में मात्रात्मक तरीके सामने आए, और केवल 19 वीं शताब्दी में गणितज्ञों ने फिर से गैर-मात्रात्मक अमूर्त मॉडल बनाना शुरू किया, जो उच्च स्तर के अमूर्तन में प्राचीन लोगों से भिन्न थे, और यह भी - जो हमारे विषय के लिए विशेष रूप से महत्वपूर्ण है - इसमें उनका उपयोग स्थानिक रूपों की तुलना में घटनाओं की एक विस्तृत श्रृंखला का वर्णन करने के लिए किया जा सकता है; अक्सर ऐसे मॉडल घटनाओं का अध्ययन करने के लिए एक सुविधाजनक और यहां तक ​​​​कि आवश्यक साधन बन गए कि उन्हें बनाने वाले गणितज्ञों ने बिल्कुल भी नहीं सोचा और उनके अस्तित्व के बारे में भी नहीं जानते थे। इन मॉडलों में वे थे जिन्हें बाद में भाषाविज्ञान में आवेदन प्राप्त हुआ; गणितीय विषयों का विशेष रूप से गहन विकास, जिसकी सामग्री उनका निर्माण थी, बीसवीं शताब्दी के पूर्वार्ध में हुई। इसलिए इस सदी के मध्य में गणित और भाषा विज्ञान का मिलन काफी स्वाभाविक था।

इस बैठक के परिणामों में से एक नए गणितीय अनुशासन का उदय था - गणितीय भाषाविज्ञान, जिसका विषय भाषाई अनुसंधान के लिए गणितीय तंत्र का विकास है। गणितीय भाषाविज्ञान में केंद्रीय स्थान पर सिद्धांत का कब्जा है औपचारिक व्याकरण, इसमें प्रयुक्त उपकरण की प्रकृति से, गणितीय तर्क से संबंधित है और, विशेष रूप से, एल्गोरिदम के सिद्धांत के लिए। यह विभिन्न स्तरों की सही भाषा इकाइयों का वर्णन करने के लिए औपचारिक तरीके प्रदान करता है, और, सबसे महत्वपूर्ण बात, भाषा इकाइयों के परिवर्तनों का वर्णन करने के लिए औपचारिक तरीके - दोनों एक ही स्तर पर और स्तरों के बीच। वाक्यात्मक संरचनाओं का सिद्धांत औपचारिक व्याकरण के सिद्धांत से जुड़ा हुआ है, जो उपकरण के संदर्भ में बहुत सरल है, लेकिन भाषाई अनुप्रयोगों के लिए कम महत्वपूर्ण नहीं है। गणितीय भाषाविज्ञान में, भाषा के विश्लेषणात्मक मॉडल भी विकसित किए जा रहे हैं, जिसमें "सही ग्रंथों" पर कुछ ज्ञात ज्ञात डेटा के आधार पर औपचारिक निर्माण किए जाते हैं, जिसके परिणामस्वरूप कुछ "घटकों" का विवरण होता है। भाषा तंत्र की। इस तरह, कोई कुछ पारंपरिक व्याकरण संबंधी अवधारणाओं का औपचारिक विवरण प्राप्त कर सकता है। इसमें इंटेंशनल लॉजिक ("मोंटेगु सिमेंटिक्स") के तंत्र का उपयोग करके वाक्य के अर्थ का विवरण भी शामिल होना चाहिए।

बेशक, गणितीय तंत्र की मदद से, वायगोत्स्की ने जिस भाषा के बारे में बात की थी, उसके दो आदर्शों में से केवल एक का वर्णन किया जा सकता है; इसलिए, एक या दूसरे गणितीय मॉडल (या सामान्य रूप से गणितीय मॉडल) के उपयोग पर अक्सर सुनी जाने वाली आपत्तियां इस आधार पर कि इसमें ऐसे और ऐसे विशेष मामलों को शामिल नहीं किया गया है, का कोई मतलब नहीं है: इसमें निहित "उतार-चढ़ाव और विसंगतियों" का वर्णन करना भाषा, किसी को बिल्कुल अन्य, गैर-गणितीय साधनों की आवश्यकता होती है, और "गणितीय आदर्श" का केवल एक स्पष्ट विवरण उन्हें खोजने में मदद कर सकता है, क्योंकि यह "शानदार" को "गणितीय" से स्पष्ट रूप से सीमित करना संभव बना देगा। भाषा: हिन्दी। लेकिन यह अभी भी भविष्य के लिए एक मामला है।

गणितीय भाषाविज्ञान के उद्भव से कम नहीं, और शायद अधिक महत्वपूर्ण, मौलिक गणितीय विचारों और अवधारणाओं के भाषाविज्ञान में प्रत्यक्ष प्रवेश था - जैसे कि सेट, फ़ंक्शन, आइसोमोर्फिज्म। आधुनिक भाषाई शब्दार्थ में, विधेय और परिमाणक की अवधारणाएँ, जो गणितीय तर्क से आई हैं, एक महत्वपूर्ण भूमिका निभाती हैं। (उनमें से पहला तर्क में तब भी उभरा जब यह भाषाविज्ञान से अलग नहीं था, और अब यह एक सामान्यीकृत और गणितीय रूप से संसाधित रूप में भाषाविज्ञान में लौट आया है।)

और, अंत में, भाषाई अनुसंधान की भाषा का शोधन बहुत महत्वपूर्ण है, जो "गणितीय भावना" के भाषाविज्ञान में प्रवेश के कारण होता है, न केवल उन क्षेत्रों में जहां गणितीय विचारों और विधियों का उपयोग करना संभव है। यह सब संक्षेप में संक्षेप में निम्नानुसार किया जा सकता है: भाषा विज्ञान अधिक से अधिक सटीक और अधिक वस्तुनिष्ठ विज्ञान बन रहा है - बिना रुके, निश्चित रूप से, मानविकी का विज्ञान होना।

हालाँकि, भाषाविज्ञान के विकास के इस प्राकृतिक मार्ग में गंभीर बाधाएँ हैं जो इसे लंबे समय तक धीमा कर सकती हैं। मुख्य एक "संकायों का पृथक्करण" है जो नए युग की शुरुआत में उत्पन्न हुआ: एक ओर प्राकृतिक वैज्ञानिक और गणितज्ञ, और दूसरी ओर मानवीय वैज्ञानिक, "दूसरे संकाय में" सहयोगियों के काम में रुचि नहीं रखते हैं। "और, इसके अलावा, गहराई से, और अक्सर खुले तौर पर उनका तिरस्कार करते हैं। । गणितज्ञ और प्राकृतिक वैज्ञानिक (और इससे भी अधिक "तकनीकी") मानविकी अनुसंधान को केवल "सजावट" या "निष्क्रिय बकवास" के रूप में देखते हैं, जबकि "मानविकी" केवल व्यावहारिक के लिए गणित और प्राकृतिक विज्ञान को सहन करने के लिए तैयार हैं। लाभ और आश्वस्त हैं कि वे कुछ भी नहीं हैं जो मानव आत्मा की प्रकृति को समझने में मदद कर सकते हैं।

केवल उन्नीसवीं सदी के मध्य में, महान जीवविज्ञानी और महान विचारक कोनराड लोरेंज के शब्दों में, "प्राकृतिक विज्ञान और मानविकी के बीच की बुराई की दीवार (डाई बोस माउर ज़्विसचेन नेचुर- अंड जिस्टविसेन्सचाफ्टन)" पहला उल्लंघन था। तर्क को गणित से अलग करने वाली सबसे पतली जगह में। 20वीं शताब्दी में, अन्य अंतराल दिखाई दिए - उनमें से एक जिसे गणितज्ञों और भाषाविदों ने दोनों पक्षों से बनाया - लेकिन वे अभी भी कम हैं, दीवार अभी भी मजबूत है, और इसे और मजबूत करने और पैच करने के लिए दोनों पक्षों के प्रयासों में कोई कमी नहीं है। छिद्रों के ऊपर। अक्सर ये प्रयास काफी सफल होते हैं; इस दिशा में नवीनतम "उपलब्धि" - माध्यमिक विद्यालय में "प्रोफ़ाइल शिक्षा", जो पहले से ही बचपन में सक्षम और इच्छुक लोगों को "संकायों" में विभाजित करती है और उन्हें "विदेशी" विज्ञान में अज्ञानता पर गर्व करना सिखाती है - आगे अभिसरण में बहुत बाधा डाल सकती है प्राकृतिक और मानव विज्ञान, दोनों के सामान्य विकास के लिए आवश्यक। एक दीवार खड़ी करने के परिणामों में से एक यह है कि "मानविकी", जिसमें बहुसंख्यक भाषाविद शामिल हैं, गणित की उन शाखाओं की मूल बातों के बारे में कुछ भी नहीं जानते हैं जो मानविकी के लिए सबसे महत्वपूर्ण हैं (और एक गणितज्ञ के रूप में एक गणितज्ञ की कल्पना करें) गणना में विशेष रूप से लगे व्यक्ति)।

एक अन्य बाधा की विशेषता है वर्तमान स्थितिविज्ञान एक उन्मत्त दौड़ है, अधिक से अधिक नए "परिणामों" की एक नॉन-स्टॉप खोज, क्षितिज को संकुचित करना और गहरी समस्याओं के बारे में सोचने या संबंधित के गंभीर अध्ययन में संलग्न होने के लिए समय नहीं छोड़ना और, इसके अलावा, काफी संबंधित नहीं है वैज्ञानिक अनुशासन. यह भाषाविदों और गणितज्ञों पर समान रूप से लागू होता है - जैसा कि, वास्तव में, उन सभी पर जो पेशेवर रूप से विज्ञान में लगे हुए हैं।

और तीसरा है जड़ता, या, अधिक सरलता से, आलस्य। पहली नज़र में, आलस्य और उन्मत्त दौड़ असंगत हैं, लेकिन वास्तव में वे एक दूसरे के साथ अच्छी तरह से मिलते हैं और इसके अलावा, एक दूसरे का समर्थन और उत्तेजित करते हैं। जब कोई व्यक्ति एक कठिन कार्य को करने के लिए बहुत आलसी होता है, तो वह एक आसान और अधिक "विश्वसनीय" को पकड़ लेता है, जिसमें सफलता उसकी जड़ता को सही ठहराती है और प्रोत्साहित करती है। दीवार के दूसरी तरफ "छोटे भाइयों" के झुंड के प्रति एक अभिमानी रवैया भी आलस्य को प्रोत्साहित करता है और इसे प्रोत्साहित करता है। जब, उदाहरण के लिए, एक गणितज्ञ प्राचीन इतिहास के बारे में सभी विचारों पर पुनर्विचार करने का प्रस्ताव करता है, तो प्राचीन भाषाओं से कम से कम थोड़ा परिचित होने का कष्ट किए बिना, वही आलसी माँ इसके लिए बहुत अधिक जिम्मेदार होती है।

इन बाधाओं से उत्पन्न विज्ञान के विकास के लिए खतरा पहली नज़र में जितना लग सकता है, उससे कहीं अधिक गंभीर है। जब "विदेशी" विज्ञानों में अज्ञानता गर्व का विषय बन जाती है, तो यह स्वाभाविक रूप से "हमारे अपने" लोगों में भी सतहीपन और अज्ञानता की ओर ले जाती है। लंबे समय से दो से अधिक "संकाय" हैं, उनकी संख्या साल-दर-साल बढ़ रही है, और प्रत्येक को दूसरों से एक दीवार से बंद कर दिया गया है; दीवारें संकायों के अंदर भी दिखाई देती हैं। शोधकर्ताओं के क्षितिज धीरे-धीरे संकुचित हो रहे हैं; यह सच है कि जांच का तंत्र अधिक से अधिक सूक्ष्म और परिष्कृत हो जाता है, लेकिन लगभग विशेष रूप से छोटी वस्तुएं इसके दृष्टि क्षेत्र में आती हैं, और यह विचार मजबूत होता है कि केवल वे ही अध्ययन के योग्य हैं। विज्ञान में संकट के बारे में बात करने का हर कारण है, और भाषा विज्ञान कोई अपवाद नहीं है। अब, मुझे लगता है, यह पीछे मुड़कर देखने और सोचने का समय है।

यहां दिशा के भाषाविद एकत्र हुए, जो "अर्थ - पाठ" मॉडल से जुड़ा हुआ है। पिछली शताब्दी के 60 के दशक में बनाया गया यह मॉडल, भाषा विज्ञान और गणित की बैठक के पहले और सर्वोत्तम परिणामों में से एक था, जिसके बाद भाषाविदों की दो पीढ़ियां बड़ी हो गई हैं, जो अपने छात्र वर्षों से सटीक सोच के आदी हैं। लेकिन, दुर्भाग्य से, वे जड़ता से मुक्त नहीं हैं, जो उन्हें संकट के अस्तित्व को महसूस करने और इसे दूर करने के तरीकों के बारे में सोचने से रोकता है। इस बीच, सभी भाषाविदों के बीच - और शायद मानविकी में शामिल सभी लोगों के बीच - उनके पास इस तरह की समझ के लिए सबसे अधिक उद्देश्यपूर्ण अवसर हैं, और मैं आशा करना चाहता हूं कि वे इन अवसरों का उपयोग करेंगे।

रिपोर्ट का पाठ कृपया ए.वी. ग्लैडकी और प्रकाशन गृह द्वारा प्रदान किया गया था

19वीं - 20वीं सदी के मोड़ पर संरचनात्मक भाषाविज्ञान का गठन। भाषा सीखने में सांख्यिकीय तरीके। बीसवीं शताब्दी के उत्तरार्ध में भाषाविज्ञान में गणितीय विधियों का अनुप्रयोग। औपचारिक तर्क के तरीकों से भाषा सीखना। मशीनी अनुवाद की विशेषताएं।

परिचय

अध्याय 1. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास

1.1. 19वीं - 20वीं सदी के मोड़ पर संरचनात्मक भाषाविज्ञान का गठन

1.2. बीसवीं शताब्दी के उत्तरार्ध में भाषाविज्ञान में गणितीय विधियों का अनुप्रयोग

अध्याय 2. भाषाविज्ञान में गणित के प्रयोग के चुनिंदा उदाहरण

2.1. मशीन अनुवाद

2.2.भाषा सीखने में सांख्यिकीय तरीके

2.3. औपचारिक तर्क के तरीकों से भाषा सीखना

2.4. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग की संभावनाएँ

निष्कर्ष

साहित्य

परिशिष्ट 1. रोनाल्ड श्लीफर। फर्डिनेंड डी सौसुरे

परिशिष्ट 2. फर्डिनेंड डी सॉसर (अनुवाद)

परिचय

20वीं शताब्दी में, अंतःक्रिया और अंतर्प्रवेश की दिशा में एक सतत प्रवृत्ति रही है। विभिन्न क्षेत्रज्ञान। अलग-अलग विज्ञानों के बीच की सीमाएँ धीरे-धीरे धुंधली होती जा रही हैं; मानसिक गतिविधि की अधिक से अधिक शाखाएँ हैं जो मानवीय, तकनीकी और प्राकृतिक विज्ञान ज्ञान के "जंक्शन पर" हैं।

आधुनिकता की एक अन्य स्पष्ट विशेषता संरचनाओं और उनके घटक तत्वों का अध्ययन करने की इच्छा है। इसलिए, वैज्ञानिक सिद्धांत और व्यवहार दोनों में, गणित को एक बढ़ता हुआ स्थान दिया जाता है। एक ओर, तर्क और दर्शन के साथ, दूसरी ओर, सांख्यिकी (और, परिणामस्वरूप, सामाजिक विज्ञान के साथ) के संपर्क में आने से, गणित उन क्षेत्रों में गहराई से और गहराई से प्रवेश करता है जो लंबे समय तक विशुद्ध रूप से माने जाते थे। "मानवतावादी", उनकी अनुमानी क्षमता का विस्तार (प्रश्न का उत्तर "कितना" अक्सर "क्या" और "कैसे" सवालों के जवाब देने में मदद करेगा)। भाषाविज्ञान कोई अपवाद नहीं था।

मेरे पाठ्यक्रम कार्य का उद्देश्य गणित और भाषाविज्ञान की ऐसी शाखा जैसे भाषाविज्ञान के बीच संबंध को संक्षेप में उजागर करना है। 1950 के दशक से, भाषाओं की संरचना (प्राकृतिक और कृत्रिम दोनों) का वर्णन करने के लिए एक सैद्धांतिक उपकरण बनाने के लिए भाषाविज्ञान में गणित का उपयोग किया गया है। साथ ही, यह कहा जाना चाहिए कि उसे अपने लिए ऐसा व्यावहारिक अनुप्रयोग तुरंत नहीं मिला। प्रारंभ में, भाषाविज्ञान की मूल अवधारणाओं को स्पष्ट करने के लिए भाषाविज्ञान में गणितीय विधियों का उपयोग किया जाने लगा, लेकिन विकास के साथ कंप्यूटर प्रौद्योगिकीइस तरह के सैद्धांतिक आधार को व्यवहार में लागू करना शुरू हुआ। मशीनी अनुवाद, मशीन सूचना पुनर्प्राप्ति, स्वचालित पाठ प्रसंस्करण जैसे कार्यों के समाधान के लिए भाषा के लिए एक मौलिक रूप से नए दृष्टिकोण की आवश्यकता होती है। भाषाविदों को इस सवाल का सामना करना पड़ा: भाषाई पैटर्न को उस रूप में प्रस्तुत करना कैसे सीखें जिसमें उन्हें सीधे प्रौद्योगिकी पर लागू किया जा सके। शब्द "गणितीय भाषाविज्ञान", जो हमारे समय में लोकप्रिय है, किसी भी भाषाई शोध को संदर्भित करता है जो सटीक विधियों का उपयोग करता है (और विज्ञान में सटीक विधियों की अवधारणा हमेशा गणित से निकटता से संबंधित होती है)। पिछले वर्षों के कुछ वैज्ञानिकों का मानना ​​​​है कि अभिव्यक्ति को एक शब्द के पद तक नहीं बढ़ाया जा सकता है, क्योंकि इसका मतलब कोई विशेष "भाषाविज्ञान" नहीं है, बल्कि भाषा अनुसंधान विधियों की सटीकता और विश्वसनीयता में सुधार, सुधार पर केंद्रित एक नई दिशा है। . भाषाविज्ञान मात्रात्मक (बीजगणितीय) और गैर-मात्रात्मक दोनों तरीकों का उपयोग करता है, जो इसे गणितीय तर्क के करीब लाता है, और, परिणामस्वरूप, दर्शन के लिए, और यहां तक ​​​​कि मनोविज्ञान के लिए भी। यहां तक ​​​​कि श्लेगल ने भाषा और चेतना की बातचीत का उल्लेख किया, और फर्डिनेंड डी सौसुरे, बीसवीं शताब्दी की शुरुआत के एक प्रमुख भाषाविद् (मैं बाद में भाषा विज्ञान में गणितीय विधियों के विकास पर उनके प्रभाव के बारे में बताऊंगा), भाषा की संरचना को इसके संबंधित के साथ जोड़ा। लोगों को। आधुनिक शोधकर्ता एल। पर्लोव्स्की राष्ट्रीय मानसिकता की विशेषताओं के साथ भाषा की मात्रात्मक विशेषताओं (उदाहरण के लिए, लिंग, मामलों की संख्या) की पहचान करते हुए आगे बढ़ते हैं (इस पर खंड 2.2, "भाषाविज्ञान में सांख्यिकीय तरीके")।

गणित और भाषा विज्ञान की बातचीत एक बहुआयामी विषय है, और मैं अपने काम में सभी पर ध्यान नहीं दूंगा, लेकिन सबसे पहले, इसके लागू पहलुओं पर।

अध्याय 1भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास

1.1 संरचनात्मक भाषाविज्ञान का गठनXIX - XX सदियों के मोड़ पर

भाषा का गणितीय विवरण एक तंत्र के रूप में भाषा के विचार पर आधारित है, जो बीसवीं शताब्दी की शुरुआत के प्रसिद्ध स्विस भाषाविद् फर्डिनेंड डी सौसुरे के पास वापस जाता है।

उनकी अवधारणा की प्रारंभिक कड़ी एक प्रणाली के रूप में भाषा का सिद्धांत है जिसमें शामिल हैं तीन हिस्से(वास्तविक भाषा - भाषा: हिन्दी, भाषण - पासवर्ड, और भाषण गतिविधि - भाषा: हिन्दी), जिसमें प्रत्येक शब्द (सिस्टम का सदस्य) को अपने आप में नहीं, बल्कि अन्य सदस्यों के संबंध में माना जाता है। एक अन्य प्रमुख भाषाविद् के रूप में, डेन लुई हेजेल्म्सलेव ने बाद में उल्लेख किया, सॉसर "भाषा के लिए एक संरचनात्मक दृष्टिकोण की मांग करने वाले पहले व्यक्ति थे, अर्थात, इकाइयों के बीच संबंधों को रिकॉर्ड करके भाषा का वैज्ञानिक विवरण।"

भाषा को एक पदानुक्रमित संरचना के रूप में समझते हुए, सॉसर ने भाषाई इकाइयों के मूल्य और महत्व की समस्या को सबसे पहले प्रस्तुत किया। अलग-अलग घटनाओं और घटनाओं (जैसे, व्यक्तिगत इंडो-यूरोपीय शब्दों की उत्पत्ति का इतिहास) का अध्ययन स्वयं नहीं, बल्कि एक ऐसी प्रणाली में किया जाना चाहिए जिसमें वे समान घटकों के साथ सहसंबद्ध हों।

सौसुरे की भाषा की संरचनात्मक इकाई ने "साइन" शब्द पर विचार किया, जिसमें ध्वनि और अर्थ संयुक्त थे। इन तत्वों में से कोई भी एक दूसरे के बिना मौजूद नहीं है: इसलिए, मूल वक्ता भाषा में संरचनात्मक पूरे में एक अलग तत्व के रूप में एक बहुरूपी शब्द के अर्थ के विभिन्न रंगों को समझता है।

इस प्रकार, एफ डी सॉसर के सिद्धांत में, एक ओर, समाजशास्त्र और सामाजिक मनोविज्ञान के साथ भाषाविज्ञान की बातचीत को देखा जा सकता है (यह ध्यान दिया जाना चाहिए कि उसी समय, हसरल की घटना विज्ञान, फ्रायड के मनोविश्लेषण, आइंस्टीन के सापेक्षता के सिद्धांत थे। विकास, साहित्य, संगीत और ललित कला में रूप और सामग्री पर प्रयोग हो रहे थे), दूसरी ओर, गणित के साथ (प्रणालीगतता की अवधारणा भाषा की बीजगणितीय अवधारणा से मेल खाती है)। इस तरह की अवधारणा ने भाषाई व्याख्या की अवधारणा को इस तरह बदल दिया: घटना की व्याख्या उनकी घटना के कारणों के संबंध में नहीं, बल्कि वर्तमान और भविष्य के संबंध में की जाने लगी। व्याख्या किसी व्यक्ति के इरादों से स्वतंत्र नहीं रह गई है (इस तथ्य के बावजूद कि इरादे अवैयक्तिक हो सकते हैं, शब्द के फ्रायडियन अर्थ में "बेहोश")।

भाषाई तंत्र की कार्यप्रणाली देशी वक्ताओं की भाषण गतिविधि के माध्यम से प्रकट होती है। भाषण का परिणाम तथाकथित "सही ग्रंथ" है - भाषण इकाइयों के अनुक्रम जो कुछ पैटर्न का पालन करते हैं, जिनमें से कई गणितीय विवरण की अनुमति देते हैं। वाक्यात्मक संरचना का वर्णन करने के तरीकों का सिद्धांत सही ग्रंथों (मुख्य रूप से वाक्यों) के गणितीय विवरण के तरीकों के अध्ययन से संबंधित है। ऐसी संरचना में, भाषाई उपमाओं को उनके अंतर्निहित गुणों की सहायता से नहीं, बल्कि सिस्टम ("संरचनात्मक") संबंधों की सहायता से परिभाषित किया जाता है।

सौसुरे के विचारों को पश्चिम में महान स्विस भाषाविद् के युवा समकालीनों द्वारा विकसित किया गया था: डेनमार्क में, एल। हेजेल्म्सलेव द्वारा, जिनका मैंने पहले ही उल्लेख किया है, जिन्होंने अपने काम में भाषा के बीजगणितीय सिद्धांत को जन्म दिया "फाउंडेशन" भाषाई सिद्धांत”, यूएसए में - ई। सपिर, एल। ब्लूमफील्ड, सी। हैरिस, चेक गणराज्य में - रूसी प्रवासी वैज्ञानिक एन। ट्रुबेट्सकोय।

भाषा के अध्ययन में सांख्यिकीय नियमितताओं को आनुवंशिकी के संस्थापक जॉर्ज मेंडल के अलावा किसी और ने नहीं निपटाया। यह केवल 1968 में था कि भाषाविदों ने पाया कि, अपने जीवन के अंतिम वर्षों में, वह गणित के तरीकों का उपयोग करके भाषाई घटनाओं के अध्ययन से प्रभावित थे। मेंडल ने इस पद्धति को जीव विज्ञान से भाषाविज्ञान में लाया; 1990 के दशक में, केवल सबसे साहसी भाषाविदों और जीवविज्ञानियों ने इस तरह के विश्लेषण की व्यवहार्यता का दावा किया था। सेंट के मठ के अभिलेखागार में। ब्रनो में टोमाज़, जिसका मठाधीश मेंडल था, चादरें "मैन", "बाउर", "मेयर" में समाप्त होने वाले उपनामों के कॉलम और कुछ अंशों और गणनाओं के साथ मिलीं। परिवार के नामों की उत्पत्ति के औपचारिक कानूनों की खोज के प्रयास में, मेंडल जटिल गणना करता है, जिसमें वह जर्मन भाषा में स्वरों और व्यंजनों की संख्या, शब्दों की कुल संख्या, उपनामों की संख्या को ध्यान में रखता है। आदि।

हमारे देश में, संरचनात्मक भाषाविज्ञान लगभग उसी समय विकसित होने लगा जैसे पश्चिम में - 19वीं-20वीं शताब्दी के मोड़ पर। इसके साथ ही एफ डी सॉसर के साथ, एक प्रणाली के रूप में भाषा की अवधारणा को कज़ान विश्वविद्यालय के प्रोफेसरों एफ.एफ. द्वारा उनके कार्यों में विकसित किया गया था। फोर्टुनाटोव और आई.ए. बाउडौइन डी कर्टेने। बाद वाले ने लंबे समय तक डी सॉसर के साथ पत्राचार किया, क्रमशः जिनेवा और कज़ान भाषाविज्ञान के स्कूलों ने एक दूसरे के साथ सहयोग किया। यदि सौसुरे को भाषाविज्ञान में "सटीक" विधियों का विचारक कहा जा सकता है, तो बॉडौइन डी कर्टेने ने उनके आवेदन के लिए व्यावहारिक नींव रखी। वह भाषाविज्ञान को अलग करने वाले पहले व्यक्ति थे (as शुद्धभाषाविज्ञान से सांख्यिकीय विधियों और कार्यात्मक निर्भरता का उपयोग करने वाला विज्ञान (सामान्य) मानवीय अनुशासनजो भाषा और भाषण के माध्यम से आध्यात्मिक संस्कृति का अध्ययन करते हैं)। वैज्ञानिक स्वयं मानते थे कि "भाषाविज्ञान निकट भविष्य में उपयोगी हो सकता है, केवल भाषाशास्त्र और साहित्यिक इतिहास के साथ अनिवार्य संघ से मुक्त"। भाषाविज्ञान में गणितीय विधियों की शुरूआत के लिए ध्वनिविज्ञान "परीक्षण का मैदान" बन गया - भाषा प्रणाली के "परमाणु" के रूप में लगता है, जिसमें सीमित संख्या में आसानी से मापने योग्य गुण होते हैं, विवरण के औपचारिक, कठोर तरीकों के लिए सबसे सुविधाजनक सामग्री थी। ध्वन्यात्मकता ध्वनि में अर्थ के अस्तित्व को नकारती है, इसलिए अध्ययनों में "मानव" कारक को समाप्त कर दिया गया। इस अर्थ में, स्वनिम भौतिक या जैविक वस्तुओं की तरह हैं।

स्वनिम, धारणा के लिए स्वीकार्य सबसे छोटे भाषाई तत्वों के रूप में, एक अलग क्षेत्र का प्रतिनिधित्व करते हैं, एक अलग "अभूतपूर्व वास्तविकता"। उदाहरण के लिए, अंग्रेजी में, ध्वनि "टी" को अलग-अलग उच्चारण किया जा सकता है, लेकिन सभी मामलों में, अंग्रेजी बोलने वाला व्यक्ति इसे "टी" के रूप में देखेगा। मुख्य बात यह है कि स्वनिम अपना मुख्य - सार्थक - कार्य करेगा। इसके अलावा, भाषाओं के बीच अंतर ऐसे हैं कि एक भाषा में एक ध्वनि की किस्में दूसरी में विभिन्न स्वरों के अनुरूप हो सकती हैं; उदाहरण के लिए, अंग्रेजी में "एल" और "आर" अलग हैं, जबकि अन्य भाषाओं में वे एक ही स्वर की किस्में हैं (जैसे अंग्रेजी "टी", आकांक्षा के साथ या बिना उच्चारण)। किसी भी प्राकृतिक भाषा की विशाल शब्दावली बहुत कम संख्या में स्वरों के संयोजन का एक समूह है। उदाहरण के लिए, अंग्रेजी में, लगभग एक लाख शब्दों के उच्चारण और लिखने के लिए केवल 40 स्वरों का उपयोग किया जाता है।

किसी भाषा की ध्वनियाँ सुविधाओं का एक व्यवस्थित रूप से व्यवस्थित समूह हैं। 1920-1930 के दशक में, सॉसर के बाद, जैकबसन और एन.एस. ट्रुबेट्सकोय ने स्वरों की "विशिष्ट विशेषताओं" का गायन किया। ये विशेषताएं भाषण अंगों की संरचना पर आधारित हैं - जीभ, दांत, मुखर तार। उदाहरण के लिए, अंग्रेजी में, "टी" और "डी" के बीच का अंतर "आवाज" (मुखर रस्सियों का तनाव) की उपस्थिति या अनुपस्थिति और आवाज का स्तर है जो एक स्वर को दूसरे से अलग करता है। इस प्रकार, ध्वन्यात्मकता को सॉसर द्वारा वर्णित सामान्य भाषा नियम का एक उदाहरण माना जा सकता है: "भाषा में केवल अंतर हैं"। इससे भी अधिक महत्वपूर्ण यह नहीं है: अंतर आमतौर पर उन सटीक स्थितियों को दर्शाता है जिनके बीच यह स्थित है; लेकिन भाषा में सटीक शर्तों के बिना केवल अंतर होते हैं। चाहे हम "पदनाम" या "संकेत" पर विचार कर रहे हों - भाषा में न तो अवधारणाएं हैं और न ही ध्वनियां जो भाषा प्रणाली के विकास से पहले मौजूद होतीं।

इस प्रकार, सौसुरियन भाषाविज्ञान में, अध्ययन की गई घटना को भाषा की तुलना और विरोध के एक सेट के रूप में समझा जाता है। भाषा शब्दों के अर्थ और संचार के साधन दोनों की अभिव्यक्ति है, और ये दोनों कार्य कभी मेल नहीं खाते। हम रूप और सामग्री के विकल्प को देख सकते हैं: भाषाई विरोधाभास इसकी संरचनात्मक इकाइयों को परिभाषित करते हैं, और ये इकाइयां एक निश्चित सार्थक सामग्री बनाने के लिए बातचीत करती हैं। चूंकि भाषा के तत्व यादृच्छिक हैं, इसलिए न तो इसके विपरीत और न ही संयोजन आधार हो सकते हैं। तो भाषा में विशेषताएँसमझ के एक अलग स्तर पर ध्वन्यात्मक विपरीत बनाते हैं, स्वरों को मर्फीम, मर्फीम - शब्दों में, शब्दों - वाक्यों आदि में जोड़ा जाता है। किसी भी मामले में, एक संपूर्ण स्वर, शब्द, वाक्य, आदि। इसके भागों के योग से कहीं अधिक है।

सौसुरे ने समाज में संकेतों की भूमिका का अध्ययन करते हुए, भाषाविज्ञान से अलग, बीसवीं शताब्दी के एक नए विज्ञान के विचार का प्रस्ताव रखा। सॉसर ने इस विज्ञान को अर्धविज्ञान कहा (ग्रीक से "सेमियन" - एक संकेत)। लाक्षणिकता का "विज्ञान", जो 1920 और 1930 के दशक में पूर्वी यूरोप में और 1950 और 1960 के दशक में पेरिस में विकसित हुआ, ने भाषा और भाषाई संरचनाओं के अध्ययन को इन संरचनाओं की मदद से रचित (या तैयार) साहित्यिक निष्कर्षों में विस्तारित किया। इसके अलावा, अपने करियर की सांझ में, सामान्य भाषाविज्ञान में अपने पाठ्यक्रम के समानांतर, सॉसर देर से रोमन कविता के "अर्धसूत्रीय" विश्लेषण में लगे हुए थे, जो जानबूझकर उचित नामों के विपर्यय को खोजने की कोशिश कर रहे थे। यह विधि कई मायनों में अपने भाषाई विश्लेषण में तर्कवाद के विपरीत थी: यह एक प्रणाली में भाषा में "संभावना" की समस्या का अध्ययन करने का प्रयास था। ऐसा शोध संभाव्यता के "वास्तविक पक्ष" पर ध्यान केंद्रित करने में मदद करता है; जीन स्टारोबिंस्की के अनुसार, "कुंजी शब्द" जिसके लिए सॉसर एक विपर्यय की तलाश कर रहा है, "कवि के लिए एक उपकरण है, न कि कविता के जीवन का स्रोत।" कविता कीवर्ड की ध्वनियों को स्वैप करने का कार्य करती है। स्टारोबिंस्की के अनुसार, इस विश्लेषण में, "सॉसुरे छिपे हुए अर्थों की खोज में तल्लीन नहीं करता है।" इसके विपरीत, उनके कार्यों में, चेतना से संबंधित प्रश्नों से बचने की इच्छा ध्यान देने योग्य है: "चूंकि कविता न केवल शब्दों में व्यक्त की जाती है, बल्कि यह भी कि ये शब्द क्या जन्म देते हैं, यह चेतना के नियंत्रण से परे है और केवल पर निर्भर करता है भाषा के नियम" (देखें। परिशिष्ट 1)।

देर से रोमन कविता में उचित नामों का अध्ययन करने का सॉसर का प्रयास उनके भाषाई विश्लेषण के घटकों में से एक पर जोर देता है - संकेतों की मनमानी प्रकृति, साथ ही साथ सॉसर की भाषाविज्ञान का औपचारिक सार, जिसमें अर्थ का विश्लेषण करने की संभावना शामिल नहीं है। टोडोरोव ने निष्कर्ष निकाला है कि आज सौसुरे के काम एक ऐसी घटना के प्रतीकों का अध्ययन करने के लिए उनकी अनिच्छा में बेहद सुसंगत प्रतीत होते हैं जिनका स्पष्ट रूप से परिभाषित अर्थ है [परिशिष्ट 1]। विपर्यय की खोज करते हुए, सॉसर केवल दोहराव पर ध्यान देता है, लेकिन पिछले विकल्पों पर नहीं। . . . निबेलुन्जेनलीड का अध्ययन करते हुए, वह प्रतीकों को केवल गलत रीडिंग के लिए असाइन करने के लिए परिभाषित करता है: यदि वे अनजाने में हैं, तो प्रतीक मौजूद नहीं हैं। आखिरकार, सामान्य भाषाविज्ञान पर अपने लेखन में, वह एक अर्धविज्ञान के अस्तित्व की धारणा बनाता है जो न केवल भाषाई संकेतों का वर्णन करता है; लेकिन यह धारणा इस तथ्य से सीमित है कि अर्धविज्ञान केवल यादृच्छिक, मनमानी संकेतों का वर्णन कर सकता है।

यदि यह वास्तव में ऐसा है, तो यह केवल इसलिए है क्योंकि वह किसी वस्तु के बिना "इरादे" की कल्पना नहीं कर सकता था; वे रूप और सामग्री के बीच की खाई को पूरी तरह से नहीं भर सके - उनके लेखन में यह एक प्रश्न बन गया। इसके बजाय, उन्होंने "भाषाई वैधता" की ओर रुख किया। बीच में, एक ओर, इतिहास और व्यक्तिपरक अनुमानों पर आधारित उन्नीसवीं सदी की अवधारणाएं, और इन अवधारणाओं के आधार पर यादृच्छिक व्याख्या के तरीके, और दूसरी ओर, संरचनावादी अवधारणाएं जो रूप और सामग्री (विषय और वस्तु) के बीच विरोध को मिटा देती हैं। संरचनावाद, मनोविश्लेषण, और यहां तक ​​कि क्वांटम यांत्रिकी में अर्थ और उत्पत्ति - भाषा विज्ञान और लाक्षणिक विज्ञान पर फर्डिनेंड डी सॉसर का लेखन भाषा और संस्कृति में अर्थों के अध्ययन में एक महत्वपूर्ण मोड़ है।

1928 में हेग में भाषाविदों की पहली अंतर्राष्ट्रीय कांग्रेस में रूसी वैज्ञानिकों का भी प्रतिनिधित्व किया गया था। एस। कार्तसेव्स्की, आर। याकोबसन और एन। ट्रुबेट्सकोय ने एक रिपोर्ट बनाई जिसने पिछली शताब्दी की शुरुआत के लिए सबसे आधुनिक विचारों की भावना में - भाषा की पदानुक्रमित संरचना की जांच की। जैकबसन ने अपने लेखन में सॉसर के विचारों को विकसित किया कि किसी भाषा के मूल तत्वों का अध्ययन सबसे पहले उनके कार्यों के संबंध में किया जाना चाहिए, न कि उनकी घटना के कारणों के साथ।

दुर्भाग्य से, 1924 में स्टालिन के सत्ता में आने के बाद, रूसी भाषाविज्ञान, कई अन्य विज्ञानों की तरह, वापस फेंक दिया गया। कई प्रतिभाशाली वैज्ञानिकों को प्रवास करने के लिए मजबूर किया गया, देश से निष्कासित कर दिया गया या शिविरों में उनकी मृत्यु हो गई। 1950 के दशक के मध्य से ही सिद्धांतों का एक निश्चित बहुलवाद संभव हुआ है - इस पर खंड 1.2 में और अधिक।

1.2 बीसवीं शताब्दी के उत्तरार्ध में भाषाविज्ञान में गणितीय विधियों का अनुप्रयोग

बीसवीं शताब्दी के मध्य तक, चार विश्व भाषाई स्कूल बन गए थे, जिनमें से प्रत्येक एक निश्चित "सटीक" पद्धति के पूर्वज थे। लेनिनग्राद ध्वन्यात्मक स्कूल(इसके पूर्वज बॉडौइन डी कर्टेने एल.वी. शचेरबा के छात्र थे) ने मूल वक्ताओं के भाषण के विश्लेषण के आधार पर एक मनोवैज्ञानिक प्रयोग का इस्तेमाल ध्वनि के रूप में ध्वनि को सामान्य बनाने के लिए मुख्य मानदंड के रूप में किया था।

वैज्ञानिक प्राग भाषाई सर्कल, विशेष रूप से - इसके संस्थापक एन.एस. ट्रुबेत्सकोय, जो रूस से आए थे, ने विरोध के सिद्धांत को विकसित किया - भाषा की शब्दार्थ संरचना को उनके द्वारा विरोधी रूप से निर्मित के एक सेट के रूप में वर्णित किया गया था। अर्थ इकाइयाँ- सेम। यह सिद्धांत न केवल भाषा, बल्कि कलात्मक संस्कृति के अध्ययन में भी लागू किया गया था।

विचारक अमेरिकी वर्णनात्मकताभाषाविद् एल. ब्लूमफील्ड और ई. सपीर थे। भाषा को वर्णनवादियों को भाषण बयानों के एक सेट के रूप में प्रस्तुत किया गया था, जो उनके अध्ययन का मुख्य उद्देश्य था। उनका ध्यान ग्रंथों के वैज्ञानिक विवरण (इसलिए नाम) के नियमों पर था: उनके तत्वों के संगठन, व्यवस्था और वर्गीकरण का अध्ययन। ध्वन्यात्मकता और आकृति विज्ञान के क्षेत्र में विश्लेषणात्मक प्रक्रियाओं का औपचारिककरण (विभिन्न स्तरों पर भाषा के अध्ययन के लिए सिद्धांतों का विकास, वितरण विश्लेषण, प्रत्यक्ष घटकों की विधि, आदि) ने भाषाई मॉडलिंग के सामान्य प्रश्नों को तैयार किया। भाषा की सामग्री की योजना के साथ-साथ भाषा के प्रतिमान पक्ष के प्रति असावधानी ने वर्णनात्मकवादियों को भाषा को पूरी तरह से एक प्रणाली के रूप में व्याख्या करने की अनुमति नहीं दी।

1960 के दशक में औपचारिक व्याकरण का सिद्धांत विकसित हुआ, जो मुख्य रूप से अमेरिकी दार्शनिक और भाषाविद् एन. चॉम्स्की के काम के कारण उत्पन्न हुआ। उन्हें सबसे प्रसिद्ध आधुनिक वैज्ञानिकों और सार्वजनिक हस्तियों में से एक माना जाता है, कई लेख, मोनोग्राफ और यहां तक ​​​​कि एक पूर्ण-लंबाई वाली वृत्तचित्र भी उन्हें समर्पित है। चॉम्स्की द्वारा आविष्कृत वाक्यात्मक संरचना का वर्णन करने के एक मौलिक रूप से नए तरीके के नाम से - जनरेटिव (जनरेटिंग) व्याकरण - भाषा विज्ञान में संबंधित प्रवृत्ति को कहा जाता था जनरेटिविज्म.

रूस के अप्रवासियों के वंशज, चॉम्स्की ने 1945 से पेंसिल्वेनिया विश्वविद्यालय में भाषा विज्ञान, गणित और दर्शन का अध्ययन किया, अपने शिक्षक ज़ेलिग हैरिस से बहुत प्रभावित थे - जैसे हैरिस, चॉम्स्की ने माना और अभी भी अपने राजनीतिक विचारों को अराजकतावाद के करीब मानते हैं (वह अभी भी है मौजूदा अमेरिकी राजनीतिक व्यवस्था के आलोचक और वैश्वीकरण विरोधी आध्यात्मिक नेताओं में से एक के रूप में जाना जाता है)।

चॉम्स्की का पहला प्रमुख वैज्ञानिक कार्य, मास्टर की थीसिस "मॉर्फोलॉजी ऑफ़ मॉडर्न हिब्रू" » (1951) अप्रकाशित रहा। चॉम्स्की ने 1955 में पेन्सिलवेनिया विश्वविद्यालय से डॉक्टरेट की उपाधि प्राप्त की, लेकिन उनके शोध प्रबंध (द लॉजिकल स्ट्रक्चर ऑफ लिंग्विस्टिक थ्योरी के शीर्षक के तहत केवल 1975 में पूर्ण रूप से प्रकाशित) और उनके पहले मोनोग्राफ, सिंटैक्टिक स्ट्रक्चर्स (1957, रस। ट्रांस। ट्रांस। ट्रांस।) 1962), 1951-1955 में हार्वर्ड विश्वविद्यालय में प्रदर्शन किया गया था। उसी 1955 में, वैज्ञानिक मैसाचुसेट्स इंस्टीट्यूट ऑफ टेक्नोलॉजी में चले गए, जहां वे 1962 में प्रोफेसर बने।

चॉम्स्की का सिद्धांत अपने विकास के कई चरणों से गुजरा है।

पहले मोनोग्राफ "सिंटेक्टिक स्ट्रक्चर्स" में, वैज्ञानिक ने व्याकरणिक साधनों के एक सीमित सेट का उपयोग करके वाक्यों के अनंत सेट को उत्पन्न करने के लिए भाषा को एक तंत्र के रूप में प्रस्तुत किया। भाषाई गुणों का वर्णन करने के लिए, उन्होंने गहरी (प्रत्यक्ष धारणा से छिपी और पुनरावर्ती प्रणाली द्वारा उत्पन्न, यानी, बार-बार लागू किया जा सकता है, नियम) और सतह (सीधे कथित) व्याकरणिक संरचनाओं के साथ-साथ संक्रमण का वर्णन करने वाले परिवर्तनों की अवधारणाओं का प्रस्ताव दिया। गहरी संरचनाओं से सतह वाले तक। कई सतह संरचनाएं एक गहरी संरचना के अनुरूप हो सकती हैं (उदाहरण के लिए, एक निष्क्रिय संरचना डिक्री पर राष्ट्रपति द्वारा हस्ताक्षर किए जाते हैंसक्रिय निर्माण के समान गहरी संरचना से व्युत्पन्न राष्ट्रपति डिक्री पर हस्ताक्षर करते हैं) और इसके विपरीत (इस प्रकार, अस्पष्टता माँ बेटी से प्यार करती हैसतह संरचनाओं के संयोग के परिणाम के रूप में वर्णित है जो दो अलग-अलग गहरे में वापस जाते हैं, जिनमें से एक में माँ वह है जो बेटी से प्यार करती है, और दूसरे में, वह जो बेटी से प्यार करती है)।

चॉम्स्की के मानक सिद्धांत को चॉम्स्की की पुस्तक "एस्पेक्ट्स ऑफ़ द थ्योरी ऑफ़ सिंटेक्स" में वर्णित "पहलू" मॉडल माना जाता है। इस मॉडल में, पहली बार, अर्थपूर्ण व्याख्या के नियमों को औपचारिक सिद्धांत में पेश किया गया था, जिसका अर्थ गहरी संरचनाओं के लिए था। पहलुओं में, भाषाई क्षमता भाषा (प्रदर्शन) के उपयोग का विरोध करती है, परिवर्तन के दौरान अर्थ के संरक्षण के बारे में तथाकथित काट्ज़-पोस्टल परिकल्पना को अपनाया जाता है, जिसके संबंध में वैकल्पिक परिवर्तन की अवधारणा को बाहर रखा गया है, और एक उपकरण शाब्दिक संगतता का वर्णन करने वाली वाक्यात्मक विशेषताएं पेश की गई हैं।

1970 के दशक में, चॉम्स्की ने नियंत्रण और बंधन के सिद्धांत पर काम किया (GB-सिद्धांत - शब्दों से सरकारऔर बंधन) पिछले वाले की तुलना में अधिक सामान्य है। इसमें, वैज्ञानिक ने विशिष्ट नियमों को त्याग दिया जो विशिष्ट भाषाओं की वाक्यात्मक संरचनाओं का वर्णन करते हैं। सभी परिवर्तनों को एक सार्वभौमिक चाल परिवर्तन के साथ बदल दिया गया है। जीबी सिद्धांत के ढांचे के भीतर, निजी मॉड्यूल भी हैं, जिनमें से प्रत्येक व्याकरण के अपने हिस्से के लिए जिम्मेदार है।

पहले से ही हाल ही में, 1995 में, चॉम्स्की ने एक न्यूनतम कार्यक्रम पेश किया, जहां मानव भाषा को मशीनी भाषा की तरह वर्णित किया गया है। यह सिर्फ एक कार्यक्रम है - कोई मॉडल या सिद्धांत नहीं। इसमें, चॉम्स्की मानव भाषा तंत्र के दो मुख्य उप-प्रणालियों की पहचान करता है: लेक्सिकॉन और कंप्यूटिंग सिस्टम, साथ ही दो इंटरफेस - ध्वन्यात्मक और तार्किक।

चॉम्स्की के औपचारिक व्याकरण न केवल प्राकृतिक बल्कि कृत्रिम भाषाओं - विशेष रूप से प्रोग्रामिंग भाषाओं का वर्णन करने के लिए क्लासिक बन गए हैं। 20 वीं शताब्दी के उत्तरार्ध में संरचनात्मक भाषाविज्ञान के विकास को "चोम्स्कियन क्रांति" माना जा सकता है।

मॉस्को फोनोलॉजिकल स्कूल, जिनके प्रतिनिधि ए.ए. रिफॉर्मत्स्की, वी.एन. सिदोरोव, पी.एस. कुज़नेत्सोव, ए.एम. सुखोटिन, आर.आई. अवनेसोव ने ध्वन्यात्मकता का अध्ययन करने के लिए इसी तरह के सिद्धांत का इस्तेमाल किया। धीरे-धीरे, "सटीक" तरीके न केवल ध्वन्यात्मकता के संबंध में, बल्कि वाक्य रचना के लिए भी लागू होने लगे हैं। भाषाविद और गणितज्ञ, दोनों यहाँ और विदेश में, भाषा की संरचना का अध्ययन करने लगे हैं। 1950 और 60 के दशक में, सोवियत संघ में गणित और भाषा विज्ञान के बीच बातचीत में एक नया चरण शुरू हुआ, जो मशीनी अनुवाद प्रणालियों के विकास से जुड़ा था।

हमारे देश में इन कार्यों की शुरुआत के लिए प्रोत्साहन संयुक्त राज्य अमेरिका में मशीनी अनुवाद के क्षेत्र में पहला विकास था (हालांकि पी.पी. स्मिरनोव-ट्रॉयन्स्की द्वारा पहला मशीनीकृत अनुवाद उपकरण का आविष्कार यूएसएसआर में 1933 में वापस किया गया था, यह आदिम होने के नाते , व्यापक नहीं हुआ)। 1947 में, ए। बट और डी। ब्रिटन ने कंप्यूटर का उपयोग करके शब्द-दर-शब्द अनुवाद के लिए एक कोड के साथ आया, एक साल बाद, आर। रिचेंस ने मशीनी अनुवाद में शब्दों को उपजी और अंत में विभाजित करने के लिए एक नियम का प्रस्ताव दिया। वो साल आज से काफी अलग थे। ये बहुत बड़ी और महंगी मशीनें थीं जो पूरे कमरे को घेर लेती थीं और इन्हें बनाए रखने के लिए इंजीनियरों, ऑपरेटरों और प्रोग्रामर के बड़े कर्मचारियों की आवश्यकता होती थी। मूल रूप से, इन कंप्यूटरों का उपयोग सैन्य संस्थानों की जरूरतों के लिए गणितीय गणना करने के लिए किया जाता था - गणित, भौतिकी और प्रौद्योगिकी में नया, सबसे पहले, सैन्य मामलों में। प्रारंभिक अवस्था में, सांसद के विकास को सेना द्वारा सक्रिय रूप से समर्थन दिया गया था, इस सब के साथ (शीत युद्ध की स्थितियों में), संयुक्त राज्य अमेरिका में रूसी-अंग्रेजी दिशा विकसित हुई, और यूएसएसआर में एंग्लो-रूसी दिशा।

जनवरी 1954 में, "जॉर्जटाउन प्रयोग" मैसाचुसेट्स तकनीकी विश्वविद्यालय में हुआ - आईबीएम -701 मशीन पर रूसी से अंग्रेजी में अनुवाद का पहला सार्वजनिक प्रदर्शन। D.Yu द्वारा किए गए प्रयोग के सफल मार्ग के बारे में संदेश का सार। पनोव, आरजे "गणित", 1954, नंबर 10 में दिखाई दिए: "मशीन का उपयोग करके एक भाषा से दूसरी भाषा में अनुवाद: पहले सफल परीक्षण पर एक रिपोर्ट।"

डी यू पानोव (उस समय वैज्ञानिक सूचना संस्थान के निदेशक - आईएनआई, बाद में विनीति) ने आई के बेल्स्काया को आकर्षित किया, जिन्होंने बाद में यूएसएसआर एकेडमी ऑफ साइंसेज के सटीक गणित और कंप्यूटर इंजीनियरिंग संस्थान में मशीन अनुवाद समूह का नेतृत्व किया। मशीनी अनुवाद पर काम 1955 के अंत तक, बीईएसएम मशीन की मदद से अंग्रेजी से रूसी में अनुवाद करने का पहला अनुभव पुराना है। बीईएसएम के लिए कार्यक्रम एन.पी. द्वारा संकलित किए गए थे। ट्रिफोनोव और एल.एन. कोरोलेव, जिनकी पीएचडी थीसिस मशीनी अनुवाद के लिए शब्दकोशों के निर्माण के तरीकों के लिए समर्पित थी।

समानांतर में, यूएसएसआर एकेडमी ऑफ साइंसेज के गणितीय संस्थान के अनुप्रयुक्त गणित विभाग (अब रूसी विज्ञान अकादमी के एम.वी. केल्डीश इंस्टीट्यूट ऑफ एप्लाइड मैथमेटिक्स) में मशीनी अनुवाद पर काम किया गया था। गणितज्ञ की पहल पर ए.ए. ल्यपुनोव। उन्होंने ओ.एस. कुलगिन और उनके छात्र टी.डी. वेंटजेल और एन.एन. रिको। एक भाषा से दूसरी भाषा में अनुवाद करने के लिए प्रौद्योगिकी का उपयोग करने की संभावना के बारे में ल्यपुनोव और कुलगिना के विचार नेचर, 1955, नंबर 8 पत्रिका में प्रकाशित हुए थे। 1955 के अंत से, टी.एन. मोलोशनाया, जिन्होंने तब अंग्रेजी-रूसी अनुवाद एल्गोरिथ्म पर स्वतंत्र काम शुरू किया था।

आर। फ्रुमकिना, जो उस समय स्पेनिश से अनुवाद एल्गोरिथ्म में लगे हुए थे, याद करते हैं कि काम के इस स्तर पर कोई भी सुसंगत कदम उठाना मुश्किल था। बहुत अधिक बार मुझे अनुमानी अनुभव का पालन करना पड़ा - मेरा अपना या सहकर्मी।

उसी समय, मशीनी अनुवाद प्रणाली की पहली पीढ़ी बहुत अपूर्ण थी। ये सभी एल्गोरिदम पर आधारित हैं लगातार अनुवाद"शब्द दर शब्द", "वाक्यांश द्वारा वाक्यांश" - शब्दों और वाक्यों के बीच के शब्दार्थ संबंधों को किसी भी तरह से ध्यान में नहीं रखा गया था। उदाहरण के लिए, वाक्य हैं: जॉन अपने खिलौने के डिब्बे की तलाश में था।अंत में उन्होंने इसे पाया। डिब्बा कलम में था।जॉन बहुत खुश था. (जॉन अपने खिलौने के डिब्बे की तलाश में था। आखिरकार उसने उसे ढूंढ लिया। बॉक्स प्लेपेन में था। जॉन बहुत खुश था।) इस संदर्भ में "पेन" एक "कलम" (लेखन उपकरण) नहीं है, बल्कि एक "प्लेपेन" ( प्ले-पेन) समानार्थी, विलोम और आलंकारिक अर्थों का ज्ञान कंप्यूटर में दर्ज करना कठिन है। मानव अनुवादक के उपयोग पर केंद्रित कंप्यूटर सिस्टम का विकास एक आशाजनक दिशा थी।

समय के साथ, प्रत्यक्ष अनुवाद प्रणालियों को टी-सिस्टम (अंग्रेजी शब्द "स्थानांतरण" - परिवर्तन से) द्वारा बदल दिया गया, जिसमें वाक्य-विन्यास संरचनाओं के स्तर पर अनुवाद किया गया था। टी-सिस्टम के एल्गोरिदम ने एक तंत्र का उपयोग किया जिसने इनपुट वाक्य की भाषा के व्याकरण नियमों के अनुसार एक वाक्यात्मक संरचना का निर्माण करना संभव बना दिया (इसी तरह हाई स्कूल में एक विदेशी भाषा को कैसे पढ़ाया जाता है), और फिर आउटपुट वाक्य को संश्लेषित करता है वाक्य-विन्यास की संरचना को बदलकर और शब्दकोश से आवश्यक शब्दों को प्रतिस्थापित करके।

ल्यपुनोव ने अनुवादित पाठ का अर्थ निकालकर दूसरी भाषा में प्रस्तुत करके अनुवाद की बात की। सिमेंटिक विश्लेषण द्वारा इनपुट वाक्य का सिमेंटिक प्रतिनिधित्व प्राप्त करने और प्राप्त सिमेंटिक प्रतिनिधित्व के अनुसार इनपुट वाक्य के संश्लेषण के आधार पर मशीन ट्रांसलेशन सिस्टम के निर्माण के दृष्टिकोण को अभी भी सबसे सही माना जाता है। ऐसी प्रणालियों को आई-सिस्टम ("इंटरलिंगुआ" शब्द से) कहा जाता है। उसी समय, उन्हें बनाने का कार्य, 50 के दशक के अंत और 60 के दशक की शुरुआत में, सूचना प्रसंस्करण के क्षेत्र में वैज्ञानिकों के विश्व समुदाय - IFIP के अंतर्राष्ट्रीय संघ के प्रयासों के बावजूद, अब तक पूरी तरह से हल नहीं किया गया है। .

वैज्ञानिकों ने सोचा कि ग्रंथों के साथ काम करने के लिए एल्गोरिदम को कैसे औपचारिक रूप दिया जाए और कैसे बनाया जाए, मशीन में कौन से शब्दकोश दर्ज किए जाने चाहिए, मशीनी अनुवाद में किस भाषाई पैटर्न का उपयोग किया जाना चाहिए। पारंपरिक भाषाविज्ञान में ऐसे विचार नहीं थे - न केवल शब्दार्थ के संदर्भ में, बल्कि वाक्य रचना के संदर्भ में भी। उस समय, किसी भी भाषा के लिए वाक्यात्मक निर्माणों की कोई सूची नहीं थी, उनकी अनुकूलता और विनिमेयता की शर्तों का अध्ययन नहीं किया गया था, छोटे घटक तत्वों से वाक्यात्मक संरचना की बड़ी इकाइयों के निर्माण के नियम विकसित नहीं किए गए थे।

मशीनी अनुवाद की सैद्धांतिक नींव बनाने की आवश्यकता ने गणितीय भाषाविज्ञान के गठन और विकास को जन्म दिया। यूएसएसआर में इस मामले में अग्रणी भूमिका गणितज्ञों ए.ए. द्वारा निभाई गई थी। ल्यपुनोव, ओ.एस. कुलगिना, वी.ए. उसपेन्स्की, भाषाविद वी.यू. रोसेनज़वेग, पी.एस. कुज़नेत्सोव, आर.एम. फ्रुमकिना, ए.ए. रिफॉर्मत्स्की, आई.ए. मेलचुक, वी.वी. इवानोव। कुलगिना का शोध प्रबंध व्याकरण के औपचारिक सिद्धांत (एक साथ संयुक्त राज्य अमेरिका में एन। खोम्स्की के साथ) के अध्ययन के लिए समर्पित था, कुज़नेत्सोव ने भाषाविज्ञान के स्वयंसिद्धकरण के कार्य को आगे रखा, जो एफ.एफ. के कार्यों पर वापस जाता है। फ़ोर्टुनाटोव।

6 मई, 1960 को, यूएसएसआर एकेडमी ऑफ साइंसेज के प्रेसिडियम की डिक्री "भाषा के अध्ययन के लिए संरचनात्मक और गणितीय तरीकों के विकास पर" को अपनाया गया था, और इसी विभाग को भाषाविज्ञान संस्थान और संस्थान में बनाया गया था। रूसी भाषा। 1960 के बाद से, देश के प्रमुख मानवीय विश्वविद्यालयों - मॉस्को स्टेट यूनिवर्सिटी, लेनिनराड, नोवोसिबिर्स्क विश्वविद्यालयों, मॉस्को स्टेट इंस्टीट्यूट ऑफ फॉरेन लैंग्वेजेज के दर्शनशास्त्र के संकाय - ने स्वचालित पाठ प्रसंस्करण के क्षेत्र में कर्मियों को प्रशिक्षण देना शुरू किया।

साथ ही, इस अवधि के मशीनी अनुवाद पर काम करता है, जिसे "शास्त्रीय" कहा जाता है, व्यावहारिक रुचि से अधिक सैद्धांतिक है। पिछली शताब्दी के अस्सी के दशक में ही लागत प्रभावी मशीन अनुवाद प्रणाली बनाई जाने लगी थी। मैं इसके बारे में बाद में खंड 2.1, मशीनी अनुवाद में बात करूंगा।

1960 - 70 के दशक में सेट थ्योरी और गणितीय लॉजिक के तरीकों का उपयोग करते हुए गहन सैद्धांतिक विकास शामिल हैं, जैसे कि फील्ड थ्योरी और फजी सेट थ्योरी।

भाषाविज्ञान में क्षेत्र सिद्धांत के लेखक सोवियत कवि, अनुवादक और भाषाविद् वी.जी. अदमोनी। उन्होंने शुरू में जर्मन भाषा के आधार पर अपना सिद्धांत विकसित किया। एडमोनी के लिए, "फ़ील्ड" की अवधारणा भाषाई तत्वों के एक मनमाना गैर-रिक्त सेट को दर्शाती है (उदाहरण के लिए, "लेक्सिकल फील्ड", "सिमेंटिक फील्ड")।

क्षेत्र की संरचना विषम है: इसमें एक कोर होता है, जिसके तत्वों में एक सेट और एक परिधि को परिभाषित करने वाली विशेषताओं का एक पूरा सेट होता है, जिसके तत्वों में किसी दिए गए सेट की दोनों विशेषताएं हो सकती हैं (सभी नहीं) और पड़ोसी। मैं इस कथन को दर्शाने वाला एक उदाहरण दूंगा: उदाहरण के लिए, अंग्रेजी में, यौगिक शब्दों का क्षेत्र ("दिन-सपना" - "सपना" वाक्यांशों के क्षेत्र से अलग करना मुश्किल है ("आंसू गैस" - "आंसू गैस") .

ऊपर वर्णित फजी सेट का सिद्धांत क्षेत्र सिद्धांत से निकटता से संबंधित है। यूएसएसआर में, भाषाविद वी.जी. अदमोनी, आई.पी. इवानोवा, जी.जी. पोचेंत्सोव, हालांकि, इसके पूर्वज अमेरिकी गणितज्ञ एल। ज़ादेह थे, जिन्होंने 1965 में "फ़ज़ी लॉजिक" लेख प्रकाशित किया था। फ़ज़ी सेट के सिद्धांत के लिए गणितीय औचित्य देते हुए, ज़ेड ने उन्हें भाषाई सामग्री के आधार पर माना।

इस सिद्धांत में, हम किसी दिए गए सेट (एए) के तत्वों के संबंध के बारे में ज्यादा बात नहीं कर रहे हैं, लेकिन इस सदस्यता (एए) की डिग्री के बारे में, क्योंकि परिधीय तत्व कई क्षेत्रों से एक डिग्री या किसी अन्य से संबंधित हो सकते हैं। ज़ेड (लोफ्टी-ज़ेड) अज़रबैजान के मूल निवासी थे, 12 साल की उम्र तक उन्हें चार भाषाओं - अज़रबैजानी, रूसी, अंग्रेजी और फारसी में संवाद करने का अभ्यास था - और तीन अलग-अलग अक्षरों का इस्तेमाल किया: सिरिलिक, लैटिन, अरबी। जब एक वैज्ञानिक से पूछा जाता है कि फ़ज़ी सेट थ्योरी और भाषाविज्ञान के बीच क्या सामान्य है, तो वह इस संबंध से इनकार नहीं करता है, लेकिन स्पष्ट करता है: “मुझे यकीन नहीं है कि इन भाषाओं के अध्ययन का मेरी सोच पर बड़ा प्रभाव पड़ा है। अगर ऐसा था, तो केवल अवचेतन रूप से। अपनी युवावस्था में, ज़ादेह ने तेहरान के एक प्रेस्बिटेरियन स्कूल में अध्ययन किया, और द्वितीय विश्व युद्ध के बाद वह संयुक्त राज्य अमेरिका चले गए। "सवाल यह नहीं है कि मैं एक अमेरिकी, रूसी, अजरबैजान या कोई और हूं," उन्होंने एक बातचीत में कहा, "मैं इन सभी संस्कृतियों और लोगों से आकार लेता हूं और उनमें से प्रत्येक के बीच काफी सहज महसूस करता हूं।" इन शब्दों में अस्पष्ट सेटों के सिद्धांत की विशेषता के समान कुछ है - स्पष्ट परिभाषाओं और तेज श्रेणियों से प्रस्थान।

हमारे देश में, 70 के दशक में, बीसवीं शताब्दी के पश्चिमी भाषाविदों के कार्यों का अनुवाद और अध्ययन किया गया था। मैं एक। मेलचुक ने एन चॉम्स्की के कार्यों का रूसी में अनुवाद किया। पर। स्लीसुरेवा ने अपनी पुस्तक "द थ्योरी ऑफ एफ। डी सौसुरे इन द लाइट" में लिखा है आधुनिक भाषाविज्ञान»सौसुरे के शिक्षण की अभिधारणाओं को 70 के दशक की भाषाविज्ञान की वास्तविक समस्याओं से जोड़ता है। भाषाविज्ञान के और अधिक गणितीकरण की प्रवृत्ति है। प्रमुख घरेलू विश्वविद्यालय "गणितीय (सैद्धांतिक, अनुप्रयुक्त) भाषाविज्ञान" विशेषता में कर्मियों को प्रशिक्षण दे रहे हैं। साथ ही पश्चिम में कंप्यूटर प्रौद्योगिकी के विकास में एक तेज छलांग है, जिसके लिए अधिक से अधिक नई भाषाई नींव की आवश्यकता है।

1980 के दशक में, एकेडमी ऑफ साइंसेज के ओरिएंटल स्टडीज संस्थान के प्रोफेसर यू.के. लेकोम्त्सेव, भाषाई विवरणों में प्रयुक्त योजनाओं, तालिकाओं और अन्य प्रकार के अंकन के विश्लेषण के माध्यम से भाषाविज्ञान की भाषा का विश्लेषण करते हुए, इन उद्देश्यों (मुख्य रूप से मैट्रिक्स बीजगणित की प्रणाली) के लिए उपयुक्त गणितीय प्रणालियों को मानते हैं।

इस प्रकार, बीसवीं शताब्दी के दौरान, सटीक और मानविकी का अभिसरण था। भाषाविज्ञान के साथ गणित की अंतःक्रिया ने तेजी से व्यावहारिक अनुप्रयोग प्राप्त किए। इसके बारे में अगले अध्याय में।

अध्याय 2. भाषाविज्ञान में गणित के प्रयोग के चुनिंदा उदाहरण

2.1 मशीनी अनुवाद

एक सार्वभौमिक तंत्र की मदद से एक भाषा से दूसरी भाषा में अनुवाद करने का विचार इस क्षेत्र में पहला विकास शुरू होने से कई शताब्दियों पहले पैदा हुआ था - 1649 में वापस, रेने डेसकार्टेस ने एक ऐसी भाषा के विचार का प्रस्ताव रखा जिसमें के समकक्ष विचार विभिन्न भाषाओं को एक प्रतीक द्वारा व्यक्त किया जाएगा। 1930-40 के दशक में इस विचार को लागू करने का पहला प्रयास, सदी के मध्य में सैद्धांतिक विकास की शुरुआत, 1970-80 के दशक में प्रौद्योगिकी की मदद से अनुवाद प्रणालियों में सुधार, अंत में अनुवाद प्रौद्योगिकी का तेजी से विकास दशक - ये एक उद्योग के रूप में मशीनी अनुवाद के विकास के चरण हैं। यह मशीनी अनुवाद के कार्य से था कि अभिकलनात्मक भाषाविज्ञानविज्ञान की तरह।

70 के दशक के अंत और 80 के दशक की शुरुआत में कंप्यूटर प्रौद्योगिकी के विकास के साथ, शोधकर्ताओं ने खुद को अधिक यथार्थवादी और लागत प्रभावी लक्ष्य निर्धारित किया - मशीन एक प्रतियोगी नहीं बन गई (जैसा कि पहले माना गया था), लेकिन एक मानव अनुवादक के लिए एक सहायक। मशीनी अनुवाद विशेष रूप से सैन्य कार्यों को पूरा करना बंद कर देता है (सभी सोवियत और अमेरिकी आविष्कार और अनुसंधान, जो मुख्य रूप से रूसी और अंग्रेजी पर केंद्रित हैं, एक तरह से या किसी अन्य ने योगदान दिया है " शीत युद्ध")। 1978 में, प्राकृतिक भाषा के शब्दों को अर्पा इंटरकनेक्टेड नेटवर्क पर प्रसारित किया गया था, और छह साल बाद, संयुक्त राज्य अमेरिका में पहला माइक्रो कंप्यूटर अनुवाद कार्यक्रम दिखाई दिया।

70 के दशक में, यूरोपीय समुदायों का आयोग सिस्ट्रान कंप्यूटर अनुवादक का अंग्रेजी-फ्रांसीसी संस्करण खरीदता है, फ्रांसीसी-अंग्रेज़ी और इतालवी-अंग्रेज़ी संस्करणों और अमेरिकी सशस्त्र बलों द्वारा उपयोग किए जाने वाले रूसी-से-अंग्रेज़ी अनुवाद प्रणाली का भी आदेश देता है। इस प्रकार यूरोट्रा परियोजना की नींव रखी गई।

70-80 के दशक में मशीनी अनुवाद के पुनरुद्धार के बारे में। निम्नलिखित तथ्य गवाही देते हैं: यूरोपीय समुदाय आयोग (सीईसी) सिस्ट्रान के अंग्रेजी-फ्रांसीसी संस्करण के साथ-साथ रूसी से अंग्रेजी में अनुवाद प्रणाली खरीदता है (बाद में एएलपीएसी रिपोर्ट के बाद विकसित किया गया और यूएस एयर द्वारा उपयोग करना जारी रखा गया) फोर्स और नासा); इसके अलावा, सीईसी फ्रेंच-अंग्रेज़ी और इतालवी-अंग्रेज़ी संस्करणों के विकास का आदेश देता है। साथ ही, जापान में मशीनी अनुवाद गतिविधियों का तेजी से विस्तार हो रहा है; संयुक्त राज्य अमेरिका में, पैन अमेरिकन हेल्थ ऑर्गनाइजेशन (PAHO) एक स्पेनिश-अंग्रेज़ी दिशा (SPANAM प्रणाली) के विकास का आदेश देता है; अमेरिकी वायु सेना ऑस्टिन में टेक्सास विश्वविद्यालय में भाषाई अनुसंधान केंद्र में एक मशीन अनुवाद प्रणाली के विकास के लिए धन मुहैया करा रही है; कनाडा में TAUM समूह अपने METEO (मौसम विज्ञान अनुवाद) प्रणाली को विकसित करने में उल्लेखनीय प्रगति कर रहा है। पूरी लाइनपरियोजनाएं 70 और 80 के दशक में शुरू हुईं। बाद में पूर्ण विकसित वाणिज्यिक प्रणालियों में विकसित हुआ।

1978-93 की अवधि के दौरान, संयुक्त राज्य अमेरिका में मशीन अनुवाद के क्षेत्र में अनुसंधान पर 20 मिलियन डॉलर, यूरोप में 70 मिलियन और जापान में 200 मिलियन डॉलर खर्च किए गए थे।

नए विकासों में से एक टीएम (अनुवाद मेमोरी) तकनीक है, जो संचय के सिद्धांत पर काम करती है: अनुवाद प्रक्रिया के दौरान, मूल खंड (वाक्य) और इसका अनुवाद सहेजा जाता है, जिसके परिणामस्वरूप भाषाई डेटाबेस का निर्माण होता है; यदि नए अनुवादित पाठ में एक समान या समान खंड पाया जाता है, तो इसे अनुवाद और प्रतिशत मिलान के संकेत के साथ प्रदर्शित किया जाता है। अनुवादक तब निर्णय लेता है (अनुवाद को संपादित करने, अस्वीकार करने या स्वीकार करने के लिए), जिसका परिणाम सिस्टम द्वारा संग्रहीत किया जाता है, इसलिए एक ही वाक्य को दो बार अनुवाद करने की कोई आवश्यकता नहीं है। वर्तमान में, TM प्रौद्योगिकी पर आधारित एक प्रसिद्ध वाणिज्यिक प्रणाली का विकासकर्ता TRADOS प्रणाली (1984 में स्थापित) है।

वर्तमान में, कई दर्जन कंपनियां वाणिज्यिक मशीन अनुवाद प्रणाली विकसित कर रही हैं, जिनमें शामिल हैं: सिस्ट्रान, आईबीएम, एल एंड एच (लर्नआउट एंड हॉस्पी), ट्रांसपेरेंट लैंग्वेज, क्रॉस लैंग्वेज, ट्राइडेंट सॉफ्टवेयर, एट्रिल, ट्रेडोस, कैटरपिलर कंपनी, लिंगोवेयर; एटा सॉफ्टवेयर; लिंग्विस्टिका बी.वी. आदि। सेवाओं का उपयोग करने का अवसर है स्वचालित अनुवादकसीधे वेब पर: अल्फावर्क्स; PROMT का ऑनलाइन अनुवादक, LogoMedia.net, AltaVista की बेबेल मछली अनुवाद सेवा; InfiniT.com; इंटरनेट का अनुवाद।

हमारे देश में भी 80 के दशक के उत्तरार्ध में व्यावसायिक रूप से प्रभावी अनुवाद प्रणालियाँ दिखाई दीं। मशीनी अनुवाद की अवधारणा का विस्तार हो गया है (इसमें "कई स्वचालित और स्वचालित प्रणालियों और उपकरणों का निर्माण शामिल होना शुरू हो गया है जो स्वचालित रूप से या अर्ध-स्वचालित रूप से संपूर्ण अनुवाद चक्र या किसी व्यक्ति के साथ संवाद में व्यक्तिगत कार्य करते हैं"), और इस उद्योग के विकास के लिए सरकारी विनियोग में वृद्धि हुई है।

रूसी, अंग्रेजी, जर्मन, फ्रेंच और जापानी घरेलू अनुवाद प्रणालियों की मुख्य भाषाएँ बन गईं। ऑल-यूनियन ट्रांसलेशन सेंटर (VTsP) ने EC-1035-ANRAP कंप्यूटर का उपयोग करके अंग्रेजी और जर्मन से रूसी में अनुवाद करने के लिए एक प्रणाली विकसित की। इसमें तीन शब्दकोश शामिल थे - इनपुट अंग्रेजी और जर्मन और आउटपुट रूसी - एक एकल के तहत सॉफ्टवेयर. कंप्यूटर प्रौद्योगिकी, प्रोग्रामिंग, रेडियो इलेक्ट्रॉनिक्स, मैकेनिकल इंजीनियरिंग, कृषि, धातु विज्ञान पर कई बदली जाने योग्य विशेष शब्दकोश थे। सिस्टम दो मोड में काम कर सकता है - स्वचालित और इंटरैक्टिव, जब स्क्रीन स्रोत पाठ और प्रति वाक्यांश अनुवाद प्रदर्शित करता है, जिसे एक व्यक्ति संपादित कर सकता है। टेक्स्ट को ANRAP (टाइपिंग की शुरुआत से लेकर प्रिंटिंग के अंत तक) में अनुवाद करने की गति लगभग 100 पेज प्रति घंटा थी।

1989 में, SPRINT प्रकार के वाणिज्यिक अनुवादकों का एक परिवार बनाया गया था, जो रूसी, अंग्रेजी, जर्मन और जापानी के साथ काम कर रहा था। उनका मुख्य लाभ आईबीएम पीसी के साथ उनकी संगतता थी - इस प्रकार, घरेलू मशीन अनुवाद प्रणाली गुणवत्ता के अंतरराष्ट्रीय स्तर तक पहुंच गई। उसी समय, फ्रेंच से रूसी FRAP में मशीनी अनुवाद की एक प्रणाली विकसित की जा रही है, जिसमें पाठ विश्लेषण के 4 चरण शामिल हैं: ग्राफेमेटिक, रूपात्मक, वाक्य-विन्यास और शब्दार्थ। एलजीपीआई में उन्हें। हर्ज़ेन के अनुसार, चार-भाषा (अंग्रेजी, फ्रेंच, स्पेनिश, रूसी) SILOD-MP प्रणाली (अंग्रेजी-रूसी और फ्रेंको-रूसी शब्दकोशों का औद्योगिक मोड में उपयोग किया जाता था) पर काम चल रहा था।

इलेक्ट्रिकल इंजीनियरिंग पर ग्रंथों के विशेष अनुवाद के लिए, ETAP-2 प्रणाली मौजूद थी। इसमें इनपुट टेक्स्ट का विश्लेषण दो स्तरों पर किया गया - रूपात्मक और वाक्यात्मक। ETAP-2 शब्दकोश में लगभग 4 हजार प्रविष्टियाँ थीं; पाठ परिवर्तन का चरण - लगभग 1000 नियम (96 सामान्य, 342 निजी, बाकी शब्दकोश हैं)। यह सब अनुवाद की एक संतोषजनक गुणवत्ता सुनिश्चित करता है (जैसे, पेटेंट का शीर्षक "ऑप्टिकल चरण ग्रिड व्यवस्था और ऐसी व्यवस्था वाले युग्मन उपकरण" का अनुवाद "एक ऑप्टिकल चरण ग्रिड डिवाइस और इस तरह के डिवाइस के साथ एक कनेक्टिंग डिवाइस" के रूप में किया गया था - इसके बावजूद तनातनी, अर्थ संरक्षित है)।

मिन्स्क शैक्षणिक संस्थान में विदेशी भाषाएँशब्द रूपों और वाक्यांशों के अंग्रेजी-रूसी शब्दकोश के आधार पर, शीर्षकों के मशीनी अनुवाद के लिए एक प्रणाली का आविष्कार किया गया था), इंस्टीट्यूट ऑफ ओरिएंटल स्टडीज ऑफ एकेडमी ऑफ साइंसेज में - जापानी से रूसी में अनुवाद के लिए एक प्रणाली। मॉस्को रिसर्च इंस्टीट्यूट ऑफ ऑटोमेशन सिस्टम्स में बनाई गई कंप्यूटिंग और प्रोग्रामिंग के लिए पहली स्वचालित शब्दावली और शब्दावली सेवा (SLOTHERM), एक व्याख्यात्मक शब्दकोश में लगभग 20,000 शब्द और भाषाई अनुसंधान के लिए विशेष शब्दकोश शामिल हैं।

मशीनी अनुवाद प्रणाली धीरे-धीरे न केवल अपने इच्छित उद्देश्य के लिए उपयोग की जाने लगी, बल्कि स्वचालित शिक्षण प्रणालियों के एक महत्वपूर्ण घटक के रूप में भी (अनुवाद सिखाने, वर्तनी और व्याकरणिक ज्ञान की जाँच के लिए) उपयोग की जाने लगी।

90 का दशक अपने साथ पीसी बाजार (डेस्कटॉप से ​​पॉकेट तक) और सूचना प्रौद्योगिकी का तेजी से विकास, इंटरनेट का व्यापक उपयोग (जो अधिक अंतरराष्ट्रीय और बहुभाषी होता जा रहा है) लेकर आया। यह सब मांग में स्वचालित अनुवाद प्रणालियों के और विकास को बढ़ावा देता है। 1990 के दशक की शुरुआत से घरेलू डेवलपर्स भी पीसी सिस्टम बाजार में प्रवेश कर रहे हैं।

जुलाई 1990 में, मास्को में पीसी फोरम में, रूस में पहली बार वाणिज्यिक प्रणाली PROMT (प्रोग्रामर्स मशीन ट्रांसलेशन) नामक मशीनी अनुवाद। 1991 में, CJSC की स्थापना हुई थी [!!! फेडरल लॉ-99 दिनांक 05/05/2014 के अनुसार, इस फॉर्म को एक गैर-सार्वजनिक संयुक्त स्टॉक कंपनी द्वारा बदल दिया गया था] " Proekt MT", और पहले से ही 1992 में PROMT ने MP सिस्टम की आपूर्ति के लिए NASA प्रतियोगिता जीती (PROMT इस प्रतियोगिता में एकमात्र गैर-अमेरिकी कंपनी थी) 1992 में, PROMT ने अनुवाद के लिए नए नाम STYLUS के तहत सिस्टम का एक पूरा परिवार जारी किया। अंग्रेजी, जर्मन, फ्रेंच, इतालवी और स्पेनिश से रूसी और रूसी से अंग्रेजी में, और विंडोज के लिए दुनिया की पहली मशीन अनुवाद प्रणाली 1993 में STYLUS के आधार पर बनाई गई थी। 1994 में, STYLUS 2.0 को विंडोज 3.X/95 के लिए जारी किया गया था। /NT, और 1995 -1996 में मशीन अनुवाद प्रणाली की तीसरी पीढ़ी की शुरुआत की, विंडोज 95/एनटी के लिए पूरी तरह से 32-बिट स्टाइलस 3.0, साथ ही, पूरी तरह से नई, दुनिया की पहली रूसी-जर्मन और रूसी-फ्रांसीसी मशीन का विकास अनुवाद प्रणालियों को सफलतापूर्वक पूरा किया गया।

1997 में, फ्रांसीसी कंपनी सॉफ्टिसिमो के साथ फ्रेंच से जर्मन और अंग्रेजी में और इसके विपरीत अनुवाद प्रणाली के निर्माण पर एक समझौते पर हस्ताक्षर किए गए थे, और इस साल दिसंबर में, दुनिया की पहली जर्मन-फ्रेंच अनुवाद प्रणाली जारी की गई थी। उसी वर्ष, PROMT कंपनी ने जाइंट तकनीक का उपयोग करके कार्यान्वित एक प्रणाली जारी की, जो एक शेल में कई भाषा दिशाओं का समर्थन करती है, साथ ही इंटरनेट WebTranSite पर काम करने के लिए एक विशेष अनुवादक भी है।

1998 में, नए नाम PROMT 98 के तहत कार्यक्रमों का एक पूरा समूह जारी किया गया था। एक साल बाद, PROMT ने दो नए उत्पाद जारी किए: इंटरनेट पर काम करने के लिए एक अनूठा सॉफ्टवेयर पैकेज - PROMT इंटरनेट, और कॉर्पोरेट मेल सिस्टम के लिए एक अनुवादक - PROMT मेल अनुवादक। नवंबर 1999 में, PROMT को फ्रांसीसी पत्रिका पीसी एक्सपर्ट द्वारा परीक्षण की गई सर्वश्रेष्ठ मशीन अनुवाद प्रणाली के रूप में मान्यता दी गई थी, जो अपने प्रतिस्पर्धियों को 30 प्रतिशत से बेहतर प्रदर्शन कर रही थी। कॉर्पोरेट ग्राहकों के लिए विशेष सर्वर समाधान भी विकसित किए गए हैं - कॉर्पोरेट अनुवाद सर्वर PROMT अनुवाद सर्वर (PTS) और इंटरनेट समाधान PROMT इंटरनेट अनुवाद सर्वर (PITS)। 2000 में, PROMT ने MT सिस्टम की एक नई पीढ़ी: PROMT ट्रांसलेशन ऑफिस 2000, PROMT इंटरनेट 2000 और मैजिक गुडी 2000 जारी करके सॉफ्टवेयर उत्पादों की अपनी पूरी लाइन को अपडेट किया।

PROMT प्रणाली के समर्थन से ऑनलाइन अनुवाद का उपयोग कई घरेलू और विदेशी साइटों पर किया जाता है: PROMT का ऑनलाइन अनुवादक, InfiniT.com, Translate.Ru, Lycos, आदि, साथ ही व्यावसायिक दस्तावेजों के अनुवाद के लिए विभिन्न प्रोफाइल के संस्थानों में, लेख और पत्र (आउटलुक एक्सप्रेस और अन्य ईमेल क्लाइंट में सीधे निर्मित अनुवाद प्रणालियां हैं)।

आजकल, सिस्टम के उपयोग के आधार पर नई मशीनी अनुवाद प्रौद्योगिकियां उभर रही हैं कृत्रिम होशियारी, सांख्यकी पद्धतियाँ। बाद के बारे में - अगले भाग में।

2.2 अतिरिक्तभाषा सीखने में ical तरीके

आधुनिक भाषाविज्ञान में मात्रात्मक गणित के तरीकों का उपयोग करके भाषाई घटनाओं के अध्ययन पर काफी ध्यान दिया जाता है। मात्रात्मक डेटा अक्सर अध्ययन के तहत घटनाओं, उनके स्थान और संबंधित घटनाओं की प्रणाली में भूमिका को और अधिक गहराई से समझने में मदद करते हैं। प्रश्न का उत्तर "कितना" प्रश्नों का उत्तर देने में मदद करता है "क्या", "कैसे", "क्यों" - ऐसी मात्रात्मक विशेषता की अनुमानी क्षमता है।

सांख्यिकीय विधियाँ मशीनी अनुवाद प्रणाली के विकास में महत्वपूर्ण भूमिका निभाती हैं (देखें खंड 2.1)। सांख्यिकीय दृष्टिकोण में, अनुवाद समस्या को शोर चैनल के रूप में माना जाता है। कल्पना कीजिए कि हमें अंग्रेजी से रूसी में एक वाक्य का अनुवाद करने की आवश्यकता है। शोर चैनल सिद्धांत हमें एक अंग्रेजी और एक रूसी वाक्य के बीच संबंधों की निम्नलिखित व्याख्या प्रदान करता है: एक अंग्रेजी वाक्य कुछ भी नहीं बल्कि एक रूसी वाक्य है जो किसी प्रकार के शोर से विकृत है। मूल रूसी वाक्य को पुनः प्राप्त करने के लिए, हमें यह जानना होगा कि लोग आमतौर पर रूसी में क्या कहते हैं और रूसी वाक्यांश अंग्रेजी में कैसे विकृत होते हैं। अनुवाद ऐसे रूसी वाक्य की खोज करके किया जाता है जो रूसी वाक्य की बिना शर्त संभावना के उत्पादों को अधिकतम करता है और दिए गए रूसी वाक्य को अंग्रेजी वाक्य (मूल) की संभावना को अधिकतम करता है। बेयस प्रमेय के अनुसार, यह रूसी वाक्य अंग्रेजी का सबसे संभावित अनुवाद है:

जहां ई अनुवाद वाक्य है और एफ मूल वाक्य है

इसलिए हमें एक स्रोत मॉडल और एक चैनल मॉडल, या एक भाषा मॉडल और एक अनुवाद मॉडल की आवश्यकता है। भाषा मॉडल को लक्ष्य भाषा (हमारे मामले में, रूसी) में किसी भी वाक्य के लिए एक संभाव्यता स्कोर और मूल वाक्य के अनुवाद मॉडल को निर्दिष्ट करना होगा। (तालिका 1 देखें)

सामान्य तौर पर, एक मशीनी अनुवाद प्रणाली दो मोड में काम करती है:

1. सिस्टम प्रशिक्षण: समानांतर ग्रंथों का एक प्रशिक्षण कोष लिया जाता है, और रैखिक प्रोग्रामिंग का उपयोग करते हुए, अनुवाद पत्राचार तालिकाओं के ऐसे मूल्यों की खोज की जाती है जो उपलब्ध अंग्रेजी के अनुसार कॉर्पस के रूसी भाग की संभावना को अधिकतम करते हैं (उदाहरण के लिए) चयनित अनुवाद मॉडल के लिए। रूसी भाषा का एक मॉडल उसी कोष के रूसी भाग पर बनाया गया है।

2. शोषण: एक अपरिचित अंग्रेजी वाक्य के लिए प्राप्त आंकड़ों के आधार पर, एक रूसी की खोज की जाती है जो भाषा मॉडल और अनुवाद मॉडल द्वारा निर्दिष्ट संभावनाओं के उत्पाद को अधिकतम करता है। ऐसी खोज के लिए उपयोग किए जाने वाले प्रोग्राम को डिकोडर कहा जाता है।

सबसे सरल सांख्यिकीय अनुवाद मॉडल शाब्दिक अनुवाद मॉडल है। इस मॉडल में, यह माना जाता है कि एक वाक्य को एक भाषा से दूसरी भाषा में अनुवाद करने के लिए, सभी शब्दों का अनुवाद करने के लिए पर्याप्त है ("शब्दों का एक बैग बनाएं"), और मॉडल सही क्रम में अपना स्थान प्रदान करेगा। कम करने के लिए P(a, f | e) से P(a | e , f), यानी। किसी दिए गए संरेखण की संभावनाओं को वाक्यों की एक जोड़ी दी जाती है, प्रत्येक संभावना पी (ए, एफ | ई) वाक्यों की एक जोड़ी के सभी संरेखण की संभावनाओं के योग से सामान्यीकृत होती है:

मॉडल # 1 को प्रशिक्षित करने के लिए प्रयुक्त विटरबी एल्गोरिथ्म का कार्यान्वयन इस प्रकार है:

1. अनुवाद पत्राचार संभावनाओं की पूरी तालिका समान मूल्यों से भरी हुई है।

2. शब्दों के जोड़ीदार कनेक्शन के सभी संभावित रूपों के लिए, संभावना पी (ए, एफ | ई) की गणना की जाती है:

3. पी (ए, एफ | ई) के मूल्यों को पी (ए | ई, एफ) के मूल्यों को प्राप्त करने के लिए सामान्यीकृत किया जाता है।

4. प्रत्येक अनुवाद जोड़ी की आवृत्ति की गणना की जाती है, प्रत्येक संरेखण विकल्प की संभावना के आधार पर भारित किया जाता है।

5. परिणामी भारित आवृत्तियों को सामान्यीकृत किया जाता है और अनुवाद पत्राचार संभावनाओं की एक नई तालिका बनाते हैं

6. एल्गोरिथ्म चरण 2 से दोहराया जाता है।

एक उदाहरण के रूप में, दो जोड़े वाक्यों के एक समूह पर एक समान मॉडल के प्रशिक्षण पर विचार करें (चित्र 2):

सफेद घर

बड़ी संख्या में पुनरावृत्तियों के बाद, हमें एक तालिका (तालिका 2) प्राप्त होगी, जो दर्शाती है कि अनुवाद उच्च सटीकता के साथ किया गया है।

साथ ही, शब्दावली, आकृति विज्ञान, वाक्य रचना और शैली के अध्ययन में सांख्यिकीय विधियों का व्यापक रूप से उपयोग किया जाता है। पर्म स्टेट यूनिवर्सिटी के वैज्ञानिकों ने इस दावे के आधार पर एक अध्ययन किया कि रूढ़िवादी वाक्यांश पाठ की एक महत्वपूर्ण "निर्माण सामग्री" हैं। इन वाक्यांशों में "परमाणु" दोहराए गए शब्द और आश्रित शब्द-विनिर्देशक शामिल हैं और एक स्पष्ट शैलीगत रंग है।

वैज्ञानिक शैली में, "परमाणु" शब्दों को कहा जा सकता है: अनुसंधान, अध्ययन, कार्य, समस्या, प्रश्न, घटना, तथ्य, अवलोकन, विश्लेषणआदि। पत्रकारिता में, अन्य शब्द "परमाणु" होंगे, जिनका विशेष रूप से समाचार पत्र के पाठ के लिए एक बढ़ा हुआ मूल्य है: समय, व्यक्ति, शक्ति, व्यवसाय, क्रिया, कानून, जीवन, इतिहास, स्थानआदि। (कुल 29)

भाषाविदों के लिए विशेष रुचि राष्ट्रीय भाषा के पेशेवर भेदभाव, शब्दावली और व्याकरण के उपयोग की मौलिकता, व्यवसाय के प्रकार पर निर्भर करती है। यह ज्ञात है कि पेशेवर भाषण में ड्राइवर शू फॉर्म का उपयोग करते हैं के विषय में फेर, मेडिक्स कहते हैं k के विषय में कॉकटेल के बजाय क्लब यू श - ऐसे उदाहरण दिए जा सकते हैं। आँकड़ों का कार्य उच्चारण की परिवर्तनशीलता और भाषा के मानदंड में परिवर्तन को ट्रैक करना है।

व्यावसायिक मतभेद न केवल व्याकरणिक, बल्कि शाब्दिक भी होते हैं। याकूत राज्य विश्वविद्यालय का नाम . के नाम पर रखा गया है एम.के. अम्मोसोव के अनुसार, चिकित्सकों और बिल्डरों (तालिका 3) के बीच कुछ शब्दों के लिए सबसे आम प्रतिक्रियाओं के साथ 50 प्रश्नावली का विश्लेषण किया गया था।

बिल्डर्स

इंसान

रोगी (10), व्यक्तित्व (5)

आदमी (5)

अच्छा

मदद (8), मदद (7)

बुराई (16)

एक जिंदगी

मृत्यु (10)

प्यारा (5)

मौत

लाश (8)

जीवन (6)

आग

गर्मी (8), जला (6)

आग (7)

उँगलिया

हाथ (14), पैनारिटियम (5)

बड़ा (7), सूचकांक (6)

आंखें

दृष्टि (6), छात्र, नेत्र रोग विशेषज्ञ (5 प्रत्येक)

भूरा (10), बड़ा (6)

सिर

दिमाग (14), दिमाग (5)

बड़ा (9), स्मार्ट (8), स्मार्ट (6)

खोना

चेतना, जीवन (4 प्रत्येक)

पैसा (5), खोजें (4)

यह ध्यान दिया जा सकता है कि बिल्डरों की तुलना में चिकित्सक अधिक बार अपनी व्यावसायिक गतिविधियों से संबंधित संघ देते हैं, क्योंकि प्रश्नावली में दिए गए प्रोत्साहन शब्दों का उनके पेशे से अधिक संबंध बिल्डर के पेशे से है।

किसी भाषा में सांख्यिकीय नियमितताओं का उपयोग आवृत्ति शब्दकोश बनाने के लिए किया जाता है - ऐसे शब्दकोश जो किसी भी भाषा के शब्दों (शब्द रूपों, वाक्यांशों) की आवृत्ति की संख्यात्मक विशेषताएं देते हैं - लेखक की भाषा, कोई कार्य, आदि। आमतौर पर, की घटना की आवृत्ति एक शब्द एक निश्चित मात्रा के पाठ में एक शब्द की घटना की आवृत्ति की विशेषता के रूप में प्रयोग किया जाता है

एक आवश्यक घटक के रूप में एक शब्दकोश के बिना भाषण धारणा का मॉडल असंभव है। भाषण की धारणा में, बुनियादी परिचालन इकाई शब्द है। यह इस प्रकार है, विशेष रूप से, कथित पाठ के प्रत्येक शब्द को श्रोता (या पाठक) की आंतरिक शब्दावली की संबंधित इकाई के साथ पहचाना जाना चाहिए। यह मान लेना स्वाभाविक है कि शुरुआत से ही खोज शब्दकोश के कुछ उप-क्षेत्रों तक ही सीमित है। भाषण धारणा के अधिकांश आधुनिक सिद्धांतों के अनुसार, एक विशिष्ट मामले में ध्वनि पाठ का वास्तविक ध्वन्यात्मक विश्लेषण शब्द की संभावित ध्वन्यात्मक उपस्थिति के बारे में केवल कुछ आंशिक जानकारी प्रदान करता है, और इस तरह की जानकारी एक नहीं, बल्कि एक निश्चित कई शब्दों से मेल खाती है शब्दकोश का; इसलिए, दो समस्याएं उत्पन्न होती हैं:

(ए) कुछ मापदंडों के अनुसार उपयुक्त सेट का चयन करें;

(बी) उल्लिखित सेट की सीमा के भीतर (यदि इसे पर्याप्त रूप से आवंटित किया गया है) सभी शब्दों को "समाप्त" करने के लिए, केवल एक को छोड़कर जो मान्यता प्राप्त पाठ के दिए गए शब्द से सबसे अच्छा मेल खाता है। "ड्रॉपआउट" रणनीतियों में से एक कम आवृत्ति वाले शब्दों को बाहर करना है। यह इस प्रकार है कि भाषण धारणा के लिए शब्दावली एक आवृत्ति शब्दकोश है। यह रूसी भाषा के फ़्रीक्वेंसी डिक्शनरी के कंप्यूटर संस्करण का निर्माण है जो प्रस्तुत परियोजना का प्रारंभिक कार्य है।

रूसी भाषा की सामग्री के आधार पर, 5 आवृत्ति शब्दकोश हैं (शाखा शब्दकोशों की गिनती नहीं)। आइए हम मौजूदा शब्दकोशों की केवल कुछ सामान्य कमियों पर ध्यान दें।

रूसी भाषा के सभी ज्ञात आवृत्ति शब्दकोश लिखित (मुद्रित) ग्रंथों के प्रसंस्करण सरणियों पर आधारित हैं। आंशिक रूप से इस कारण से, जब किसी शब्द की पहचान काफी हद तक औपचारिक, ग्राफिक संयोग पर आधारित होती है, तो शब्दार्थ को पर्याप्त रूप से ध्यान में नहीं रखा जाता है। नतीजतन, आवृत्ति विशेषताओं को भी स्थानांतरित, विकृत किया जाता है; उदाहरण के लिए, यदि फ़्रीक्वेंसी डिक्शनरी के कंपाइलर में "मित्र" शब्द के उपयोग के सामान्य आंकड़ों में "एक दूसरे" के संयोजन से शब्द शामिल हैं, तो यह शायद ही उचित है: शब्दार्थ को देखते हुए, हमें यह स्वीकार करना चाहिए कि ये पहले से ही हैं अलग-अलग शब्द, या यों कहें कि एक स्वतंत्र शब्दकोश इकाई समग्र रूप से सिर्फ संयोजन है।

इसके अलावा, सभी मौजूदा शब्दकोशों में, शब्दों को केवल उनके मूल रूपों में रखा जाता है: एकवचन रूप में संज्ञाएं, नाममात्र का मामला, क्रियात्मक रूप में क्रिया, आदि। कुछ शब्दकोश शब्द रूपों की आवृत्ति के बारे में जानकारी प्रदान करते हैं, लेकिन आमतौर पर वे इसे लगातार पर्याप्त रूप से नहीं करते हैं, संपूर्ण तरीके से नहीं। एक ही शब्द के विभिन्न शब्द रूपों की आवृत्तियाँ स्पष्ट रूप से मेल नहीं खातीं। वाक् धारणा मॉडल के विकासकर्ता को इस बात का ध्यान रखना चाहिए कि वास्तव में अवधारणात्मक प्रक्रियायह एक विशिष्ट शब्द रूप है जो पाठ में "डूबे हुए" है जो मान्यता के अधीन है: शब्द रूप के घातांक के प्रारंभिक खंड के विश्लेषण के आधार पर, एक समान शुरुआत वाले शब्दों का एक सेट बनता है, और प्रारंभिक शब्द रूप का खंड आवश्यक रूप से शब्दकोष के प्रारंभिक खंड के समान नहीं है। यह शब्द रूप है जिसमें एक विशिष्ट लयबद्ध संरचना होती है, जो शब्दों के अवधारणात्मक चयन के लिए एक अत्यंत महत्वपूर्ण पैरामीटर भी है। अंत में, मान्यता प्राप्त उच्चारण के अंतिम प्रतिनिधित्व में, शब्दों को संबंधित शब्द रूपों द्वारा फिर से दर्शाया जाता है।

ऐसे कई कार्य हैं जो वाक् बोध की प्रक्रिया में आवृत्ति के महत्व को प्रदर्शित करते हैं। लेकिन हम उन कार्यों से अवगत नहीं हैं जहां शब्द रूपों की आवृत्ति का उपयोग किया जाएगा - इसके विपरीत, सभी लेखक व्यावहारिक रूप से व्यक्तिगत शब्द रूपों की आवृत्ति को अनदेखा करते हैं, विशेष रूप से लेक्सेम का जिक्र करते हैं। यदि उनके द्वारा प्राप्त परिणामों को कलाकृतियों के रूप में नहीं माना जाता है, तो किसी को यह मानना ​​​​होगा कि मूल वक्ता के पास शब्द रूपों और शब्दकोश रूपों की आवृत्तियों के अनुपात के बारे में जानकारी तक पहुंच है, अर्थात, वास्तव में, लेक्सेम। इसके अलावा, एक शब्द रूप से एक शब्द के रूप में इस तरह के संक्रमण, निश्चित रूप से, संबंधित प्रतिमान के प्राकृतिक ज्ञान द्वारा समझाया नहीं जा सकता है, क्योंकि आवृत्ति जानकारी का उपयोग शब्द की अंतिम पहचान से पहले किया जाना चाहिए, अन्यथा यह बस अपना अर्थ खो देता है।

प्राथमिक सांख्यिकीय विशेषताओं के अनुसार, किसी दिए गए के साथ निर्धारित करना संभव है रिश्तेदारों की गलतीशब्दावली का वह भाग, जिसमें पाठ के प्रकार की परवाह किए बिना, घटना की उच्च आवृत्ति वाले शब्द शामिल हैं। यह भी संभव है, शब्दकोश में चरणबद्ध क्रम शुरू करके, पहले 100, 1000, 5000, आदि को कवर करने वाले शब्दकोशों की एक श्रृंखला प्राप्त करना। शब्दकोश की सांख्यिकीय विशेषताएं शब्दावली के शब्दार्थ विश्लेषण के संबंध में रुचि रखती हैं। विषय-वैचारिक समूहों और शब्दार्थ क्षेत्रों के अध्ययन से पता चलता है कि शाब्दिक संघों को अर्थ संबंधी लिंक द्वारा समर्थित किया जाता है जो कि सबसे सामान्य अर्थ के साथ लेक्सेम के आसपास केंद्रित होते हैं। लेक्सिको-सिमेंटिक क्षेत्र के भीतर अर्थों का वर्णन अर्थ में सबसे अमूर्त लेक्सेम वाले शब्दों की पहचान करके किया जा सकता है। जाहिर है, "खाली" (नाममात्र शक्तियों के दृष्टिकोण से) शब्दकोश इकाइयां सांख्यिकीय रूप से सजातीय परत का गठन करती हैं।

व्यक्तिगत शैलियों की शब्दावली कम मूल्यवान नहीं हैं। उनकी समानता के माप और सांख्यिकीय वितरण की प्रकृति का अध्ययन भाषण उपयोग के क्षेत्र के आधार पर शब्दावली के गुणात्मक स्तरीकरण के बारे में दिलचस्प जानकारी प्रदान करेगा।

बड़ी आवृत्ति वाले शब्दकोशों के संकलन के लिए कंप्यूटर प्रौद्योगिकी के उपयोग की आवश्यकता होती है। एक शब्दकोश पर काम करने की प्रक्रिया में आंशिक मशीनीकरण और स्वचालन का परिचय विभिन्न ग्रंथों के लिए शब्दकोशों के मशीन प्रसंस्करण में एक प्रयोग के रूप में रुचि का है। इस तरह के शब्दकोश को शब्दावली सामग्री के प्रसंस्करण और संचय के लिए अधिक कठोर प्रणाली की आवश्यकता होती है। लघु में, यह एक सूचना पुनर्प्राप्ति प्रणाली है जो पाठ और शब्दावली के विभिन्न पहलुओं के बारे में जानकारी प्रदान करने में सक्षम है। इस प्रणाली के लिए कुछ बुनियादी अनुरोधों की शुरुआत से ही योजना बनाई गई है: सूची शब्दों की कुल संख्या, एक व्यक्तिगत शब्द की सांख्यिकीय विशेषताएं और संपूर्ण शब्दकोश, शब्दकोश के लगातार और दुर्लभ क्षेत्रों का क्रम आदि। मशीन कार्ड फ़ाइल आपको अनुमति देती है अलग-अलग शैलियों और स्रोतों के लिए स्वचालित रूप से रिवर्स डिक्शनरी बनाएं। भाषा के बारे में कई अन्य उपयोगी सांख्यिकीय जानकारी संचित जानकारी से निकाली जाएगी। कंप्यूटर फ़्रीक्वेंसी डिक्शनरी शब्दावली कार्य के अधिक व्यापक स्वचालन के लिए संक्रमण के लिए एक प्रयोगात्मक आधार बनाता है।

आवृत्ति शब्दकोशों के सांख्यिकीय डेटा का उपयोग अन्य भाषाई समस्याओं को हल करने में भी व्यापक रूप से किया जा सकता है - उदाहरण के लिए, आधुनिक रूसी भाषा के शब्द निर्माण के सक्रिय साधनों का विश्लेषण और निर्धारण, ग्राफिक्स और वर्तनी में सुधार के मुद्दों को हल करना, जो लेने से संबंधित हैं। शब्दावली के बारे में सांख्यिकीय जानकारी (इस सब के साथ, ग्रेफेम संयोजनों की संभाव्य विशेषताओं, शब्दों में महसूस किए गए अक्षर संयोजनों के प्रकार), व्यावहारिक प्रतिलेखन और लिप्यंतरण को ध्यान में रखना महत्वपूर्ण है। शब्दकोश के सांख्यिकीय पैरामीटर स्वचालित टाइपिंग, पहचान और शाब्दिक पाठ के स्वचालित पढ़ने की समस्याओं को हल करने में भी उपयोगी होंगे।

रूसी भाषा के आधुनिक व्याख्यात्मक शब्दकोश और व्याकरण मुख्य रूप से साहित्यिक और कलात्मक ग्रंथों के आधार पर बनाए गए हैं। ए.एस. की भाषा के आवृत्ति शब्दकोश हैं। पुश्किन, ए.एस. ग्रिबेडोवा, एफ.एम. दोस्तोवस्की, वी.वी. वायसोस्की और कई अन्य लेखक। स्मोलेंस्क राज्य के साहित्य के इतिहास और सिद्धांत विभाग में। शैक्षणिक विश्वविद्यालयकई वर्षों से, काव्य और गद्य ग्रंथों के आवृत्ति शब्दकोशों को संकलित करने का काम किया गया है। इस अध्ययन के लिए, पुश्किन के सभी गीतों के आवृत्ति शब्दकोश और स्वर्ण युग के दो और कवि - ग्रिबॉयडोव द्वारा "विट फ्रॉम विट" और लेर्मोंटोव की सभी कविताओं का चयन किया गया था; पास्टर्नक और रजत युग के पांच अन्य कवि - बालमोंट 1894-1903, ब्लोक द्वारा "सुंदर महिला के बारे में कविता", मैंडेलस्टम द्वारा "स्टोन", गुमिलोव द्वारा "पिलर ऑफ फायर", अखमतोवा द्वारा "एनो डोमिनी एमसीएमएक्सएक्सआई" और "सिस्टर्स ऑफ द सिस्टर्स ऑफ द ब्यूटीफुल लेडी"। पास्टर्नक द्वारा माई लाइफ" और लौह युग के चार और कवि - "यूरी ज़ीवागो की कविताएं", "व्हेन इट क्लीयर अप", एम. पेट्रोव्स के गीतों का संपूर्ण संग्रह, "द रोड इज़ फ़ार दूर", "विंडस्क्रीन", मेज़िरोव द्वारा "फेयरवेल टू द स्नो" और "हॉर्सशूज़", वोज़्नेसेंस्की द्वारा "एंटीमिरोव" और "स्नोबॉल्स » रिलेंकोवा।

यह ध्यान दिया जाना चाहिए कि ये शब्दकोश प्रकृति में भिन्न हैं: कुछ एक नाटकीय काम की शब्दावली का प्रतिनिधित्व करते हैं, अन्य - गीत की किताबें, या कई किताबें, या कवि की कविताओं का पूरा संग्रह। इस पत्र में प्रस्तुत विश्लेषण के परिणामों को सावधानी से लिया जाना चाहिए, उन्हें निरपेक्ष नहीं माना जा सकता है। वहीं, विशेष उपायों की मदद से ग्रंथों की ओण्टोलॉजिकल प्रकृति में अंतर को कुछ हद तक कम किया जा सकता है।

हाल के वर्षों में, बोलचाल और . के बीच विरोध पुस्तक भाषण. इस मुद्दे पर विशेष रूप से पद्धतिविदों के बीच गरमागरम बहस होती है, जो शिक्षण में एक मोड़ की मांग करते हैं बोली जाने वाली भाषा. इसी समय, बोलचाल की भाषा की विशिष्टता अभी भी अस्पष्ट है।

EXCEL97 कार्यालय कार्यक्रम के वातावरण में एक उपयोगकर्ता एप्लिकेशन बनाकर शब्दकोशों को संसाधित किया गया था। एप्लिकेशन में एक्सेल बुक के चार वर्कशीट शामिल हैं - "टाइटल शीट", "डिक्शनरी" शीट प्रारंभिक डेटा के साथ, "निकटता" और "दूरी" परिणामों के साथ, साथ ही मैक्रोज़ का एक सेट।

प्रारंभिक जानकारी "शब्दकोश" शीट पर दर्ज की गई है। अध्ययन किए गए ग्रंथों के शब्दकोश एक्सेल कोशिकाओं में लिखे गए हैं, अंतिम कॉलम एस प्राप्त परिणामों से बनता है और अन्य शब्दकोशों में पाए जाने वाले शब्दों की संख्या के बराबर है। टेबल "निकटता" और "दूरी" में निकटता एम, सहसंबंध आर और दूरी डी के परिकलित उपाय शामिल हैं।

एप्लिकेशन मैक्रोज़ इवेंट-आधारित प्रोग्रामिंग प्रक्रियाएं हैं जो विजुअल बेसिक फॉर एप्लिकेशन (वीबीए) में लिखी गई हैं। प्रक्रियाएं वीबीए पुस्तकालय वस्तुओं और उनके प्रसंस्करण विधियों पर आधारित हैं। तो, आवेदन की वर्कशीट के साथ संचालन के लिए, मुख्य वस्तु वर्कशीट (वर्कशीट) और शीट को सक्रिय करने की संबंधित विधि सक्रिय करें (सक्रिय करें) का उपयोग किया जाता है। डिक्शनरी शीट पर विश्लेषण किए गए स्रोत डेटा की सीमा निर्धारित करना रेंज ऑब्जेक्ट (रेंज) की चयन विधि द्वारा किया जाता है, और शब्दों को चर के मूल्यों के रूप में उसी श्रेणी के मूल्य संपत्ति (मूल्य) के रूप में किया जाता है। वस्तु।

इस तथ्य के बावजूद कि रैंकिंग सहसंबंध विश्लेषणहमें विभिन्न ग्रंथों के बीच विषयों की निर्भरता के बारे में सतर्क करता है, प्रत्येक पाठ के सबसे अधिक बार आने वाले शब्दों में एक या अधिक अन्य ग्रंथों में पत्राचार होता है। कॉलम एस प्रत्येक लेखक के लिए 15 सबसे लगातार शब्दों में से ऐसे शब्दों की संख्या को दर्शाता है। बोल्ड टाइप में शब्द हमारी तालिका में केवल एक कवि के शब्दों में दिखाई देते हैं। ब्लोक, अखमतोवा और पेट्रोव्स के पास कोई हाइलाइट किए गए शब्द नहीं हैं, उनके पास एस = 15 है। इन तीन कवियों में समान 15 शब्द हैं, वे केवल सूची में स्थान पर भिन्न हैं। लेकिन यहां तक ​​​​कि पुश्किन, जिनकी शब्दावली सबसे मूल है, में एस = 8 है, और 7 हाइलाइट किए गए शब्द हैं।

परिणाम बताते हैं कि शब्दावली की एक निश्चित परत है जो कविता के मुख्य विषयों को केंद्रित करती है। एक नियम के रूप में, ये शब्द संक्षिप्त हैं: एक-अक्षर 88, दो-अक्षर 127, तीन-अक्षर 10 के शब्द उपयोगों की कुल संख्या (225) में से। अक्सर ये शब्द मुख्य पौराणिक कथाओं का प्रतिनिधित्व करते हैं और जोड़े में गिर सकते हैं: रात - दिन, पृथ्वी - आकाश (सूर्य), ईश्वर - मनुष्य (लोग), जीवन - मृत्यु, शरीर - आत्मा, रोम - संसार(मैंडेलस्टम में); एक उच्च स्तर के पौराणिक कथाओं में जोड़ा जा सकता है: आकाश, तारा, सूर्य, पृथ्वी; एक व्यक्ति में, एक नियम के रूप में, शरीर, हृदय, रक्त, हाथ, पैर, गाल, आंखें बाहर खड़ी होती हैं. से मानव राज्यसोने और प्यार को प्राथमिकता दी जाती है। घर और शहर मानव जगत के हैं - मास्को, रोम, पेरिस। रचनात्मकता को लेक्समेस द्वारा दर्शाया जाता है शब्दऔर गाना.

ग्रिबेडोव और लेर्मोंटोव के पास प्रकृति को निरूपित करने वाले लगभग कोई शब्द नहीं हैं। उनके पास किसी व्यक्ति, उसके शरीर के अंगों, उसकी आध्यात्मिक दुनिया के तत्वों को दर्शाते हुए तीन गुना अधिक शब्द हैं। पुश्किन और बीसवीं सदी के कवि। मनुष्य और प्रकृति के पदनाम लगभग समान हैं। उस में महत्वपूर्ण पहलूविषय, हम कह सकते हैं, बीसवीं सदी। पुश्किन का अनुसरण किया।

न्यूनतम थीम मामलासबसे लगातार शब्दों में, यह केवल ग्रिबॉयडोव और पुश्किन में पाया जाता है। लेर्मोंटोव और बीसवीं सदी के कवि। यह एक न्यूनतम विषय के लिए रास्ता देता है शब्द. शब्द कर्मों को बाहर नहीं करता है (विषय की बाइबिल व्याख्या: नए नियम में, यीशु मसीह की सभी शिक्षाओं को ईश्वर के शब्द या यीशु के शब्द के रूप में माना जाता है, और प्रेरित कभी-कभी खुद को शब्द के मंत्री कहते हैं)। लेक्समे शब्द का पवित्र अर्थ स्पष्ट रूप से प्रकट होता है, उदाहरण के लिए, पास्टर्नक की कविता में "और दुनिया की छवि, शब्द में प्रकट हुई।" लेक्समे का पवित्र अर्थ शब्दमानव मामलों के साथ संयोजन और इसके विपरीत, यह गुमिलोव द्वारा उसी नाम की कविता में स्पष्ट रूप से प्रकट होता है।

केवल एक पाठ में पाए जाने वाले टोकन किसी दी गई पुस्तक या पुस्तकों के संग्रह की मौलिकता को दर्शाते हैं। उदाहरण के लिए, ग्रिबेडोव की कॉमेडी "वो फ्रॉम विट" में "माइंड" शब्द सबसे अधिक बार होता है - लेकिन यह अन्य ग्रंथों के आवृत्ति शब्दों के बीच नहीं होता है। मन का विषय हास्य में अब तक का सबसे महत्वपूर्ण विषय है। यह लेक्समे चैट्स्की की छवि के साथ है, और चैट्स्की का नाम कॉमेडी में सबसे अधिक बार होता है। इस प्रकार, काम व्यवस्थित रूप से सबसे लगातार सामान्य संज्ञा को सबसे लगातार उचित नाम के साथ जोड़ता है।

उच्चतम सहसंबंध गुणांक गुमीलोव द्वारा दुखद पुस्तकों "द पिलर ऑफ फायर" और अखमतोवा द्वारा "एनो डोमिनी एमसीएमएक्सएक्सआई" के विषयों को जोड़ता है। 15 सबसे लगातार संज्ञाओं में, रक्त, हृदय, आत्मा, प्रेम, शब्द, आकाश सहित 10 सामान्य संज्ञाएं हैं। स्मरण करो कि अखमतोवा की पुस्तक में एक लघु "तुम जीवित नहीं रहोगे ..." शामिल है, जो गुमीलोव की गिरफ्तारी और उसके निष्पादन के बीच लिखा गया है।

अध्ययन सामग्री में मोमबत्ती और भीड़ के विषय केवल "यूरी ज़ीवागो की कविताओं" में पाए जाते हैं। उपन्यास के छंदों में मोमबत्ती के विषय के कई प्रासंगिक अर्थ हैं: यह विश्वास, अमरता, रचनात्मकता, प्रेम तिथि के विषयों के साथ यीशु मसीह की छवि से जुड़ा है। मोमबत्ती उपन्यास के केंद्रीय दृश्यों में प्रकाश का सबसे महत्वपूर्ण स्रोत है। भीड़ का विषय उपन्यास के मुख्य विचार के संबंध में विकसित होता है, जिसमें एक व्यक्ति का निजी जीवन अपने अडिग मूल्यों के साथ भीड़ को प्रसन्न करने के सिद्धांतों पर निर्मित नए राज्य की अनैतिकता का विरोध करता है। .

कार्य में तीसरा चरण भी शामिल है, जो कार्यक्रम में भी परिलक्षित होता है, - यह दो शब्दकोशों के लिए सामान्य शब्दों की क्रमिक संख्याओं में अंतर और दो शब्दकोशों के समान शब्दों के बीच की औसत दूरी की गणना है। यह चरण अनुमति देता है सामान्य रुझानआँकड़ों की मदद से पहचाने गए शब्दकोशों की बातचीत, पाठ के करीब एक स्तर तक ले जाएँ। उदाहरण के लिए, गुमीलोव और अखमतोवा की पुस्तकें सांख्यिकीय रूप से महत्वपूर्ण रूप से सहसंबंधित हैं। हम देखते हैं कि उनके शब्दकोशों के लिए कौन से शब्द सामान्य निकले, और सबसे पहले, हम उन लोगों को चुनते हैं जिनकी क्रम संख्या न्यूनतम या शून्य के बराबर होती है। ये ऐसे शब्द हैं जिनकी रैंक संख्या समान है और, परिणामस्वरूप, दो कवियों के दिमाग में ये न्यूनतम विषय हैं जो समान रूप से महत्वपूर्ण हैं। इसके बाद, आपको टेक्स्ट और संदर्भों के स्तर पर जाना चाहिए।

मात्रात्मक तरीके भी लोगों की विशेषताओं का अध्ययन करने में मदद करते हैं - देशी वक्ताओं। कहते हैं, रूसी में 6 मामले हैं, अंग्रेजी में कोई मामले नहीं हैं, और दागिस्तान के लोगों की कुछ भाषाओं में, मामलों की संख्या 40 तक पहुंच जाती है। एल। पेर्लोवस्की ने अपने लेख "चेतना, भाषा और संस्कृति" में इनसे संबंधित है लोगों की व्यक्तिवाद या सामूहिकता की प्रवृत्ति के साथ विशेषताएँ, चीजों और घटनाओं की अलग-अलग धारणा के साथ या दूसरों के संबंध में। आखिरकार, यह अंग्रेजी बोलने वाली दुनिया में था (कोई मामला नहीं है - यह बात "स्वयं से" मानी जाती है) कि व्यक्तिगत स्वतंत्रता, उदारवाद और लोकतंत्र जैसी अवधारणाएं दिखाई दीं (मैं ध्यान देता हूं कि मैं इन अवधारणाओं का उपयोग केवल के संबंध में करता हूं भाषा, बिना किसी के मूल्यांकन विशेषता) इस तथ्य के बावजूद कि इस तरह के अनुमान अभी भी केवल बोल्ड वैज्ञानिक परिकल्पनाओं के स्तर पर हैं, वे पहले से ही परिचित घटनाओं को नए तरीके से देखने में मदद करते हैं।

जैसा कि हम देख सकते हैं, भाषाविज्ञान के पूरी तरह से अलग-अलग क्षेत्रों में मात्रात्मक विशेषताओं को लागू किया जा सकता है, जो "सटीक" और "मानवीय" तरीकों के बीच की सीमाओं को तेजी से धुंधला करता है। भाषाविज्ञान अपनी समस्याओं को हल करने के लिए न केवल गणित, बल्कि कंप्यूटर प्रौद्योगिकी की मदद का भी तेजी से सहारा ले रहा है।

2.3 सीखना Iऔपचारिक तर्क के तरीकों से भाषा

गणित के गैर-मात्रात्मक तरीकों के साथ, विशेष रूप से, तर्क के साथ, आधुनिक सैद्धांतिक भाषाविज्ञान मात्रात्मक लोगों की तुलना में कम उपयोगी नहीं है। कंप्यूटर प्रौद्योगिकियों के तेजी से विकास और आधुनिक दुनिया में उनकी भूमिका के विकास के लिए सामान्य रूप से भाषा और तर्क की बातचीत के दृष्टिकोण में संशोधन की आवश्यकता है।

औपचारिक भाषाओं के विकास में तर्क के तरीकों का व्यापक रूप से उपयोग किया जाता है, विशेष रूप से, प्रोग्रामिंग भाषाएं, जिनमें से तत्व कुछ प्रतीक हैं (गणित के समान), चुने गए (या पहले से चयनित प्रतीकों से निर्मित) और एक निश्चित तरीके से संबंधित, संबंधित अन्य संदर्भों में समान प्रतीकों के किसी भी "पारंपरिक" उपयोग, समझ और समझ के कार्यों के लिए। एक प्रोग्रामर लगातार अपने काम में तर्क से निपटता है। प्रोग्रामिंग का उद्देश्य कंप्यूटर को तर्क करना सिखाना है (में .) वृहद मायने मेंशब्द)। उसी समय, "तर्क" के तरीके बहुत अलग हो जाते हैं। हर प्रोग्रामर खर्च करता है कुछ समयअपने स्वयं के और अन्य लोगों के कार्यक्रमों में त्रुटियों को खोजने के लिए। यानी रीजनिंग में, लॉजिक में त्रुटियों की खोज करना। और यही अपनी छाप छोड़ता है। सामान्य भाषण में तार्किक त्रुटियों का पता लगाना बहुत आसान है। तर्कशास्त्रियों द्वारा अध्ययन की जाने वाली भाषाओं की सापेक्ष सादगी उन्हें इन भाषाओं की संरचनाओं को अधिक स्पष्ट रूप से स्पष्ट करने की अनुमति देती है, जो विशेष रूप से जटिल प्राकृतिक भाषाओं का विश्लेषण करने वाले भाषाविदों द्वारा प्राप्त की जा सकती है। इस तथ्य को ध्यान में रखते हुए कि तर्कशास्त्रियों द्वारा अध्ययन की जाने वाली भाषाएँ प्राकृतिक भाषाओं से कॉपी किए गए संबंधों का उपयोग करती हैं, तर्कशास्त्री भाषा के सामान्य सिद्धांत में महत्वपूर्ण योगदान देने में सक्षम हैं। यहां स्थिति वैसी ही है जैसी भौतिकी में होती है: भौतिक विज्ञानी आदर्श रूप से सरलीकृत मामलों के लिए प्रमेय भी तैयार करता है जो प्रकृति में बिल्कुल नहीं होते हैं - वह आदर्श गैसों, आदर्श तरल पदार्थों के लिए कानून बनाता है, घर्षण की अनुपस्थिति में गति के बारे में बात करता है, आदि। इन आदर्श मामलों के लिए, सरल कानून स्थापित किए जा सकते हैं जो यह समझने में बहुत योगदान देंगे कि वास्तव में क्या होता है और क्या भौतिकी के लिए शायद अज्ञात रहेगा यदि यह वास्तविकता पर सीधे विचार करने की कोशिश करता है, इसकी सभी जटिलताओं में।

प्राकृतिक भाषाओं के अध्ययन में, तार्किक विधियों का उपयोग किया जाता है ताकि भाषा सीखने वाले मूर्खता से अधिक से अधिक शब्दों को "याद" न कर सकें, लेकिन इसकी संरचना को बेहतर ढंग से समझ सकें। एल। शचेरबा ने अपने व्याख्यानों में रूसी भाषा के नियमों के अनुसार निर्मित एक वाक्य का एक उदाहरण भी इस्तेमाल किया: "गड़बड़ कुजद्र श्तेको ने बोकरा को बोकर और बोकरा को कर्ल किया," और फिर छात्रों से पूछा कि इसका क्या मतलब है। इस तथ्य के बावजूद कि वाक्य में शब्दों का अर्थ अस्पष्ट रहा (वे बस रूसी में मौजूद नहीं हैं), स्पष्ट रूप से उत्तर देना संभव था: "कुजद्र" विषय है, एक स्त्री संज्ञा, एकवचन, नाममात्र मामले में, " bokr" एनिमेटेड है, और आदि। मुहावरे का अनुवाद कुछ इस तरह निकलता है: "एक कदम में कुछ स्त्रैण ने किसी प्राणी पर कुछ किया पुरुष, और फिर अपने शावक के साथ धीरे-धीरे कुछ लंबा करना शुरू किया। गैर-मौजूद शब्दों से एक पाठ (कलात्मक) का एक समान उदाहरण, पूरी तरह से भाषा के नियमों के अनुसार बनाया गया है, लुईस कैरोल का जैबरवॉक (एलिस इन वंडरलैंड, कैरोल में, अपने चरित्र हम्प्टी डम्प्टी के मुंह के माध्यम से, का अर्थ बताता है) उन्होंने जिन शब्दों का आविष्कार किया: "पकाया" - शाम के आठ बजे, जब रात का खाना पकाने का समय होता है, "चलिवकी" - मटमैला और निपुण, "शोरक" - एक फेर्रेट, एक बेजर और एक कॉर्कस्क्रू के बीच एक क्रॉस, "गोताखोरी" " - कूदो, गोता लगाओ, स्पिन करो, "नवा" - धूपघड़ी के नीचे घास (थोड़ा दाईं ओर फैली हुई है, थोड़ा बाईं ओर और थोड़ी पीछे), "ग्रंट" - ग्रन्ट और हंसी, "ज़ेलुक" - ए हरी टर्की, "मायुमज़िक" - एक पक्षी; उसके पंख उखड़े हुए हैं और झाड़ू की तरह सभी दिशाओं में चिपके हुए हैं, "मोवा" - घर से दूर) ।

आधुनिक तर्क और सैद्धांतिक भाषाविज्ञान की मुख्य अवधारणाओं में से एक, विभिन्न तार्किक-गणितीय कलन, प्राकृतिक भाषाओं की भाषाओं के अध्ययन में उपयोग किया जाता है, विभिन्न "स्तरों" की भाषाओं के बीच संबंधों का वर्णन करने के लिए और के बीच संबंधों को चिह्नित करने के लिए विचाराधीन भाषाएँ और उनकी सहायता से वर्णित विषय क्षेत्र, धातुभाषा की अवधारणा है। एक धातुभाषा एक ऐसी भाषा है जिसका उपयोग किसी अन्य भाषा, भाषा-वस्तु के बारे में निर्णय व्यक्त करने के लिए किया जाता है। धातुभाषा की सहायता से वे भाषा-वस्तु के वर्ण संयोजनों (अभिव्यक्तियों) की संरचना का अध्ययन करते हैं, इसके अभिव्यंजक गुणों के बारे में प्रमेयों को सिद्ध करते हैं, अन्य भाषाओं से इसके संबंध के बारे में आदि। जिस भाषा का अध्ययन किया जा रहा है उसे विषय भाषा भी कहा जाता है। इस धातुभाषा के संबंध में। विषय भाषा और धातुभाषा दोनों सामान्य (प्राकृतिक) भाषाएं हो सकती हैं। धातुभाषा वस्तु भाषा से भिन्न हो सकती है (उदाहरण के लिए, रूसियों के लिए एक अंग्रेजी पाठ्यपुस्तक में, रूसी धातुभाषा है, और अंग्रेजी वस्तु भाषा है), लेकिन यह इसके साथ मेल खा सकती है या केवल आंशिक रूप से भिन्न हो सकती है, उदाहरण के लिए, विशेष शब्दावली में (रूसी भाषाई शब्दावली रूसी भाषा का वर्णन करने के लिए धातुभाषा का एक तत्व है, तथाकथित शब्दार्थ कारक प्राकृतिक भाषाओं के शब्दार्थ का वर्णन करने के लिए धातुभाषा का हिस्सा हैं)।

गणितीय तर्क के ढांचे के भीतर निर्मित औपचारिक भाषाओं के अध्ययन के संबंध में "धातुभाषा" की अवधारणा बहुत उपयोगी हो गई है। औपचारिक विषय भाषाओं के विपरीत, इस मामले में धातुभाषा, जिसके माध्यम से रूपक तैयार किया जाता है (विषय भाषा में तैयार किए गए विषय सिद्धांत के गुणों का अध्ययन), एक नियम के रूप में, एक सामान्य प्राकृतिक भाषा है, कुछ विशेष तरीके से एक प्राकृतिक भाषा का सीमित टुकड़ा जिसमें किसी भी प्रकार की अस्पष्टता नहीं होती है। , रूपक, "आध्यात्मिक" अवधारणाएं, आदि सामान्य भाषा के तत्व जो सटीक वैज्ञानिक अनुसंधान के लिए एक उपकरण के रूप में इसके उपयोग को रोकते हैं। उसी समय, धातुभाषा को औपचारिक रूप दिया जा सकता है और (इसकी परवाह किए बिना) मेटामेटालंगुज के माध्यम से किए गए शोध का विषय बन जाता है, और इस तरह की श्रृंखला को अनिश्चित काल तक बढ़ने के रूप में "सोचा" जा सकता है।

तर्क हमें भाषा-वस्तु और धातुभाषा के बीच एक उपयोगी भेद सिखाता है। भाषा-वस्तु तार्किक शोध का विषय है, और धातुभाषा वह अनिवार्य रूप से कृत्रिम भाषा है जिसमें ऐसा शोध किया जाता है। तार्किक सोच में केवल प्रतीकों (धातुभाषा) की भाषा में एक वास्तविक भाषा (वस्तु भाषा) के संबंध और संरचना तैयार करना शामिल है।

किसी भी मामले में धातुभाषा अपनी वस्तुनिष्ठ भाषा की तुलना में "गरीब नहीं" होनी चाहिए (अर्थात, धातुभाषा में बाद की प्रत्येक अभिव्यक्ति के लिए उसका नाम, "अनुवाद" होना चाहिए) - अन्यथा, यदि ये आवश्यकताएं पूरी नहीं होती हैं (जो निश्चित रूप से प्राकृतिक भाषाओं में होता है, यदि विशेष समझौते अन्यथा प्रदान नहीं करते हैं) शब्दार्थ विरोधाभास (एंटीनोमी) उत्पन्न होते हैं।

जैसे-जैसे अधिक से अधिक नई प्रोग्रामिंग भाषाएँ बनाई गईं, प्रोग्रामिंग अनुवादकों की समस्या के संबंध में, धातुभाषाएँ बनाने की तत्काल आवश्यकता थी। वर्तमान में, बैकस-नौर रूप धातुभाषा (बीएनएफ के रूप में संक्षिप्त) प्रोग्रामिंग भाषाओं के सिंटैक्स का वर्णन करने के लिए सबसे अधिक उपयोग किया जाता है। यह गणितीय सूत्रों के समान कुछ सूत्रों के रूप में एक संक्षिप्त रूप है। भाषा की प्रत्येक अवधारणा के लिए एक अद्वितीय रूपक (सामान्य सूत्र) होता है। इसमें बाएँ और दाएँ भाग होते हैं। बाईं ओर परिभाषित की जा रही अवधारणा को निर्दिष्ट करता है, और दाईं ओर स्वीकार्य भाषा निर्माणों के सेट को निर्दिष्ट करता है जो इस अवधारणा में संयुक्त हैं। सूत्र कोण कोष्ठक के रूप में विशेष रूपक का उपयोग करता है, जिसमें परिभाषित अवधारणा (सूत्र के बाईं ओर) या पहले से परिभाषित अवधारणा (इसके दाईं ओर) होती है, और बाएं और दाएं भागों के पृथक्करण को इंगित किया जाता है "::=" मेटाएक्टेक्टर, जिसका अर्थ "परिभाषा के अनुसार है" शब्दों के बराबर है। धातुभाषाई सूत्र किसी न किसी रूप में अनुवादकों में अंतर्निहित हैं; उनकी मदद से, प्रोग्रामर द्वारा उपयोग किए जाने वाले निर्माणों को किसी भी ऐसे निर्माण के औपचारिक अनुपालन के लिए जाँचा जाता है जो इस भाषा में वाक्यात्मक रूप से मान्य हैं। विभिन्न विज्ञानों की अलग-अलग धातुभाषाएँ भी हैं - इस प्रकार, ज्ञान विभिन्न धातुभाषाओं के रूप में मौजूद है।

तार्किक तरीकों ने भी कनेक्शनवाद की अवधारणा के आधार पर कृत्रिम बुद्धि प्रणालियों के निर्माण के आधार के रूप में कार्य किया। कनेक्शनवाद एक विशेष प्रवृत्ति है दार्शनिक विज्ञान, जिसका विषय ज्ञान के प्रश्न हैं। इस प्रवृत्ति के ढांचे के भीतर, कृत्रिम तंत्रिका नेटवर्क का उपयोग करने वाले व्यक्ति की बौद्धिक क्षमताओं को समझाने का प्रयास किया जा रहा है। न्यूरॉन्स के समान बड़ी संख्या में संरचनात्मक इकाइयों से बना, प्रत्येक तत्व को दिए गए वजन के साथ जो अन्य तत्वों के साथ संबंध की ताकत निर्धारित करता है, तंत्रिका नेटवर्क मानव मस्तिष्क के सरलीकृत मॉडल हैं। इस तरह के तंत्रिका नेटवर्क के साथ प्रयोगों ने पैटर्न की पहचान, पढ़ने और सरल व्याकरणिक संरचनाओं की पहचान करने जैसे कार्यों को करने के लिए सीखने की उनकी क्षमता का प्रदर्शन किया है।

दार्शनिकों ने संबंधवाद में रुचि लेना शुरू कर दिया, क्योंकि कनेक्शनवादी दृष्टिकोण ने मन के शास्त्रीय सिद्धांत और इस सिद्धांत के भीतर व्यापक रूप से आयोजित विचार का विकल्प प्रदान करने का वादा किया था कि दिमाग की कार्यप्रणाली एक डिजिटल द्वारा प्रतीकात्मक भाषा के प्रसंस्करण के समान है। कंप्यूटर। यह अवधारणा बहुत विवादास्पद है, लेकिन हाल के वर्षों में इसे अधिक से अधिक समर्थक मिले हैं।

भाषा का तार्किक अध्ययन एक प्रणाली के रूप में भाषा की सॉसर की अवधारणा को जारी रखता है। तथ्य यह है कि यह लगातार जारी है पिछली शताब्दी की शुरुआत के वैज्ञानिक अनुमानों की एक बार फिर पुष्टि करता है। मैं आज भाषाविज्ञान में गणितीय विधियों के विकास की संभावनाओं के लिए अपने काम का अंतिम भाग समर्पित करूंगा।

2.4 भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग की संभावनाएँ

कंप्यूटर प्रौद्योगिकी के युग में, गणितीय भाषाविज्ञान के तरीकों को एक नया विकास परिप्रेक्ष्य प्राप्त हुआ है। भाषाई विश्लेषण की समस्याओं के समाधान की खोज अब सूचना प्रणाली के स्तर पर तेजी से लागू की जा रही है। उसी समय, भाषाई सामग्री के प्रसंस्करण की प्रक्रिया का स्वचालन, शोधकर्ता को महत्वपूर्ण अवसर और लाभ प्रदान करना, अनिवार्य रूप से उसके लिए नई आवश्यकताओं और कार्यों को सामने रखता है।

"सटीक" और "मानवीय" ज्ञान का संयोजन भाषा विज्ञान, कंप्यूटर विज्ञान और दर्शन के क्षेत्र में नई खोजों के लिए उपजाऊ जमीन बन गया है।

एक भाषा से दूसरी भाषा में मशीनी अनुवाद सूचना प्रौद्योगिकी की तेजी से बढ़ती हुई शाखा है। इस तथ्य के बावजूद कि कंप्यूटर-समर्थित अनुवाद की गुणवत्ता की तुलना मानव अनुवाद (विशेषकर साहित्यिक ग्रंथों के लिए) से कभी नहीं की जा सकती है, बड़ी मात्रा में पाठ का अनुवाद करने में मशीन एक व्यक्ति के लिए एक अनिवार्य सहायक बन गई है। यह माना जाता है कि निकट भविष्य में और अधिक उन्नत अनुवाद प्रणालियाँ बनाई जाएंगी, जो मुख्य रूप से पाठ के शब्दार्थ विश्लेषण पर आधारित होंगी।

एक समान रूप से आशाजनक दिशा भाषा विज्ञान और तर्क की बातचीत है, जो सूचना प्रौद्योगिकी और तथाकथित "आभासी वास्तविकता" को समझने के लिए एक दार्शनिक आधार के रूप में कार्य करती है। निकट भविष्य में, कृत्रिम बुद्धिमत्ता प्रणालियों के निर्माण पर काम जारी रहेगा - हालाँकि, फिर से, यह अपनी क्षमताओं में मानव के बराबर कभी नहीं होगा। ऐसी प्रतियोगिता व्यर्थ है: हमारे समय में, मशीन एक प्रतिद्वंद्वी नहीं, बल्कि मनुष्य के लिए एक सहायक बननी चाहिए (और बन जाती है), कल्पना के दायरे से कुछ नहीं, बल्कि वास्तविक दुनिया का हिस्सा।

सांख्यिकीय विधियों द्वारा भाषा का अध्ययन जारी है, जिससे इसके गुणात्मक गुणों को अधिक सटीक रूप से निर्धारित करना संभव हो जाता है। यह महत्वपूर्ण है कि भाषा के बारे में सबसे साहसी परिकल्पना उनके गणितीय, और इसलिए तार्किक, प्रमाण खोजें।

सबसे महत्वपूर्ण बात यह है कि भाषा विज्ञान में गणित के अनुप्रयोग की विभिन्न शाखाएँ, जो पहले काफी अलग-थलग थीं, हाल के वर्षों में एक दूसरे के साथ सहसंबद्ध हैं, एक सुसंगत प्रणाली में जुड़कर, एक सदी पहले फर्डिनेंड डी सौसुरे द्वारा खोजी गई भाषा प्रणाली के अनुरूप। और यवन बौदौइन डी कर्टेने। यह वैज्ञानिक ज्ञान की निरंतरता है।

आधुनिक दुनिया में भाषाविज्ञान सूचना प्रौद्योगिकी के विकास की नींव बन गया है। जब तक कंप्यूटर विज्ञान मानव गतिविधि की तेजी से विकासशील शाखा बना रहेगा, तब तक गणित और भाषा विज्ञान का मिलन विज्ञान के विकास में अपनी भूमिका निभाता रहेगा।

निष्कर्ष

20वीं शताब्दी में, कंप्यूटर प्रौद्योगिकियों ने एक लंबा सफर तय किया है - सैन्य से शांतिपूर्ण उपयोग तक, लक्ष्यों की एक संकीर्ण सीमा से मानव जीवन की सभी शाखाओं में प्रवेश करने के लिए। एक विज्ञान के रूप में गणित ने कंप्यूटर प्रौद्योगिकी के विकास के साथ कभी नया व्यावहारिक महत्व पाया। यह प्रक्रिया आज भी जारी है।

"भौतिकविदों" और "गीतकारों" का पहले अकल्पनीय "मिलकर" एक वास्तविकता बन गया है। मानविकी के साथ गणित और कंप्यूटर विज्ञान की पूर्ण बातचीत के लिए, दोनों पक्षों से योग्य विशेषज्ञों की आवश्यकता थी। जबकि कंप्यूटर वैज्ञानिकों को अपने आस-पास की वास्तविकता में परिवर्तन को समझने के लिए व्यवस्थित मानवीय ज्ञान (भाषाई, सांस्कृतिक, दार्शनिक) की आवश्यकता होती है, मनुष्य और प्रौद्योगिकी की बातचीत में, अधिक से अधिक नई भाषाई और मानसिक अवधारणाओं को विकसित करने के लिए, लिखने के लिए कार्यक्रम, फिर हमारे समय में किसी भी "मानविकी" को अपने पेशेवर विकास के लिए कम से कम कंप्यूटर के साथ काम करने की मूल बातें मास्टर करना चाहिए।

गणित, सूचना विज्ञान के साथ घनिष्ठ रूप से जुड़ा होने के कारण, प्राकृतिक विज्ञानों और मानविकी के साथ विकसित और परस्पर क्रिया करना जारी रखता है। नई सदी में विज्ञान के गणितीकरण की ओर रुझान कमजोर नहीं हो रहा है, बल्कि इसके विपरीत बढ़ रहा है। मात्रात्मक आंकड़ों के आधार पर, भाषा के विकास के नियम, इसकी ऐतिहासिक और दार्शनिक विशेषताओं को समझा जाता है।

भाषाविज्ञान में पैटर्न का वर्णन करने के लिए गणितीय औपचारिकता सबसे उपयुक्त है (जैसा कि, वास्तव में, अन्य विज्ञानों में - मानविकी और प्राकृतिक दोनों)। विज्ञान में कभी-कभी स्थिति इस प्रकार विकसित हो जाती है कि उपयुक्त गणितीय भाषा के प्रयोग के बिना भौतिक, रासायनिक आदि की प्रकृति को समझना असंभव है। प्रक्रिया संभव नहीं है। XX सदी के प्रसिद्ध अंग्रेजी भौतिक विज्ञानी परमाणु का एक ग्रहीय मॉडल बनाना। ई. रदरफोर्ड ने गणितीय कठिनाइयों का अनुभव किया। सबसे पहले, उनके सिद्धांत को स्वीकार नहीं किया गया था: यह आश्वस्त नहीं लग रहा था, और इसका कारण रदरफोर्ड की संभाव्यता के सिद्धांत की अज्ञानता थी, जिसके तंत्र के आधार पर परमाणु बातचीत के मॉडल प्रतिनिधित्व को समझना संभव था। इसे महसूस करते हुए, पहले से ही उस समय तक एक उत्कृष्ट वैज्ञानिक, नोबेल पुरस्कार के मालिक, गणितज्ञ प्रोफेसर लैम्ब के संगोष्ठी में नामांकित हुए और दो साल के लिए, छात्रों के साथ, एक पाठ्यक्रम में भाग लिया और संभाव्यता के सिद्धांत पर एक कार्यशाला तैयार की। . इसके आधार पर, रदरफोर्ड इलेक्ट्रॉन के व्यवहार का वर्णन करने में सक्षम थे, जिससे उनके संरचनात्मक मॉडल को सटीकता और मान्यता प्राप्त हुई। भाषाविज्ञान के साथ भी ऐसा ही है।

यह प्रश्न पूछता है, वस्तुनिष्ठ घटनाओं में इतना गणितीय क्या है, जिसके लिए उन्हें गणित की भाषा में, मात्रात्मक विशेषताओं की भाषा में वर्णित किया जा सकता है? ये अंतरिक्ष और समय में वितरित पदार्थ की सजातीय इकाइयाँ हैं। वे विज्ञान जो एकरूपता के अलगाव की दिशा में दूसरों की तुलना में बहुत आगे निकल गए हैं, और उनमें गणित के उपयोग के लिए बेहतर अनुकूल साबित हुए हैं।

इंटरनेट, जो 1990 के दशक में तेजी से विकसित हुआ, विभिन्न देशों, लोगों और संस्कृतियों के प्रतिनिधियों को एक साथ लाया। इस तथ्य के बावजूद कि अंग्रेजी अंतरराष्ट्रीय संचार की मुख्य भाषा बनी हुई है, हमारे समय में इंटरनेट बहुभाषी हो गया है। इससे व्यावसायिक रूप से सफल मशीनी अनुवाद प्रणालियों का विकास हुआ, जिनका व्यापक रूप से मानव गतिविधि के विभिन्न क्षेत्रों में उपयोग किया जाता है।

कंप्यूटर नेटवर्क दार्शनिक प्रतिबिंब का एक उद्देश्य बन गया है - अधिक से अधिक नई भाषाई, तार्किक, विश्वदृष्टि अवधारणाएं बनाई गई हैं जो "आभासी वास्तविकता" को समझने में मदद करती हैं। कला के कई कार्यों में, परिदृश्य बनाए गए - अधिक बार निराशावादी - एक व्यक्ति पर मशीनों के प्रभुत्व के बारे में, और आभासी वास्तविकता - बाहरी दुनिया पर। हमेशा से दूर इस तरह के पूर्वानुमान निरर्थक निकले। सूचना प्रौद्योगिकी न केवल मानव ज्ञान के निवेश के लिए एक आशाजनक उद्योग है, यह सूचना को नियंत्रित करने का एक तरीका भी है, और इसके परिणामस्वरूप, मानव विचार पर।

इस घटना के नकारात्मक और सकारात्मक दोनों पक्ष हैं। नकारात्मक - क्योंकि सूचना पर नियंत्रण मुक्त पहुंच के अयोग्य मानव अधिकार के विपरीत है। सकारात्मक - क्योंकि इस नियंत्रण की कमी से मानवता के लिए विनाशकारी परिणाम हो सकते हैं। विम वेंडर्स द्वारा पिछले दशक की सबसे बुद्धिमान फिल्मों में से एक - "व्हेन द वर्ल्ड एंड्स" को याद करने के लिए पर्याप्त है, जिनके पात्र कंप्यूटर पर रिकॉर्ड किए गए अपने स्वयं के सपनों की "आभासी वास्तविकता" में पूरी तरह से डूबे हुए हैं। उसी समय, एक भी वैज्ञानिक और एक भी कलाकार इस प्रश्न का स्पष्ट उत्तर नहीं दे सकता है: भविष्य में विज्ञान और प्रौद्योगिकी का क्या इंतजार है।

"भविष्य" पर ध्यान केंद्रित करना, कभी-कभी शानदार लग रहा था, बीसवीं शताब्दी के मध्य में विज्ञान की एक विशिष्ट विशेषता थी, जब आविष्कारकों ने प्रौद्योगिकी के आदर्श मॉडल बनाने की मांग की जो मानव हस्तक्षेप के बिना काम कर सके। समय ने इस तरह के शोध की यूटोपियन प्रकृति को दिखाया है। साथ ही, इसके लिए वैज्ञानिकों की निंदा करना अतिश्योक्तिपूर्ण नहीं होगा - 1950 - 60 के दशक में उनके उत्साह के बिना, सूचना प्रौद्योगिकी ने 90 के दशक में इतनी शक्तिशाली छलांग नहीं लगाई होगी, और हमारे पास वह नहीं होगा जो अभी हमारे पास है।

बीसवीं शताब्दी के अंतिम दशकों ने विज्ञान की प्राथमिकताओं को बदल दिया - अनुसंधान, आविष्कारशील पथों ने व्यावसायिक हित को रास्ता दिया। फिर, यह न तो अच्छा है और न ही बुरा। यह एक वास्तविकता है जिसमें विज्ञान तेजी से रोजमर्रा की जिंदगी में एकीकृत हो रहा है।

21वीं सदी ने इस प्रवृत्ति को जारी रखा है, और हमारे समय में आविष्कारों के पीछे न केवल प्रसिद्धि और मान्यता है, बल्कि, सबसे पहले, पैसा है। यही कारण है कि यह सुनिश्चित करना भी महत्वपूर्ण है कि विज्ञान और प्रौद्योगिकी की नवीनतम उपलब्धियां आतंकवादी समूहों या तानाशाही शासन के हाथों में न पड़ें। असंभवता के बिंदु तक कार्य कठिन है; इसे यथासंभव साकार करना पूरे विश्व समुदाय का कार्य है।

सूचना एक हथियार है, और हथियार परमाणु या रासायनिक हथियारों से कम खतरनाक नहीं हैं - केवल यह शारीरिक रूप से नहीं, बल्कि मनोवैज्ञानिक रूप से कार्य करता है। मानवता को यह सोचने की जरूरत है कि इस मामले में उसके लिए क्या अधिक महत्वपूर्ण है - स्वतंत्रता या नियंत्रण।

नवीनतम दार्शनिक अवधारणाएंसूचना प्रौद्योगिकी के विकास और उन्हें समझने के प्रयास से संबंधित, प्राकृतिक-विज्ञान भौतिकवाद दोनों की सीमाओं को दर्शाता है, जो 19 वीं और 20 वीं शताब्दी की शुरुआत में हावी था, और चरम आदर्शवाद, जो भौतिक दुनिया के महत्व को नकारता है। आधुनिक विचार के लिए, विशेष रूप से पश्चिम के विचार के लिए, सोच में इस द्वैतवाद को दूर करना महत्वपूर्ण है, जब आसपास की दुनिया स्पष्ट रूप से भौतिक और आदर्श में विभाजित हो जाती है। इसका मार्ग संस्कृतियों का संवाद है, आसपास की घटनाओं पर विभिन्न दृष्टिकोणों की तुलना।

विडंबना यह है कि इस प्रक्रिया में सूचना प्रौद्योगिकी एक महत्वपूर्ण भूमिका निभा सकती है। कंप्यूटर नेटवर्क, और विशेष रूप से इंटरनेट, न केवल मनोरंजन और जोरदार व्यावसायिक गतिविधि के लिए एक संसाधन हैं, वे प्रतिनिधियों के बीच सार्थक, विवादास्पद संचार का एक साधन भी हैं। विभिन्न सभ्यताएंआधुनिक दुनिया में, साथ ही अतीत के वर्तमान के साथ संवाद के लिए। हम कह सकते हैं कि इंटरनेट स्थानिक और लौकिक सीमाओं को आगे बढ़ाता है।

और सूचना प्रौद्योगिकी के माध्यम से संस्कृतियों के संवाद में, संचार के सबसे पुराने सार्वभौमिक साधन के रूप में भाषा की भूमिका अभी भी महत्वपूर्ण है। यही कारण है कि भाषा विज्ञान, गणित, दर्शन और कंप्यूटर विज्ञान के साथ बातचीत में, अपने दूसरे जन्म का अनुभव किया है और आज भी विकसित हो रहा है। वर्तमान की प्रवृत्ति भविष्य में भी जारी रहेगी - "दुनिया के अंत तक", जैसा कि 15 साल पहले, वही वी। वेंडर्स ने भविष्यवाणी की थी। सच है, यह पता नहीं है कि यह अंत कब होगा - लेकिन क्या यह अभी महत्वपूर्ण है, क्योंकि भविष्य अभी या बाद में वर्तमान बन जाएगा।

परिशिष्ट 1

फर्डिनेंड डी सौसुरे

स्विस भाषाविद् फर्डिनेंड डी सौसुरे (1857-1913) को विशेष भाषाओं और भाषा रूपों के इतिहास के बजाय भाषा की संरचना का वर्णन करने के अपने प्रयासों में व्यापक रूप से आधुनिक भाषाविज्ञान का संस्थापक माना जाता है। वास्तव में, भाषा विज्ञान और साहित्यिक अध्ययन में संरचनावाद की पद्धति और लाक्षणिकता की एक महत्वपूर्ण शाखा बीसवीं शताब्दी के अंत में उनके काम में अपना प्रमुख प्रारंभिक बिंदु पाती है। यह भी तर्क दिया गया है कि रणनीतियों और अवधारणाओं के परिसर को "पोस्टस्ट्रक्चरलिज्म" कहा जाने लगा है - जैक्स डेरिडा, मिशेल फौकॉल्ट, जैक्स लैकन, जूलिया क्रिस्टेवा, रोलैंड बार्थेस और अन्य का काम - सॉसर के काम द्वारा सुझाया गया है। देर से लैटिन कविता के भाषाविज्ञान और विपर्ययण रीडिंग में बीसवीं शताब्दी की शुरुआत में मनोविश्लेषण और दर्शन के लिए साहित्यिक आधुनिकतावाद। जैसा कि अल्गिरदास जूलियन ग्रीमास और जोसेफ कोर्टेस ने सेमियोटिक्स एंड लैंग्वेज: एन एनालिटिक डिक्शनरी में तर्क दिया है, "इंटरप्रिटेशन" शीर्षक के तहत, बीसवीं शताब्दी की शुरुआत में व्याख्या का एक नया तरीका सामने आया, जिसे वे सौसुरियन भाषाविज्ञान, हुसेरलियन फेनोमेनोलॉजी और फ्रायडियन मनोविश्लेषण के साथ पहचानते हैं। इस मोड में, "व्याख्या अब किसी दिए गए सामग्री को किसी ऐसे रूप में जिम्मेदार ठहराने का मामला नहीं है जिसमें अन्यथा एक की कमी होगी; बल्कि, यह एक पैराफ्रेश है जो किसी अन्य तरीके से किसी दिए गए लाक्षणिक प्रणाली के भीतर एक संकेतक तत्व की समकक्ष सामग्री तैयार करता है" ( 159)। "व्याख्या" की इस समझ में, रूप और सामग्री अलग नहीं हैं; इसके बजाय, प्रत्येक "रूप", वैकल्पिक रूप से, एक अर्थपूर्ण "सामग्री" के साथ-साथ एक "संकेत देने वाला रूप" भी है, ताकि व्याख्या किसी ऐसी चीज़ का एक अनुरूप व्याख्या प्रदान करे जो पहले से ही किसी अन्य प्रणाली के अर्थ के भीतर इंगित करती है।

रूप और समझ की ऐसी पुनर्व्याख्या - जिसे क्लाउड लेवी-स्ट्रॉस ने "स्ट्रक्चर एंड फॉर्म: रिफ्लेक्शंस ऑन ए वर्क बाय व्लादिमीर प्रॉप" में संरचनावाद की अवधारणा के अपने सबसे प्रोग्रामेटिक आर्टिक्यूलेशन में से एक में वर्णित किया है - सॉसर के मरणोपरांत पाठ्यक्रम में निहित है। सामान्य भाषाविज्ञान में (1916, ट्रांस।, 1959, 1983)। अपने जीवनकाल में, सौसुरे ने अपेक्षाकृत कम प्रकाशित किया, और उनका प्रमुख काम, पाठ्यक्रम, उनके छात्रों द्वारा 1907-11 में पेश किए गए सामान्य भाषाविज्ञान में कई पाठ्यक्रमों का प्रतिलेखन था। कोर्स में सौसुर ने भाषा के "वैज्ञानिक" अध्ययन का आह्वान किया, जो कि उन्नीसवीं शताब्दी में किए गए ऐतिहासिक भाषाविज्ञान में काम के विपरीत था। यह काम पश्चिमी बुद्धि की महान उपलब्धियों में से एक है: विशेष शब्दों को बिल्डिंग ब्लॉक्स के रूप में लेना भाषा, ऐतिहासिक (या "डायक्रोनिक") भाषाविज्ञान ने एक सामान्य भाषा स्रोत से पश्चिमी भाषाओं की उत्पत्ति और विकास का पता लगाया, पहले एक "इंडो-यूरोपियन" भाषा और फिर एक पहले "पी" रोटो-इंडो-यूरोपीय" भाषा।

यह शब्दों की अनूठी घटनाओं का अध्ययन है, सहवर्ती धारणा के साथ कि भाषा की मूल "इकाई" वास्तव में, इन "शब्द-तत्वों" का सकारात्मक अस्तित्व है, जिस पर सॉसर ने सवाल उठाया था। उनका काम भाषा के बारे में तथ्यों के द्रव्यमान को कम करने का एक प्रयास था, जिसे ऐतिहासिक भाषाविज्ञान द्वारा इतनी बारीकी से अध्ययन किया गया था, प्रस्तावों की एक प्रबंधनीय संख्या में। उन्नीसवीं सदी के भाषाशास्त्र के "तुलनात्मक विद्यालय", पाठ्यक्रम में सौसुरे कहते हैं, "भाषा विज्ञान के सच्चे विज्ञान को स्थापित करने में सफल नहीं हुआ" क्योंकि "यह अपने अध्ययन की वस्तु की प्रकृति की खोज करने में विफल रहा" (3)। वह "प्रकृति," उनका तर्क है, केवल "मौलिक" शब्दों में नहीं पाया जाना चाहिए, जिसमें एक भाषा शामिल है - भाषा के प्रतीत होने वाले "सकारात्मक" तथ्य (या "पदार्थ") - लेकिन औपचारिक संबंधों में जो उन्हें जन्म देते हैं "पदार्थ।"

भाषा की सॉसर की व्यवस्थित पुनर्परीक्षा तीन मान्यताओं पर आधारित है। पहला यह है कि भाषा के वैज्ञानिक अध्ययन को भाषाई घटनाओं के इतिहास के बजाय प्रणाली को विकसित और अध्ययन करने की आवश्यकता है। इस कारण से, वह भाषा की विशेष घटनाओं के बीच अंतर करता है - इसकी विशेष "भाषण-घटनाएं", जिसे वह पैरोल के रूप में नामित करता है - और भाषाविज्ञान की उचित वस्तु, उन घटनाओं को नियंत्रित करने वाली प्रणाली (या "कोड"), जिसे वह लैंग्यू के रूप में नामित करता है। इस तरह के एक व्यवस्थित अध्ययन, इसके अलावा, एक " इतिहास के माध्यम से भाषा के विकास के "डायक्रोनिक" अध्ययन के बजाय एक विशेष पल में भाषा के तत्वों के बीच संबंधों की समकालिक" अवधारणा।

इस धारणा ने 1929 में रोमन जैकबसन को "संरचनावाद" के रूप में नामित करने के लिए जन्म दिया, जिसमें "समकालीन विज्ञान द्वारा जांच की गई घटनाओं के किसी भी सेट को एक यांत्रिक समूह के रूप में नहीं माना जाता है, लेकिन एक संरचनात्मक संपूर्ण के रूप में प्रक्रियाओं की यांत्रिक अवधारणा प्रश्न को जन्म देती है। उनके कार्य" ("रोमांटिक" 711)। इस मार्ग में जैकबसन ऐतिहासिक दुर्घटनाओं के एक सरल, "यांत्रिक" लेखांकन के विपरीत भाषाविज्ञान को एक वैज्ञानिक प्रणाली के रूप में परिभाषित करने के लिए सौसुरे के इरादे को स्पष्ट कर रहा है। इसके अलावा, जैकबसन सौसुरियन में दूसरी मूलभूत धारणा का भी वर्णन कर रहा है - हम कर सकते हैं अब इसे "संरचनात्मक" - भाषाविज्ञान कहते हैं: कि भाषा के मूल तत्वों का अध्ययन केवल उनके कार्यों के संबंध में किया जा सकता है, न कि उनके कारणों के संबंध में। यूरोपीय "शब्द"), उन घटनाओं और संस्थाओं को एक प्रणालीगत ढांचे के भीतर स्थित होना चाहिए। जिसमें वे अन्य तथाकथित घटनाओं और संस्थाओं से संबंधित हैं। यह अनुभव और घटनाओं की अवधारणा में एक क्रांतिकारी पुनर्विन्यास है, जिसका महत्व दार्शनिक अर्नस्ट कैसरर ने "गैलीलियो के नए विज्ञान की तुलना में किया है, जिसने सत्रहवीं शताब्दी में हमारे पूरे को बदल दिया भौतिक दुनिया की अवधारणा" (Culler, Pursuit 2 . में उद्धृत) 4))। यह परिवर्तन, जैसा कि ग्रीमास और कोर्टेस नोट करते हैं, "व्याख्या" को पुन: ग्रहण करता है और इस प्रकार स्पष्टीकरण और स्वयं को समझने की पुन: कल्पना करता है। स्पष्टीकरण के बजाय "एक घटना के कारणों के संदर्भ में, ताकि, एक" प्रभाव "के रूप में, यह कुछ मायनों में इसके कारणों के अधीन है, यहां स्पष्टीकरण में एक घटना को उसके भविष्य-उन्मुख "कार्य" के अधीन करना शामिल है या "प्रयोजन।" स्पष्टीकरण अब मानवीय इरादों या उद्देश्यों से स्वतंत्र नहीं है (भले ही वे इरादे अवैयक्तिक, सांप्रदायिक या, फ्रायडियन शब्दों में, "बेहोश" हो सकते हैं)।

अपने भाषाविज्ञान में सॉसर इस परिवर्तन को विशेष रूप से भाषाई "शब्द" की पुनर्परिभाषा में पूरा करता है, जिसे वह भाषाई "संकेत" के रूप में वर्णित करता है और कार्यात्मक शब्दों में परिभाषित करता है। उनका तर्क है कि संकेत, "एक अवधारणा और एक ध्वनि छवि" का मिलन है, जिसे उन्होंने "संकेत और हस्ताक्षरकर्ता" कहा (66-67; रॉय हैरिस का 1983 अनुवाद "संकेत" और "संकेत" शब्द प्रदान करता है)। उनके "संयोजन" की प्रकृति "कार्यात्मक" है जिसमें न तो संकेतित और न ही हस्ताक्षरकर्ता दूसरे का "कारण" है, बल्कि, "प्रत्येक अपने मूल्यों को दूसरे से" (8) भाषा का तत्व, संकेत , संबंधपरक रूप से और ऐतिहासिक भाषाविज्ञान की मूल धारणा बनाता है, अर्थात्, भाषा और अर्थ की मौलिक इकाइयों की पहचान (यानी, "शब्द"), कठोर विश्लेषण के अधीन। "पेड़" शब्द "समान" शब्द के रूप में नहीं है क्योंकि शब्द को अंतर्निहित गुणों द्वारा परिभाषित किया गया है - यह ऐसे गुणों का "यांत्रिक समूह" नहीं है - बल्कि इसलिए कि इसे एक प्रणाली में एक तत्व के रूप में परिभाषित किया गया है, "संरचनात्मक संपूर्ण", भाषा का।

एक इकाई की इस तरह की एक संबंधपरक (या "विशेषक") परिभाषा संरचनात्मक भाषाविज्ञान में भाषा के सभी तत्वों की अवधारणा को नियंत्रित करती है। यह सौसुरियन भाषाविज्ञान की सबसे प्रभावशाली उपलब्धि, भाषा के "स्वनिम" और "विशिष्ट विशेषताओं" की अवधारणाओं के विकास में स्पष्ट है। फोनीम्स किसी भाषा की सबसे छोटी व्यक्त और सांकेतिक इकाइयाँ हैं। वे भाषा में होने वाली ध्वनियाँ नहीं हैं, बल्कि "ध्वनि चित्र" सॉसर का उल्लेख है, जिन्हें वक्ताओं द्वारा पकड़ा जाता है - अभूतपूर्व रूप से पकड़ा जाता है - संदेश देने वाले अर्थ के रूप में। (इस प्रकार, एल्मर होलेनस्टीन ने जैकबसन की भाषाविज्ञान का वर्णन किया है, जो "अभूतपूर्व संरचनावाद" के रूप में महत्वपूर्ण तरीकों से सॉसर का अनुसरण करता है।) यही कारण है कि प्राग स्कूल संरचनावाद के प्रमुख प्रवक्ता, जान मुकारोव्स्की ने 1937 में कहा कि "संरचना। . . एक घटनात्मक है और एक अनुभवजन्य वास्तविकता नहीं है; यह स्वयं कार्य नहीं है, बल्कि कार्यात्मक संबंधों का एक समूह है जो एक सामूहिक (पीढ़ी, परिवेश, आदि) की चेतना में स्थित है" (गैलन 35 में उद्धृत)। इसी तरह, फ्रांसीसी संरचनावाद के प्रमुख प्रवक्ता लेवी-स्ट्रॉस , 1960 में नोट किया गया कि "संरचना में कोई विशिष्ट सामग्री नहीं है; यह स्वयं सामग्री है, और जिस तार्किक संगठन में इसे गिरफ्तार किया गया है, उसे वास्तविक की संपत्ति के रूप में माना जाता है" (167; जैकबसन, फंडामेंटल्स 27-28 भी देखें)।

फोनेम्स, फिर, भाषा के सबसे छोटे बोधगम्य तत्व, सकारात्मक वस्तुएं नहीं हैं, बल्कि एक "अभूतपूर्व वास्तविकता" हैं। अंग्रेजी में, उदाहरण के लिए, फोनेम / टी / को कई अलग-अलग तरीकों से उच्चारित किया जा सकता है, लेकिन सभी मामलों में एक अंग्रेजी बोलने वाला इसे / टी / के रूप में कार्य करने के रूप में पहचान लेगा। एक एस्पिरेटेड टी (यानी, इसके बाद एक एच जैसी सांस के साथ एक टी उच्चारण), एक उच्च-पिच या कम-पिच टी ध्वनि, एक विस्तारित टी ध्वनि, और इसी तरह, सभी के अर्थ को अलग करने में एक ही तरीके से कार्य करेंगे अंग्रेजी में "टू" और "डू"। इसके अलावा, भाषाओं के बीच अंतर ऐसे हैं कि एक भाषा में ध्वन्यात्मक भिन्नताएं दूसरी भाषा में अलग-अलग स्वरों का निर्माण कर सकती हैं; इस प्रकार, अंग्रेजी /l/ और /r/ के बीच अंतर करती है, जबकि अन्य भाषाएं इतनी संरचित हैं कि इन अभिव्यक्तियों को एक ही स्वर के रूपांतर माना जाता है (जैसे अंग्रेजी में एस्पिरेटेड और अनस्पिरेटेड टी)। प्रत्येक प्राकृतिक भाषा में, संभावित शब्दों की विशाल संख्या कम संख्या में स्वरों का संयोजन होती है। उदाहरण के लिए, अंग्रेजी में 40 से कम स्वर होते हैं जो एक लाख से अधिक विभिन्न शब्दों को बनाने के लिए मिलते हैं।

भाषा के स्वर स्वयं सुविधाओं की व्यवस्थित रूप से संगठित संरचनाएँ हैं। 1920 और 1930 के दशक में, सॉसर के नेतृत्व के बाद, जैकबसन और एन.एस. ट्रुबेट्ज़कोय ने स्वरों की "विशिष्ट विशेषताओं" को अलग कर दिया। ये विशेषताएं भाषण अंगों की शारीरिक संरचना पर आधारित हैं - जीभ, दांत, मुखर राग, और इसी तरह - कि कोर्स में सॉसर का उल्लेख है और हैरिस ने "शारीरिक ध्वन्यात्मकता" के रूप में वर्णन किया है (39; बास्किन के पहले के अनुवाद में "ध्वन्यात्मकता" [(1959) 38] शब्द का उपयोग किया गया है) - और वे ध्वन्यात्मकता बनाने के लिए द्विआधारी विरोधों के "बंडलों" में गठबंधन करते हैं। उदाहरण के लिए, अंग्रेजी में /t/ और /d/ के बीच का अंतर "आवाज" (मुखर रागों का जुड़ाव) की उपस्थिति या अनुपस्थिति है, और आवाज के स्तर पर ये स्वर एक दूसरे को पारस्परिक रूप से परिभाषित करते हैं। इस तरह, ध्वनिविज्ञान सॉसर द्वारा वर्णित भाषा के सामान्य नियम का एक विशिष्ट उदाहरण है: भाषा में केवल अंतर होते हैं। और भी महत्वपूर्ण: एक अंतर आम तौर पर सकारात्मक शब्दों को दर्शाता है जिनके बीच अंतर स्थापित होता है; लेकिन भाषा में सकारात्मक शब्दों के बिना केवल मतभेद हैं। चाहे हम सांकेतिक हों या हस्ताक्षरकर्ता, भाषा में न तो विचार होते हैं और न ही ध्वनियाँ जो भाषाई व्यवस्था से पहले मौजूद थीं। (120)

इस ढांचे में, भाषाई पहचान अंतर्निहित गुणों से नहीं बल्कि प्रणालीगत ("संरचनात्मक") संबंधों द्वारा निर्धारित की जाती है।

मैंने कहा है कि ध्वन्यात्मकता सॉसर के "नेतृत्व का अनुसरण करती है", क्योंकि भले ही भाषा उत्पादन के शरीर विज्ञान का उनका विश्लेषण "आजकल" होगा, जैसा कि हैरिस कहते हैं, "मनोवैज्ञानिक" या "कार्यात्मक" के विपरीत "भौतिक" कहा जाता है। "" (49 पढ़ना), फलस्वरूप पाठ्यक्रम में उन्होंने भाषा के कार्यात्मक विश्लेषण की दिशा और रूपरेखा को स्पष्ट किया। इसी तरह, उनका एकमात्र विस्तारित प्रकाशित काम, मेमोइरे सुर ले सिस्टेम प्राइमिटिफ डेस वॉयलेस डान्स लेस लैंग्स इंडो-यूरोपीनेस (इंडो-यूरोपीय भाषाओं में स्वरों की आदिम प्रणाली पर संस्मरण), जो 1878 में प्रकाशित हुआ था, पूरी तरह से उन्नीसवीं की परियोजना के भीतर स्थित था- सदी के ऐतिहासिक भाषाविज्ञान। फिर भी, इस काम के भीतर, जैसा कि जोनाथन कलर ने तर्क दिया है, सॉसर ने "ऐतिहासिक पुनर्निर्माण के कार्य पर काम करते हुए भी, विशुद्ध रूप से संबंधपरक वस्तुओं की एक प्रणाली के रूप में भाषा की सोच की उर्वरता" (सॉसुर 66) का प्रदर्शन किया। मौजूदा इंडो-यूरोपीय भाषाओं में स्वरों के प्रत्यावर्तन के पैटर्न को ध्यान में रखते हुए स्वरों के बीच व्यवस्थित संरचनात्मक संबंधों का विश्लेषण करके, सौसुरे ने सुझाव दिया कि कई अलग-अलग स्वरों / a / के अलावा, एक और स्वर भी रहा होगा जिसे औपचारिक रूप से वर्णित किया जा सकता है। "क्या सॉसर के काम को इतना प्रभावशाली बनाता है," कलर ने निष्कर्ष निकाला, "यह तथ्य है कि लगभग पचास साल बाद, जब क्यूनिफॉर्म हित्ती की खोज की गई और उसे समझ लिया गया, तो इसमें एक फोनेम, लिखित एच पाया गया, जो कि सॉसर ने भविष्यवाणी की थी। . उन्होंने विशुद्ध रूप से औपचारिक विश्लेषण द्वारा खोज की थी, जिसे अब इंडो-यूरोपियन के स्वरयंत्र के रूप में जाना जाता है" (66)।

संकेत के तत्वों के संबंधपरक या विशेषक निर्धारण की यह अवधारणा, जो पाठ्यक्रम में निहित और स्पष्ट दोनों है, संरचनात्मक भाषाविज्ञान को नियंत्रित करने वाली तीसरी धारणा का सुझाव देती है, जिसे सॉसर "संकेत की मनमानी प्रकृति" कहते हैं। इसके द्वारा उनका मतलब है कि भाषा में संकेतक और संकेत के बीच संबंध कभी भी आवश्यक नहीं है (या "प्रेरित"): कोई भी आसानी से ध्वनि संकेतक अर्ब्रे को "पेड़" अवधारणा के साथ एकजुट करने के लिए हस्ताक्षरकर्ता पेड़ के रूप में ढूंढ सकता है। लेकिन इससे भी अधिक, इसका मतलब है कि संकेतित मनमाना भी है: कोई भी आसानी से "पेड़" की अवधारणा को इसकी लकड़ी की गुणवत्ता (जो ताड़ के पेड़ों को बाहर करेगा) द्वारा इसके आकार के अनुसार परिभाषित कर सकता है (जिसमें "कम लकड़ी के पौधे" शामिल नहीं हैं। झाड़ियों को बुलाओ)। यह स्पष्ट करना चाहिए कि मेरे द्वारा प्रस्तुत की गई मान्यताओं की संख्या प्राथमिकता के क्रम का प्रतिनिधित्व नहीं करती है: प्रत्येक धारणा - अर्थ की प्रणालीगत प्रकृति (भाषा "सिंक्रोनस" का अध्ययन करके सबसे अच्छी तरह से पकड़ी गई), तत्वों की संबंधपरक या "विशेषक" प्रकृति संकेत के, संकेतों की मनमानी प्रकृति - दूसरों से इसका मूल्य प्राप्त करती है।

यही है, सौसुरियन भाषाविज्ञान वह घटना है जो भाषा में संयोजन और विपरीतता के व्यापक संबंधों में अध्ययन करती है। इस अवधारणा में, भाषा अर्थ (संकेत) और उसके उत्पाद (संचार) को व्यक्त करने की प्रक्रिया है, और भाषा के ये दो कार्य न तो समान हैं और न ही पूरी तरह से अनुरूप हैं (देखें श्लीफ़र, "डिकंस्ट्रक्शन")। यहां, हम आधुनिकतावादी व्याख्या में ग्रीमास और कोर्टेस द्वारा वर्णित रूप और सामग्री के बीच विकल्प देख सकते हैं: भाषा विरोधाभास प्रस्तुत करती है जो औपचारिक रूप से इसकी इकाइयों को परिभाषित करती है, और ये इकाइयां सार्थक सामग्री बनाने के लिए सफल स्तरों पर गठबंधन करती हैं। चूँकि भाषा के तत्व मनमाने हैं, इसके अलावा, न तो विपरीतता और न ही संयोजन को बुनियादी कहा जा सकता है। इस प्रकार, भाषा में विशिष्ट विशेषताएं आशंका के दूसरे स्तर पर विपरीत स्वरों को बनाने के लिए गठबंधन करती हैं, ध्वनियां विपरीत मर्फीम बनाने के लिए मिलती हैं, मर्फीम शब्दों को बनाने के लिए गठबंधन करते हैं, शब्द वाक्य बनाने के लिए गठबंधन करते हैं, और इसी तरह। प्रत्येक उदाहरण में, संपूर्ण स्वर, या शब्द, या वाक्य, और इसी तरह, इसके भागों के योग से अधिक है (जैसे पानी, H2O, सॉसर के उदाहरण में [(1959) 103] यांत्रिक समूह से अधिक है हाइड्रोजन और ऑक्सीजन)।

सामान्य भाषाविज्ञान में पाठ्यक्रम की तीन धारणाओं ने सौसुर को बीसवीं शताब्दी के एक नए विज्ञान के लिए बुलावा दिया जो "समाज के भीतर संकेतों के जीवन" का अध्ययन करने के लिए भाषाई विज्ञान से परे होगा। सॉसर ने इस विज्ञान का नाम "अर्धविज्ञान (ग्रीक सेमियन "साइन" से)" (16) रखा। लाक्षणिकता का "विज्ञान", जैसा कि 1920 और 1930 के दशक में पूर्वी यूरोप में और 1950 और 1960 के दशक में पेरिस में प्रचलित हुआ, ने भाषा और भाषाई संरचनाओं के अध्ययन को उन संरचनाओं द्वारा गठित (या व्यक्त) साहित्यिक कलाकृतियों तक विस्तृत कर दिया। हर जगह देर सेइसके अलावा, जब वे सामान्य भाषाविज्ञान में पाठ्यक्रमों की पेशकश कर रहे थे, तब भी, सॉसर ने उचित नामों के जानबूझकर छिपे हुए विपर्यय को खोजने के प्रयास में देर से लैटिन कविता के अपने "अर्ध-संबंधी" विश्लेषण का अनुसरण किया। अध्ययन की विधि कई मायनों में उनके भाषाई विश्लेषणों के कार्यात्मक तर्कवाद के विपरीत थी: इसने प्रयास किया, जैसा कि सौसुरे ने 99 नोटबुक में से एक में उल्लेख किया है जिसमें उन्होंने इस अध्ययन को व्यवस्थित रूप से "मौका" की समस्या की जांच करने के लिए किया था, जो " सब कुछ का अपरिहार्य आधार बन जाता है" (स्टारोबिंस्की 101 में उद्धृत)। इस तरह का एक अध्ययन, जैसा कि सॉसर खुद कहते हैं, मौका और अर्थ के "भौतिक तथ्य" पर ध्यान केंद्रित करता है (101 उद्धृत), ताकि "विषय-शब्द" जिसका विपर्यय सॉसर खोज रहा है, जैसा कि जीन स्टारोबिंस्की का तर्क है, "कवि के लिए है , एक उपकरण, और कविता का एक महत्वपूर्ण रोगाणु नहीं। कविता को विषय-शब्द की ध्वन्यात्मक सामग्री को फिर से नियोजित करने की आवश्यकता है" (45)। इस विश्लेषण में, स्टारोबिंस्की कहते हैं, "सॉसुरे ने छिपे हुए अर्थों की खोज में खुद को नहीं खोया।" इसके बजाय, उनका काम चेतना से उत्पन्न होने वाली सभी समस्याओं से बचने की इच्छा प्रदर्शित करता है: "चूंकि कविता न केवल शब्दों में महसूस की जाती है बल्कि शब्दों से पैदा होती है, यह चेतना के मनमानी नियंत्रण से पूरी तरह से भाषाई वैधता पर निर्भर होने से बच जाती है। "(121)।

यही है, देर से लैटिन कविता में उचित नामों की खोज करने के लिए सॉसर का प्रयास - जिसे त्ज़्वेटन टोडोरोव "शब्द" की कमी कहते हैं। . . उसके हस्ताक्षरकर्ता के लिए" (266) - उसके भाषाई विश्लेषण को नियंत्रित करने वाले तत्वों में से एक पर जोर देता है, संकेत की मनमानी प्रकृति। (यह सौसुरियन भाषाविज्ञान की औपचारिक प्रकृति पर भी जोर देता है - "भाषा," वह दावा करता है, "एक रूप है और नहीं एक पदार्थ" - जो विश्लेषण के एक प्रमुख उद्देश्य के रूप में प्रभावी ढंग से शब्दार्थ को समाप्त करता है।) जैसा कि टोडोरोव ने निष्कर्ष निकाला है, प्रतीकात्मक घटना को स्वीकार करने से इनकार करने में सॉसर का काम आज उल्लेखनीय रूप से सजातीय प्रतीत होता है। . . . विपर्यय पर अपने शोध में, वह केवल पुनरावृत्ति की घटनाओं पर ध्यान देता है, न कि उद्दीपन की घटनाओं पर। . . . निबेलुंगेन के अपने अध्ययन में, वह प्रतीकों को केवल गलत रीडिंग के लिए विशेषता देने के लिए पहचानता है: चूंकि वे जानबूझकर नहीं हैं, प्रतीक मौजूद नहीं हैं। अंत में सामान्य भाषाविज्ञान पर अपने पाठ्यक्रमों में, वह अर्धविज्ञान के अस्तित्व पर विचार करता है, और इस प्रकार भाषाई लोगों के अलावा अन्य संकेतों के बारे में सोचता है; लेकिन यह पुष्टि एक बार में इस तथ्य से सीमित है कि अर्धविज्ञान एक ही प्रकार के संकेत के लिए समर्पित है: वे जो मनमानी हैं। (269-70)

अगर यह सच है, तो इसका कारण यह है कि सॉसर बिना किसी विषय के "इरादे" की कल्पना नहीं कर सकता था; वह रूप और सामग्री के बीच के विरोध से पूरी तरह से बच नहीं सका, उसके काम ने सवाल उठाने के लिए इतना कुछ किया। इसके बजाय, उन्होंने "भाषाई वैधता" का सहारा लिया। एक ओर, इतिहास की उन्नीसवीं सदी की अवधारणाओं, व्यक्तिपरकता, और इन अवधारणाओं द्वारा शासित कारण व्याख्या के तरीके और दूसरी ओर, बीसवीं शताब्दी की "संरचनावादी" अवधारणाओं के बीच स्थित है, जिसे लेवी-स्ट्रॉस ने "बिना कांटियनवाद" कहा था। एक अनुवांशिक विषय" (कॉनर्टन 23 में उद्धृत) - अवधारणाएं जो रूप और सामग्री के बीच विरोध को मिटा देती हैं (या विषय औरऑब्जेक्ट) और पूर्ण विकसित संरचनावाद, मनोविश्लेषण, और यहां तक ​​​​कि क्वांटम यांत्रिकी में अग्रभूमि और पृष्ठभूमि का पदानुक्रम - भाषाविज्ञान और लाक्षणिक विज्ञान में फर्डिनेंड डी सॉसर का काम अर्थ और संस्कृति के अध्ययन में एक संकेत क्षण को सीमित करता है।

रोनाल्ड श्लीफ़र

अनुलग्नक 2

फर्डिनेंड डी सौसुरे (अनुवाद)

स्विस भाषाविद् फर्डिनेंड डी सौसुरे (1857-1913) को आधुनिक भाषाविज्ञान का संस्थापक माना जाता है - भाषा की संरचना का वर्णन करने के उनके प्रयासों के लिए धन्यवाद, न कि व्यक्तिगत भाषाओं और शब्द रूपों का इतिहास। कुल मिलाकर, भाषाविज्ञान और साहित्यिक आलोचना में संरचनात्मक तरीकों की नींव और, काफी हद तक, बीसवीं शताब्दी की शुरुआत में उनके कार्यों में लाक्षणिकता रखी गई थी। यह साबित हो गया है कि जैक्स डेरिडा, मिशेल फौकॉल्ट, जैक्स लैकन, जूलिया क्रिस्टेवा, रोलैंड बार्थेस और अन्य के कार्यों में विकसित तथाकथित "पोस्ट-स्ट्रक्चरलिज्म" की विधियां और अवधारणाएं, सॉसर के भाषाई कार्यों पर वापस जाती हैं और देर से रोमन कविता के विपर्ययण रीडिंग। यह ध्यान दिया जाना चाहिए कि भाषाविज्ञान और भाषाई व्याख्या पर सॉसर का काम बौद्धिक विषयों की एक विस्तृत श्रृंखला को जोड़ने में मदद करता है - भौतिक विज्ञान से साहित्यिक नवाचारों, मनोविश्लेषण और बीसवीं शताब्दी की शुरुआत के दर्शन तक। ए जे ग्रीमास और जे कुर्ते "सेमीओटिक्स एंड लैंग्वेज" में लिखते हैं: "इंटरप्रिटेशन" शीर्षक के साथ एक विश्लेषणात्मक शब्दकोश नया प्रकार 20 वीं शताब्दी की शुरुआत में सॉसर की भाषाविज्ञान, हुसरल की घटना विज्ञान और फ्रायड के मनोविश्लेषण के साथ व्याख्या दिखाई दी। ऐसे मामले में, "व्याख्या किसी दिए गए सामग्री का एक ऐसे रूप में आरोपण नहीं है जिसमें अन्यथा एक की कमी होगी; बल्कि, यह एक पैराफ्रेश है जो किसी दिए गए लाक्षणिक प्रणाली के भीतर एक महत्वपूर्ण तत्व की समान सामग्री को दूसरे तरीके से तैयार करता है" (159 ) "व्याख्या" की इस समझ में, रूप और सामग्री अविभाज्य हैं; इसके विपरीत, प्रत्येक रूप अर्थपूर्ण अर्थ ("सार्थक रूप") से भरा होता है, इसलिए व्याख्या किसी अन्य संकेत प्रणाली में कुछ सार्थक की एक नई, समान रीटेलिंग प्रदान करती है।

संरचनावाद के प्रोग्रामेटिक कार्यों में से एक में क्लॉड लेवी-स्ट्रॉस द्वारा प्रस्तुत फॉर्म और सामग्री की एक समान समझ, ("स्ट्रक्चर एंड फॉर्म: रिफ्लेक्शंस ऑन द वर्क्स ऑफ व्लादिमीर प्रॉप"), सॉसर की मरणोपरांत प्रकाशित पुस्तक ए कोर्स इन में देखी जा सकती है। सामान्य भाषाविज्ञान (1916, ट्रांस।, 1959, 1983)। अपने जीवनकाल के दौरान, सौसुरे ने थोड़ा प्रकाशित किया, "पाठ्यक्रम" - उनका मुख्य कार्य - 1907-11 में सामान्य भाषा विज्ञान पर उनके व्याख्यान में भाग लेने वाले छात्रों के नोट्स से एकत्र किया गया था। पाठ्यक्रम में, सौसुरे ने भाषा के "वैज्ञानिक" अध्ययन का आह्वान किया, जो उन्नीसवीं शताब्दी के तुलनात्मक-ऐतिहासिक भाषाविज्ञान के विपरीत था। इस काम को पश्चिमी विचार की सबसे बड़ी उपलब्धियों में से एक माना जा सकता है: व्यक्तिगत शब्दों को आधार के रूप में भाषा के संरचनात्मक तत्वों के रूप में लेते हुए, ऐतिहासिक (या "डायक्रोनिक") भाषाविज्ञान ने पश्चिमी यूरोपीय भाषाओं की उत्पत्ति और विकास को एक से साबित किया। आम, इंडो-यूरोपीय भाषा - और एक पूर्व प्रोटो-इंडो-यूरोपीय।

यह शब्दों की अनूठी घटनाओं का अध्ययन है, सहवर्ती धारणा के साथ कि भाषा की मूल "इकाई" वास्तव में, इन "शब्द तत्वों" का सकारात्मक अस्तित्व है, जिस पर सॉसर ने सवाल उठाया था। उनका काम तुलनात्मक भाषाविज्ञान द्वारा अध्ययन की गई भाषा के बारे में कई तथ्यों को कम संख्या में प्रमेयों तक कम करने का एक प्रयास था। तुलनात्मक भाषाविज्ञान स्कूल XIXसेंचुरी, सौसुरे लिखती हैं, "भाषाविज्ञान का एक वास्तविक स्कूल बनाने में सफल नहीं हुई" क्योंकि "वह अध्ययन की वस्तु के सार को नहीं समझती थी" (3)। यह "सार", उनका तर्क है, न केवल व्यक्तिगत शब्दों में - भाषा के "सकारात्मक पदार्थ" - बल्कि औपचारिक कनेक्शन में भी है जो इन पदार्थों को अस्तित्व में रखने में मदद करते हैं।

सॉसर की भाषा का "परीक्षण" तीन मान्यताओं पर आधारित है। सबसे पहले, भाषा की वैज्ञानिक समझ ऐतिहासिक नहीं, बल्कि संरचनात्मक घटना पर आधारित है। इसलिए, उन्होंने भाषा की व्यक्तिगत घटनाओं - "भाषण की घटनाओं" के बीच अंतर किया, जिसे उन्होंने "पैरोल" के रूप में परिभाषित किया - और उचित, उनकी राय में, भाषा विज्ञान के अध्ययन की वस्तु, प्रणाली (कोड, संरचना) जो इन घटनाओं को नियंत्रित करती है। ("लैंग्वे")। इसके अलावा, इस तरह के एक व्यवस्थित अध्ययन के लिए, किसी भाषा के इतिहास के माध्यम से विकास के "डायक्रोनिक" अध्ययन के बजाय, एक निश्चित क्षण में भाषा के तत्वों के बीच संबंधों की "समकालिक" अवधारणा की आवश्यकता होती है।

यह परिकल्पना 1929 में रोमन जैकबसन को "संरचनावाद" कहने की अग्रदूत थी - एक सिद्धांत जहां "आधुनिक विज्ञान द्वारा जांच की गई किसी भी घटना को एक यांत्रिक संचय के रूप में नहीं माना जाता है, बल्कि एक संरचनात्मक पूरे के रूप में माना जाता है जिसमें रचनात्मक घटक सहसंबद्ध होता है। समारोह" ("रोमांटिक "711)। इस मार्ग में, जैकबसन ने ऐतिहासिक घटनाओं की "यांत्रिक" गणना के विपरीत, भाषा को एक संरचना के रूप में परिभाषित करने के लिए सॉसर के विचार को तैयार किया। इसके अलावा, जैकबसन ने एक और सौसुरियन धारणा विकसित की, जो संरचनात्मक भाषाविज्ञान का अग्रदूत बन गया: भाषा के मूल तत्वों का अध्ययन उनके कारणों से नहीं, बल्कि उनके कार्यों के संबंध में किया जाना चाहिए। अलग-अलग घटनाओं और घटनाओं (जैसे, व्यक्तिगत इंडो-यूरोपीय शब्दों की उत्पत्ति का इतिहास) का अध्ययन स्वयं नहीं, बल्कि एक ऐसी प्रणाली में किया जाना चाहिए जिसमें वे समान घटकों के साथ सहसंबद्ध हों। आसपास की वास्तविकता के साथ घटनाओं की तुलना में यह एक क्रांतिकारी मोड़ था, जिसके महत्व की तुलना दार्शनिक अर्नस्ट कैसिरर ने "गैलीलियो के विज्ञान से की थी, जिसने सत्रहवीं शताब्दी में भौतिक दुनिया के बारे में विचारों को बदल दिया।" ऐसा मोड़ , ग्रीमास और कुर्थे नोट के रूप में, "व्याख्या" के विचार को बदल देता है, फलस्वरूप, स्वयं स्पष्टीकरण। घटना की व्याख्या उनकी घटना के कारणों के संबंध में नहीं, बल्कि उस प्रभाव के संबंध में की जाने लगी जो उनके पास हो सकती है वर्तमान और भविष्य। व्याख्या किसी व्यक्ति के इरादों से स्वतंत्र नहीं रह गई है (इस तथ्य के बावजूद कि इरादे अवैयक्तिक हो सकते हैं, शब्द के फ्रायडियन अर्थ में "बेहोश")।

अपने भाषाविज्ञान में, सॉसर विशेष रूप से भाषाविज्ञान में शब्द की अवधारणा में परिवर्तन में इस मोड़ को दिखाता है, जिसे वह एक संकेत के रूप में परिभाषित करता है और इसके कार्यों के संदर्भ में वर्णन करता है। उनके लिए एक संकेत ध्वनि और अर्थ का संयोजन है, "संकेत और पदनाम" (66-67; रॉय हैरिस द्वारा 1983 के अंग्रेजी अनुवाद में - "संकेत" और "संकेत")। इस यौगिक की प्रकृति "कार्यात्मक" है (न तो एक और न ही अन्य तत्व एक दूसरे के बिना मौजूद हो सकते हैं); इसके अलावा, "एक दूसरे से गुण उधार लेता है" (8)। इस प्रकार, सॉसर भाषा के मुख्य संरचनात्मक तत्व को परिभाषित करता है - संकेत - और ऐतिहासिक भाषाविज्ञान के आधार को शब्दों के संकेतों की पहचान बनाता है, जिसके लिए विशेष रूप से कठोर विश्लेषण की आवश्यकता होती है। इसलिए, हम एक ही शब्द "पेड़" के विभिन्न अर्थों को समझ सकते हैं - इसलिए नहीं कि शब्द केवल कुछ गुणों का एक समूह है, बल्कि इसलिए कि इसे "संरचनात्मक संपूर्ण" में साइन सिस्टम में एक तत्व के रूप में परिभाषित किया गया है। भाषा में।

एकता की इस तरह की एक रिश्तेदार ("विशेषक") अवधारणा संरचनात्मक भाषाविज्ञान में भाषा के सभी तत्वों की अवधारणा को रेखांकित करती है। यह "स्वनिम" और "स्वनिम" की अवधारणा के विकास में, सौसुरियन भाषाविज्ञान की सबसे मूल खोज में विशेष रूप से स्पष्ट है। विशिष्ट सुविधाएं" भाषा: हिन्दी। फोनीम्स बोली जाने वाली और अर्थपूर्ण भाषा इकाइयों में सबसे छोटी हैं। वे न केवल भाषा में होने वाली ध्वनियाँ हैं, बल्कि "ध्वनि चित्र", सॉसर नोट करते हैं, जिन्हें देशी वक्ताओं द्वारा अर्थ के रूप में माना जाता है। (यह ध्यान दिया जाना चाहिए कि एल्मर होलेनस्टीन जैकबसन की भाषाविज्ञान कहते हैं, जो अपने मुख्य प्रावधानों, "अभूतपूर्व संरचनावाद" में सॉसर के विचारों और अवधारणाओं को जारी रखता है)। यही कारण है कि प्राग स्कूल ऑफ स्ट्रक्चरलिज्म के प्रमुख वक्ता, जान मुकारोवस्की ने 1937 में देखा कि "संरचना। . . एक अनुभवजन्य नहीं, बल्कि एक घटनात्मक अवधारणा; यह स्वयं परिणाम नहीं है, बल्कि सामूहिक चेतना (पीढ़ी, अन्य, आदि) के महत्वपूर्ण संबंधों का एक समूह है।" इसी तरह का विचार 1960 में फ्रांसीसी संरचनावाद के नेता लेवी-स्ट्रॉस द्वारा व्यक्त किया गया था: "संरचना में कोई निश्चित सामग्री नहीं है; यह अपने आप में अर्थपूर्ण है, और जिस तार्किक रचना में यह संलग्न है वह वास्तविकता की छाप है।

बदले में, ध्वन्यात्मकता, धारणा के लिए स्वीकार्य सबसे छोटे भाषाई तत्वों के रूप में, एक अलग अभिन्न "घटना संबंधी वास्तविकता" का प्रतिनिधित्व करते हैं। उदाहरण के लिए, अंग्रेजी में, ध्वनि "टी" को अलग-अलग उच्चारण किया जा सकता है, लेकिन सभी मामलों में, अंग्रेजी बोलने वाला व्यक्ति इसे "टी" के रूप में देखेगा। एस्पिरेटेड, उठा हुआ या नीचा, एक लंबी "टी" ध्वनि, आदि समान रूप से "टू" और "डू" शब्दों के अर्थ को अलग करेगा। इसके अलावा, भाषाओं के बीच अंतर ऐसे हैं कि एक भाषा में एक ध्वनि की किस्में दूसरी में विभिन्न स्वरों के अनुरूप हो सकती हैं; उदाहरण के लिए, अंग्रेजी में "एल" और "आर" अलग हैं, जबकि अन्य भाषाओं में वे एक ही फोनेम की किस्में हैं (जैसे अंग्रेजी "टी", आकांक्षा के साथ और बिना उच्चारण)। किसी भी प्राकृतिक भाषा की विशाल शब्दावली बहुत कम संख्या में स्वरों के संयोजन का एक समूह है। उदाहरण के लिए, अंग्रेजी में, लगभग एक लाख शब्दों के उच्चारण और लिखने के लिए केवल 40 स्वरों का उपयोग किया जाता है।

किसी भाषा की ध्वनियाँ सुविधाओं का एक व्यवस्थित रूप से व्यवस्थित समूह हैं। 1920-1930 के दशक में, सॉसर के बाद, जैकबसन और एन.एस. ट्रुबेट्सकोय ने स्वरों की "विशिष्ट विशेषताओं" का गायन किया। ये विशेषताएं भाषण के अंगों की संरचना पर आधारित हैं - जीभ, दांत, मुखर तार - सॉसर ने इसे "सामान्य भाषाविज्ञान के पाठ्यक्रम" में नोटिस किया है, और हैरिस इसे "शारीरिक ध्वन्यात्मकता" कहते हैं (बास्किन के पहले के अनुवाद में, शब्द "ध्वनिविज्ञान" " का उपयोग किया जाता है) - वे "गाँठ" में जुड़े हुए हैं ध्वनि बनाने के लिए एक दोस्त के खिलाफ दुर्ग। उदाहरण के लिए, अंग्रेजी में, "टी" और "डी" के बीच का अंतर "आवाज" (मुखर डोरियों का तनाव) की उपस्थिति या अनुपस्थिति है, और आवाज का स्तर जो एक स्वर को दूसरे से अलग करता है। इस प्रकार, ध्वन्यात्मकता को सॉसर द्वारा वर्णित सामान्य भाषा नियम का एक उदाहरण माना जा सकता है: "भाषा में केवल अंतर हैं।" इससे भी अधिक महत्वपूर्ण यह नहीं है: अंतर आमतौर पर उन सटीक स्थितियों को दर्शाता है जिनके बीच यह स्थित है; लेकिन भाषा में सटीक शर्तों के बिना केवल अंतर होते हैं। चाहे हम "पदनाम" या "संकेत" पर विचार कर रहे हों - भाषा में न तो अवधारणाएं हैं और न ही ध्वनियां जो भाषा प्रणाली के विकास से पहले मौजूद होतीं।

ऐसी संरचना में, भाषाई उपमाओं को उनके अंतर्निहित गुणों की सहायता से नहीं, बल्कि सिस्टम ("संरचनात्मक") संबंधों की सहायता से परिभाषित किया जाता है।

मैंने पहले ही उल्लेख किया है कि ध्वनिविज्ञान इसके विकास में सॉसर के विचारों पर निर्भर था। यद्यपि आधुनिक समय में भाषाई शरीर क्रिया विज्ञान का उनका विश्लेषण, हैरिस कहते हैं, "'मनोवैज्ञानिक' या 'कार्यात्मक' के विपरीत 'भौतिक' कहा जाएगा, पाठ्यक्रम में उन्होंने भाषा के कार्यात्मक विश्लेषण की दिशा और बुनियादी सिद्धांतों को स्पष्ट रूप से व्यक्त किया। उनके जीवनकाल के दौरान प्रकाशित उनका एकमात्र काम, मेमोइरे सुर ले सिस्टेम प्राइमिटिफ डेस वॉयलेस डान्स लेस लैंग्स इंडो-यूरोपीनेस (भारत-यूरोपीय भाषाओं में मूल स्वर प्रणाली पर नोट्स), 1878 में प्रकाशित, पूरी तरह से तुलनात्मक ऐतिहासिक भाषाविज्ञान के अनुरूप था। 19 वीं सदी। फिर भी, इस काम में, जोनाथन कलर कहते हैं, सॉसर ने "ऐतिहासिक पुनर्निर्माण के साथ भी, परस्पर जुड़ी घटनाओं की एक प्रणाली के रूप में भाषा के विचार की फलदायीता दिखाई।" स्वरों के बीच संबंधों का विश्लेषण करते हुए, इंडो-यूरोपीय समूह की आधुनिक भाषाओं में स्वरों के प्रत्यावर्तन की व्याख्या करते हुए, सॉसर ने सुझाव दिया कि कई अलग-अलग ध्वनियों "ए" के अलावा, औपचारिक रूप से वर्णित अन्य स्वर भी होने चाहिए। "क्या सॉसर के काम को विशेष रूप से प्रभावशाली बनाता है," कल्लर ने निष्कर्ष निकाला, "यह है कि लगभग 50 साल बाद, जब हित्ती क्यूनिफॉर्म की खोज और व्याख्या की गई थी, तो "एच" द्वारा निरूपित लिखित रूप में एक फोनेम पाया गया था, जिसने सॉसर की भविष्यवाणी के अनुसार व्यवहार किया था। औपचारिक विश्लेषण के माध्यम से, उन्होंने खोज की जिसे अब इंडो-यूरोपीय भाषाओं में गुटुरल ध्वनि के रूप में जाना जाता है।

संकेतों की एक रिश्तेदार (विशेषक) परिभाषा की अवधारणा में, पाठ्यक्रम में स्पष्ट और निहित दोनों, संरचनात्मक भाषाविज्ञान की एक तीसरी प्रमुख धारणा है, जिसे सॉसर ने "संकेत की मनमानी प्रकृति" कहा है। इसका मतलब यह है कि भाषा में ध्वनि और अर्थ के बीच संबंध किसी भी चीज से प्रेरित नहीं होता है: कोई भी "अर्बर" शब्द और "पेड़" शब्द को "पेड़" की अवधारणा से आसानी से जोड़ सकता है। इसके अलावा, इसका मतलब है कि ध्वनि भी मनमानी है: कोई "पेड़" की अवधारणा को छाल (ताड़ के पेड़ों को छोड़कर) और आकार ("कम लकड़ी के पौधों" - झाड़ियों को छोड़कर) की उपस्थिति से परिभाषित कर सकता है। इससे यह स्पष्ट होना चाहिए कि मेरे द्वारा प्रस्तुत सभी मान्यताओं को कम से कम महत्वपूर्ण में विभाजित नहीं किया गया है: उनमें से प्रत्येक - संकेतों की प्रणालीगत प्रकृति (भाषा के "तुल्यकालिक" अध्ययन में सबसे अधिक समझ में आता है), उनके रिश्तेदार (विशेषक) सार, संकेतों की मनमानी प्रकृति - बाकी से आती है।

इस प्रकार, सौसुरियन भाषाविज्ञान में, अध्ययन की गई घटना को भाषा की तुलना और विरोध के एक सेट के रूप में समझा जाता है। भाषा दोनों शब्दों के अर्थ (पदनाम) और उनके परिणाम (संचार) की अभिव्यक्ति है - और ये दोनों कार्य कभी मेल नहीं खाते (देखें श्लीफ़र की "भाषा का विघटन")। हम व्याख्या के नवीनतम संस्करण में ग्रीमास और कुर्ते द्वारा वर्णित रूप और सामग्री के विकल्प को देख सकते हैं: भाषाई विरोधाभास इसकी संरचनात्मक इकाइयों को परिभाषित करते हैं, और ये इकाइयां एक निश्चित सार्थक सामग्री बनाने के लिए क्रमिक स्तरों पर बातचीत करती हैं। चूंकि भाषा के तत्व यादृच्छिक हैं, इसलिए न तो इसके विपरीत और न ही संयोजन आधार हो सकते हैं। इसका मतलब यह है कि एक भाषा में, विशिष्ट विशेषताएं समझ के एक अलग स्तर पर ध्वन्यात्मक विपरीत बनाती हैं, स्वरों को विपरीत मर्फीम, मर्फीम - शब्दों में, शब्दों - वाक्यों आदि में जोड़ा जाता है। किसी भी मामले में, एक संपूर्ण स्वर, शब्द, वाक्य, आदि। इसके भागों के योग से अधिक है (जैसे कि सॉसर के उदाहरण में पानी, हाइड्रोजन और ऑक्सीजन के संयोजन से अधिक है)।

"सामान्य भाषाविज्ञान के पाठ्यक्रम" की तीन मान्यताओं ने सौसुर को बीसवीं शताब्दी के एक नए विज्ञान के विचार के लिए प्रेरित किया, जो भाषाविज्ञान से अलग है, "समाज में संकेतों का जीवन" का अध्ययन करता है। सॉसर ने इस विज्ञान को अर्धविज्ञान कहा (ग्रीक से "सेमियन" - एक संकेत)। लाक्षणिकता का "विज्ञान", जो 1920 और 1930 के दशक में पूर्वी यूरोप में और 1950 और 1960 के दशक में पेरिस में विकसित हुआ, ने भाषा और भाषाई संरचनाओं के अध्ययन को इन संरचनाओं के संदर्भ में रचित (या तैयार) साहित्यिक खोज में विस्तारित किया। इसके अलावा, अपने करियर की सांझ में, सामान्य भाषाविज्ञान में अपने पाठ्यक्रम के समानांतर, सॉसर देर से रोमन कविता के "अर्ध-संबंधी" विश्लेषण में लगे हुए थे, उचित नामों के जानबूझकर रचित विपर्यय की खोज करने की कोशिश कर रहे थे। यह विधि कई मायनों में अपने भाषाई विश्लेषण में तर्कवाद के विपरीत थी: यह एक प्रयास था, जैसा कि सौसुरे 99 नोटबुक में से एक में लिखते हैं, सिस्टम में "संभावना" की समस्या का अध्ययन करने के लिए, जो "हर चीज का आधार बन जाता है। " इस तरह की जांच, सॉसर खुद दावा करती है, संभाव्यता के "वास्तविक पक्ष" पर ध्यान केंद्रित करने में मदद करती है; जीन स्टारोबिंस्की के अनुसार, "कुंजी शब्द" जिसके लिए सॉसर एक विपर्यय की तलाश कर रहा है, "कवि के लिए एक उपकरण है, न कि कविता के लिए जीवन का स्रोत। कविता मुख्य शब्द की ध्वनियों को उलटने का काम करती है। स्टारोबिंस्की के अनुसार, इस विश्लेषण में, "सॉसुरे छिपे हुए अर्थों की खोज में तल्लीन नहीं करता है।" इसके विपरीत, उनके कार्यों में, चेतना से संबंधित प्रश्नों से बचने की इच्छा ध्यान देने योग्य है: "चूंकि कविता न केवल शब्दों में व्यक्त की जाती है, बल्कि यह भी कि ये शब्द क्या जन्म देते हैं, यह चेतना के नियंत्रण से परे है और केवल पर निर्भर करता है भाषा के नियम। ”

देर से रोमन कविता में उचित नामों का अध्ययन करने के लिए सॉसर का प्रयास (स्वेतन टोडोरोव ने इसे "एक शब्द ... केवल इसके लिखे जाने से पहले" का संक्षिप्त नाम कहा) उनके भाषाई विश्लेषण के घटकों में से एक पर जोर देता है - संकेतों की मनमानी प्रकृति, साथ ही साथ सौसुरियन भाषाविज्ञान का औपचारिक सार ("भाषा," उनका दावा है, "रूप का सार, घटना नहीं"), जो अर्थ का विश्लेषण करने की संभावना को बाहर करता है। टोडोरोव ने निष्कर्ष निकाला है कि आज सॉसर के लेखन प्रतीकों का अध्ययन करने के लिए उनकी अनिच्छा में उल्लेखनीय रूप से सुसंगत प्रतीत होते हैं [ऐसी घटनाएं जिनका एक अच्छी तरह से परिभाषित अर्थ है]। . . . विपर्यय की खोज करते हुए, सॉसर केवल दोहराव पर ध्यान देता है, लेकिन पिछले विकल्पों पर नहीं। . . . निबेलुन्जेनलीड का अध्ययन करते हुए, वह प्रतीकों को केवल गलत रीडिंग के लिए असाइन करने के लिए परिभाषित करता है: यदि वे अनजाने में हैं, तो प्रतीक मौजूद नहीं हैं। आखिरकार, सामान्य भाषाविज्ञान पर अपने लेखन में, वह एक अर्धविज्ञान के अस्तित्व की धारणा बनाता है जो न केवल भाषाई संकेतों का वर्णन करता है; लेकिन यह धारणा इस तथ्य से सीमित है कि अर्धविज्ञान केवल यादृच्छिक, मनमानी संकेतों का वर्णन कर सकता है।

यदि यह वास्तव में ऐसा है, तो यह केवल इसलिए है क्योंकि वह किसी वस्तु के बिना "इरादे" की कल्पना नहीं कर सकता था; वे रूप और सामग्री के बीच की खाई को पूरी तरह से नहीं भर सके - उनके लेखन में यह एक प्रश्न बन गया। इसके बजाय, उन्होंने "भाषाई वैधता" की ओर रुख किया। एक ओर, इतिहास और व्यक्तिपरक अनुमानों पर आधारित उन्नीसवीं सदी की अवधारणाओं और इन अवधारणाओं के आधार पर आकस्मिक व्याख्या के तरीकों के बीच खड़े होकर, और दूसरी ओर, संरचनावादी अवधारणाएं, जिन्हें लेवी-स्ट्रॉस ने "एक उत्कृष्ट अभिनेता के बिना कांटियनवाद" कहा। "- रूप और सामग्री (विषय और वस्तु) के बीच विरोध को मिटाना, संरचनावाद, मनोविश्लेषण और यहां तक ​​​​कि क्वांटम यांत्रिकी में अर्थ और उत्पत्ति, भाषा विज्ञान और लाक्षणिक विज्ञान पर फेरलिनेंड डी सॉसर के लेखन भाषा और संस्कृति में अर्थों के अध्ययन में एक महत्वपूर्ण मोड़ है।

रोनाल्ड श्लीफ़र

साहित्य

1. एडमोनी वी.जी. व्याकरण के सिद्धांत की मूल बातें / वी.जी. अदमोनी; यूएसएसआर एकेडमी ऑफ साइंसेज।-एम .: नौका, 1964.-104 पी।

3. अरापोव, एम.वी., हर्ट्स, एम.एम. भाषाविज्ञान में गणितीय तरीके। एम।, 1974।

4. अर्नोल्ड आई.वी. आधुनिक अंग्रेजी में शब्द की शब्दार्थ संरचना और इसके अध्ययन की पद्धति। /आई.वी. अर्नोल्ड-एल।: शिक्षा, 1966. - 187 पी।

6. बशलीकोव ए.एम. स्वचालित अनुवाद प्रणाली। / हूँ। बैशलीकोव, ए.ए. सोकोलोव। - एम .: एलएलसी "फिमा", 1997. - 20 पी।

7. बाउडौइन डी कर्टेने: सैद्धांतिक विरासत और आधुनिकता: अंतर्राष्ट्रीय वैज्ञानिक सम्मेलन / एड.आई.जी. की रिपोर्ट के सार। कोंड्राटिव। - कज़ान: केजीयू, 1995. - 224 पी।

8. ए वी ग्लैडकी, गणितीय भाषाविज्ञान के तत्व। /। ग्लैडकी ए.वी., मेलचुक आई.ए. -एम।, 1969. - 198 पी।

9. गोलोविन, बी.एन. भाषा और सांख्यिकी। /बी.एन. गोलोविन - एम।, 1971. - 210 पी।

10. ज्वेगिनत्सेव, वी.ए. सैद्धांतिक और अनुप्रयुक्त भाषाविज्ञान। / वी.ए. ज़ेविगंत्सेव - एम।, 1969। - 143 पी।

11. कासेविच, वी.बी. शब्दार्थ। वाक्य - विन्यास। आकृति विज्ञान। // वी.बी. कासेविच - एम।, 1988. - 292 पी।

12. लेकोम्त्सेव यू.के. भाषाविज्ञान की औपचारिक भाषा का परिचय / यू.के. लेकोम्त्सेव। - एम .: नौका, 1983, 204 पी।, बीमार।

13. बीसवीं सदी के अंत में बॉडॉइन डी कर्टेने की भाषाई विरासत: अंतर्राष्ट्रीय वैज्ञानिक और व्यावहारिक सम्मेलन की रिपोर्ट का सार 15-18 मार्च, 2000। - क्रास्नोयार्स्क, 2000. - 125 पी।

मतवीवा जी.जी. छिपे हुए व्याकरणिक अर्थ और वक्ता के सामाजिक व्यक्ति ("चित्र") की पहचान / जी.जी. मतवेव। - रोस्तोव, 1999. - 174 पी।

14. मेलचुक, आई.ए. भाषाई मॉडल "अर्थ" के निर्माण में अनुभव<-->पाठ" / आई.ए. मेलचुक। - एम।, 1974. - 145 पी।

15. नेलुबिन एल.एल. अनुवाद और अनुप्रयुक्त भाषाविज्ञान / एल.एल. नेलुबिन। - एम .: हायर स्कूल, 1983. - 207 पी।

16. भाषा अनुसंधान के सटीक तरीकों पर: तथाकथित "गणितीय भाषाविज्ञान" / ओ.एस. अखमनोवा, आई.ए. मेलचुक, ई.वी. पादुचेवा और अन्य - एम।, 1961। - 162 पी।

17. पियोत्रोव्स्की एल.जी. गणितीय भाषाविज्ञान: पाठ्यपुस्तक / एल.जी. पियोत्रोव्स्की, के.बी. बेकटेव, ए.ए. पिओत्रोव्स्काया। - एम .: हायर स्कूल, 1977. - 160 पी।

18. वह है। पाठ, मशीन, व्यक्ति। - एल।, 1975. - 213 पी।

19. वह है। एप्लाइड भाषाविज्ञान / एड। एएस गेर्डा। - एल।, 1986. - 176 पी।

20. रेवज़िन, आई.आई. भाषा मॉडल। एम।, 1963। रेवज़िन, आई.आई. आधुनिक संरचनात्मक भाषाविज्ञान। समस्याएं और तरीके। एम।, 1977. - 239 पी।

21. रेवज़िन, आई.आई., रोज़ेंट्सविग, वी.यू। सामान्य और मशीनी अनुवाद के मूल सिद्धांत / रेवज़िन आई.आई., रोज़ेंट्सविग, वी.यू. - एम।, 1964. - 401 पी।

22. स्लीसुरेवा एन.ए. आधुनिक भाषाविज्ञान के प्रकाश में एफ. डी सौसुरे का सिद्धांत / एन.ए. स्लीसुरेवा। - एम .: नौका, 1975. - 156 पी।

23. उल्लू, एल.जेड. विश्लेषणात्मक भाषाविज्ञान / एल.जेड. उल्लू - एम।, 1970. - 192 पी।

24. सॉसर एफ. डी. सामान्य भाषाविज्ञान पर नोट्स / एफ डी सौसुरे; प्रति. फ्र से। - एम .: प्रगति, 2000. - 187 पी।

25. वह है। सामान्य भाषाविज्ञान का पाठ्यक्रम / प्रति। फ्र से। - येकातेरिनबर्ग, 1999. -426 पी।

26. भाषण सांख्यिकी और स्वचालित पाठ विश्लेषण / एड। ईडी। आर.जी. पियोत्रोव्स्की। एल।, 1980. - 223 पी।

27. स्टोल, पी. सेट्स। तर्क। स्वयंसिद्ध सिद्धांत। / आर। स्टोल; प्रति. अंग्रेज़ी से। - एम।, 1968। - 180 पी।

28. टेनियर, एल. फंडामेंटल्स संरचनात्मक वाक्य रचना. एम।, 1988।

29. यूबिन आई.आई. यूएसएसआर / आई.आई. में अनुवाद गतिविधियों का स्वचालन। उबिन, एल.यू. कोरोस्टेलेव, बी.डी. तिखोमीरोव। - एम।, 1989. - 28 पी।

30. फॉरे, आर।, कोफमैन, ए।, डेनिस-पापिन, एम। आधुनिक गणित। एम।, 1966।

31. शेनक, आर। वैचारिक जानकारी का प्रसंस्करण। एम।, 1980।

32. शिखानोविच, यू.ए. आधुनिक गणित का परिचय (प्रारंभिक अवधारणाएं)। एम., 1965

33. शचेरबा एल.वी. गुणात्मक और मात्रात्मक शब्दों में रूसी स्वर / एल.वी. शचेरबा - एल .: नौका, 1983. - 159 पी।

34. अब्दुल्ला-ज़ादे एफ। दुनिया के नागरिक // स्पार्क - 1996. - नंबर 5। - पी.13

35. वी.ए. उसपेन्स्की। आंद्रेई निकोलाइविच कोलमोगोरोव के लाक्षणिक संदेशों के लिए "नई साहित्यिक समीक्षा" के पाठकों के लिए प्रारंभिक। - नई साहित्यिक समीक्षा। -1997। - नंबर 24. - एस। 18-23

36. पर्लोव्स्की एल। चेतना, भाषा और संस्कृति। - ज्ञान शक्ति है। -2000। 4 - एस। 20-33

परिचय? व्याख्यान अनुवाद सिद्धांत

            उस समय से जब 1904 में बॉडौइन डी कर्टेने ने पहली बार भाषाविज्ञान में गणितीय विधियों को लागू करने की आवश्यकता पर अपनी राय व्यक्त की थी ( कोंड्राशोव एन.ए., 1979, 170), उन्हें इस्तेमाल करने के पहले गंभीर प्रयास शुरू होने से पहले एक लंबा समय बीत गया। लेकिन धीरे-धीरे भाषाविज्ञान में गणितीय विधियों ने सबसे विविध अनुप्रयोग पाया। भाषाविज्ञान की एक पूरी शाखा भी थी - गणितीय भाषाविज्ञान ( लेसोखिन एम.एम., 1982 और अन्य)। ध्वन्यात्मकता और वाक्य रचना में, संभाव्यता सिद्धांत में ज्ञात मार्कोव प्रक्रियाओं के उपयोग की बहुत संभावनाएं हैं। ऐतिहासिक और में तुलनात्मक भाषाविज्ञान, जो हमें सबसे अधिक रूचि देता है, ग्लोटोक्रोनोलॉजी के तरीके विकसित किए जा रहे हैं, जिनमें से एक मौरिस स्वदेश (मौरिस स्वदेश, 1960-1) द्वारा प्रस्तावित किया गया था। उन्होंने स्वीकार किया कि सभी भाषाओं की मूल शब्दावली का एक निश्चित हिस्सा एक निश्चित शाब्दिक कोर बनाता है, जो अपेक्षाकृत स्थिर होता है, क्योंकि यह स्थिर, लेकिन बहुत धीमी गति से बदलता है, लगभग उसी तरह जैसे रेडियोधर्मी क्षय होता है। यदि हम उन शब्दों का प्रतिशत जानते हैं जो एक निश्चित समय के लिए भाषा में संरक्षित हैं, तो हम शाब्दिक संरचना में परिवर्तन के लिए स्थिर दर की गणना कर सकते हैं, जो कि एक स्थिर मूल्य के बावजूद, अलग-अलग भाषाओं के लिए थोड़ा भिन्न हो सकता है और अलग-अलग हो सकता है। उनके विकास की अवधि। उन्होंने शब्दों के शाब्दिक मूल की एक सूची तैयार की, पहले 100 की मात्रा में, और बाद में 200 शब्दों में, और इस कोर के शब्दों के प्रतिशत की तुलना करके जो निकट से संबंधित भाषाओं के जोड़े में संरक्षित थे, उन्होंने बीता हुआ समय की गणना करने की कोशिश की जब से ये भाषाएं एक दूसरे से अलग हुई हैं। हालाँकि, विभिन्न भाषाओं और युगों के लिए भाषा परिवर्तन की गति वास्तव में बहुत भिन्न होती है। Vl.Georgiev के अनुसार, "आदिम व्यवस्था के तहत, सामाजिक जीवन और भाषा में परिवर्तन की प्रक्रिया धीमी है, आगे हम सहस्राब्दियों की गहराई में प्रवेश करते हैं: के लिए कम से कम परिवर्तनतब जिस चीज की जरूरत थी, वह सदियों की नहीं, बल्कि सहस्राब्दियों की थी" ( जॉर्जीव वी.एल., 1958, 243)। इसलिए, यह संभावना है कि स्वदेश द्वारा प्राप्त गणना परिणामों ने स्पष्ट तथ्यों का खंडन किया, और वैज्ञानिक ने अपनी पद्धति में सुधार करने की कोशिश की, लेकिन कोई फायदा नहीं हुआ ( स्वदेश मॉरिस, 1960-2)। उनका विचार निश्चित रूप से बहुत दिलचस्प था, लेकिन शाब्दिक कोर में परिवर्तन की दर स्थिरांक निर्धारित करने की कठिनाई और इस कोर के शब्दों की एक सूची संकलित करने की मौलिक असंभवता के कारण इसका कार्यान्वयन असंभव था जो सभी भाषाओं के लिए सार्वभौमिक हो सकता है। बिना किसी अपवाद के दुनिया के। इन समस्याओं को हल करने की असंभवता को हैरी होयर ने सिद्ध किया ( होयर हैरी, 1 9 60) और वी.ए. ज्वेगिनत्सेव, जिन्होंने लिखा:


            जब एम. स्वदेश सभी भाषाओं के लिए उपयुक्त "प्रयोगात्मक सूची" संकलित करने और इसके संकलन के लिए सार्वभौमिक नियम तैयार करने का प्रयास करता है, तो वह खुद को एक ऐसा कार्य निर्धारित करता है जिसे वास्तव में निष्पादित नहीं किया जा सकता है "(ज़्वेगिनत्सेव वी.ए., 1960, तेरह) .


           साथ ही, अलग-अलग भाषाओं की उम्र निर्धारित करने का एक दिलचस्प प्रयास एम.वी.अरापोव और एम.एम.हर्ट्ज़ द्वारा किया गया था। उन्होंने खुद को "शब्दकोश परिवर्तनों के गणितीय मॉडल का निर्माण करने के लिए और इस मॉडल के आधार पर, सैद्धांतिक रूप से एक शब्द की घटना के समय और आवृत्ति शब्दकोश में इसकी रैंक के बीच संबंध प्राप्त करने के लिए" कार्य निर्धारित किया है ( अरापोव एम.वी., हर्ट्स एम.एम., 1974, 3)। इस मॉडल के साथ, उन्होंने अलग, संबंधित भाषाओं की आयु की गणना करने की आशा की। ऐसा करने के लिए, उन्होंने एक अनुभवजन्य सूत्र प्रस्तावित किया जो किसी दिए गए समय पर किसी शब्द के प्रकट होने की संभावना का वर्णन करता है। इस सूत्र की कुंजी एक निश्चित स्थिरांक है, जो स्वयं विभिन्न कालानुक्रमिक वर्गों और विभिन्न भाषाओं के लिए बदल सकता है, लेकिन विभिन्न अवधियों में एक भाषा के विकास की दर, जैसा कि पहले ही उल्लेख किया गया है, बहुत भिन्न हो सकती है, और अब हमारे पास नहीं हो सकता है इन विशेषताओं के बारे में थोड़ा सा विचार। प्रतिनिधित्व। लेखकों ने अपनी पद्धति का निष्पक्ष मूल्यांकन किया, यह देखते हुए कि वे केवल इसकी क्षमताओं का प्रदर्शन करना चाहते थे, क्योंकि स्थिरांक की गणना करने के लिए, एक ही विधि के अनुसार आवृत्ति शब्दकोशों को संकलित करना आवश्यक है, और ऐतिहासिक शब्दावली को विकसित करना होगा ताकि यह कम से कम एक सदी के लिए सटीकता के साथ एक नए शब्द के प्रकट होने के क्षण को ठीक करना संभव बना सकता है। "चूंकि इन दोनों आवश्यकताओं को पूरा नहीं किया गया है ... अलग-अलग भाषाओं के परिवर्तन की दर पर डेटा तुलनीय नहीं है" ( अरापोव एम.वी., हर्ट्स एम.एम., 1974, 56)। इसलिए, विधि अभी भी लागू होने की प्रतीक्षा कर रही है।

            भाषाओं के बीच रिश्तेदारी की मात्रा को मापने का पहला प्रयास 1927 में जे. चेकानोव्स्की द्वारा किया गया था। उन्होंने 1888 में ईबी टेलर द्वारा मानवशास्त्रीय अनुसंधान के अभ्यास में पेश किए गए दो संघों की समानता के मूल्यांकन के लिए गणितीय स्वतंत्रता मानदंड का उपयोग करने की कोशिश की। इस पद्धति का उपयोग करते हुए, पोलिश शोधकर्ता ने संबंधों की डिग्री प्रदर्शित की स्लाव भाषाएं, और बाद में कुछ इंडो-यूरोपीय ( चेकानोव्स्की जान, 1957, 71)। सुविधाओं की मनमानी पसंद और उनमें से कुछ की दोहरी गणना करने की आवश्यकता के कारण अधिकांश भाषाविदों द्वारा इस पद्धति को स्वीकार नहीं किया गया था ( पोपोव्स्का-ताबोरस्का हन्ना, 1991, 34)। संघों की समानता का आकलन करने के लिए अन्य तरीके भी हैं, जो दो वस्तुओं में से एक में एक निश्चित विशेषता की उपस्थिति को ध्यान में रखते हैं, जो दूसरी वस्तु में अनुपस्थित है।

            हालांकि, शब्दावली की तुलना करके भाषाओं के संबंधों के अध्ययन के लिए, वे अस्वीकार्य हैं, क्योंकि वास्तविकता में एक विशेषता की अनुपस्थिति का मतलब केवल हमारे निपटान में इसकी अनुपस्थिति हो सकता है, लेकिन वास्तव में यह पहले भी मौजूद हो सकता था। या अब मौजूद है, लेकिन वैज्ञानिक शोधकर्ताओं द्वारा दर्ज नहीं किया गया है। पुरातत्व और नृविज्ञान में, इस तरह के तरीकों को आवेदन मिल सकता है, क्योंकि वहां हम भौतिक वस्तुओं के साथ काम कर रहे हैं जो पर्याप्त रूप से उनके मूल रूप का एक विचार देते हैं, लेकिन ऐतिहासिक भाषाविज्ञान में हम कभी भी यह सुनिश्चित नहीं कर सकते कि शोध की वस्तु में कुछ संकेत नहीं हैं। सुदूर अतीत। इसलिए, भाषाविज्ञान में, नियम लागू होता है: "केवल सकारात्मक तथ्यों का प्रमाणिक मूल्य होता है।"

           बाद में चेकानोव्स्की के विचारों को एक निश्चित अर्थ में एक अन्य पोलिश शोधकर्ता डब्ल्यू मांज़ाक द्वारा जारी रखा गया था, जो मौलिक अवधारणा का पालन करते हैं: भाषाओं की रिश्तेदारी और उनकी भौगोलिक स्थिति के बीच एक निश्चित संबंध है ( मांज़ाक विटोल्ड, 1981, 138)। वह गॉथिक, ओल्ड बल्गेरियाई और लिथुआनियाई में आम शब्दों की संख्या की तुलना करता है, इन भाषाओं में लिखे गए बाइबिल के ग्रंथों का विशेष रूप से उपयोग करते हुए, यह मानते हुए कि वे क्रमशः जर्मनिक, स्लाव और बाल्टिक भाषाओं के बहुत करीब हैं, उनके दूसरे के आधार पर सिद्धांत: व्याकरण और शब्दकोशों में जो पाया जा सकता है उसे गिनने से अक्सर गलत निष्कर्ष निकल सकते हैं, जबकि ग्रंथों में निहित की गिनती आपको सत्य की खोज करने की अनुमति देती है। यहां उनके भाषाई सिद्धांतों पर विचार करने का स्थान नहीं है, खासकर जब से पोपोव्स्का-ताबोरस्का पहले ही ऐसा कर चुके हैं ( पोपोव्स्का-ताबोरस्का हन्ना, 1991, 35-35, 94-97), लेकिन शोध के गणितीय पक्ष को कुछ टिप्पणियों की आवश्यकता है। तीन भाषाओं से प्राप्त आंकड़ों के आधार पर स्लाव के पैतृक घर की भौगोलिक स्थिति को जोड़ना आम तौर पर असंभव है, क्योंकि, लाक्षणिक रूप से, एक समीकरण में एक से अधिक अज्ञात हैं। एक विमान पर तीन भाषाओं का सही लेआउट प्राप्त करने के बाद, हमें ठीक से पता होना चाहिए कि इनमें से कम से कम एक भाषा का निर्माण कहाँ हुआ था और यह सुनिश्चित करना चाहिए कि शेष भाषाओं में से एक का क्षेत्र इसमें है उससे एक निश्चित दिशा। इसके अलावा, किसी तरह समय का निर्धारण करना भी आवश्यक है, क्योंकि समय के दौरान तीनों भाषाओं के बोलने वाले अपनी बस्तियों के स्थानों को एक से अधिक बार बदल सकते हैं और खुद को एक-दूसरे के सापेक्ष अलग-अलग पदों पर पा सकते हैं। इन भाषाओं के लैटिन के साथ संबंधों के अध्ययन को जोड़ने से, जैसा कि मांकज़क करता है, भी थोड़ा बदलता है, क्योंकि प्राथमिकता मानने का कोई कारण भी नहीं है कि अस्तित्व के दौरान जर्मनिक, स्लाव और बाल्टिक भाषाओं का गठन किया गया था। रोमन साम्राज्य के।

परिचय

अध्याय 1. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास

1.1. 19वीं - 20वीं सदी के मोड़ पर संरचनात्मक भाषाविज्ञान का गठन

1.2. बीसवीं शताब्दी के उत्तरार्ध में भाषाविज्ञान में गणितीय विधियों का अनुप्रयोग

अध्याय 2. भाषाविज्ञान में गणित के प्रयोग के चुनिंदा उदाहरण

2.1. मशीन अनुवाद

2.2.भाषा सीखने में सांख्यिकीय तरीके

2.3. औपचारिक तर्क के तरीकों से भाषा सीखना

2.4. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग की संभावनाएँ

निष्कर्ष

साहित्य

परिशिष्ट 1. रोनाल्ड श्लीफर। फर्डिनेंड डी सौसुरे

परिशिष्ट 2. फर्डिनेंड डी सॉसर (अनुवाद)

परिचय

20वीं शताब्दी में ज्ञान के विभिन्न क्षेत्रों की अंतःक्रिया और अंतर्प्रवेश की दिशा में एक सतत प्रवृत्ति रही है। अलग-अलग विज्ञानों के बीच की सीमाएँ धीरे-धीरे धुंधली होती जा रही हैं; मानसिक गतिविधि की अधिक से अधिक शाखाएँ हैं जो मानवीय, तकनीकी और प्राकृतिक विज्ञान ज्ञान के "जंक्शन पर" हैं।

आधुनिकता की एक अन्य स्पष्ट विशेषता संरचनाओं और उनके घटक तत्वों का अध्ययन करने की इच्छा है। इसलिए, वैज्ञानिक सिद्धांत और व्यवहार दोनों में, गणित को एक बढ़ता हुआ स्थान दिया जाता है। एक ओर, तर्क और दर्शन के साथ, दूसरी ओर, सांख्यिकी (और, परिणामस्वरूप, सामाजिक विज्ञान के साथ) के संपर्क में आने से, गणित उन क्षेत्रों में गहराई से और गहराई से प्रवेश करता है जो लंबे समय तक विशुद्ध रूप से माने जाते थे। "मानवतावादी", उनकी अनुमानी क्षमता का विस्तार (प्रश्न का उत्तर "कितना" अक्सर "क्या" और "कैसे" सवालों के जवाब देने में मदद करेगा)। भाषाविज्ञान कोई अपवाद नहीं था।

मेरे पाठ्यक्रम कार्य का उद्देश्य गणित और भाषाविज्ञान की ऐसी शाखा जैसे भाषाविज्ञान के बीच संबंध को संक्षेप में उजागर करना है। 1950 के दशक से, भाषाओं की संरचना (प्राकृतिक और कृत्रिम दोनों) का वर्णन करने के लिए एक सैद्धांतिक उपकरण बनाने के लिए भाषाविज्ञान में गणित का उपयोग किया गया है। हालांकि, यह कहा जाना चाहिए कि उसे तुरंत अपने लिए ऐसा व्यावहारिक अनुप्रयोग नहीं मिला। प्रारंभ में, भाषाविज्ञान की मूल अवधारणाओं को स्पष्ट करने के लिए भाषाविज्ञान में गणितीय विधियों का उपयोग किया जाने लगा, हालांकि, कंप्यूटर प्रौद्योगिकी के विकास के साथ, इस तरह के सैद्धांतिक आधार को व्यवहार में लागू करना शुरू हो गया। मशीनी अनुवाद, मशीन सूचना पुनर्प्राप्ति, स्वचालित पाठ प्रसंस्करण जैसे कार्यों के समाधान के लिए भाषा के लिए एक मौलिक रूप से नए दृष्टिकोण की आवश्यकता होती है। भाषाविदों को इस सवाल का सामना करना पड़ा: भाषाई पैटर्न को उस रूप में प्रस्तुत करना कैसे सीखें जिसमें उन्हें सीधे प्रौद्योगिकी पर लागू किया जा सके। शब्द "गणितीय भाषाविज्ञान", जो हमारे समय में लोकप्रिय है, किसी भी भाषाई शोध को संदर्भित करता है जो सटीक विधियों का उपयोग करता है (और विज्ञान में सटीक विधियों की अवधारणा हमेशा गणित से निकटता से संबंधित होती है)। पिछले वर्षों के कुछ वैज्ञानिकों का मानना ​​​​है कि अभिव्यक्ति को एक शब्द के पद तक नहीं बढ़ाया जा सकता है, क्योंकि इसका मतलब कोई विशेष "भाषाविज्ञान" नहीं है, बल्कि भाषा अनुसंधान विधियों की सटीकता और विश्वसनीयता में सुधार, सुधार पर केंद्रित एक नई दिशा है। . भाषाविज्ञान मात्रात्मक (बीजगणितीय) और गैर-मात्रात्मक दोनों तरीकों का उपयोग करता है, जो इसे गणितीय तर्क के करीब लाता है, और, परिणामस्वरूप, दर्शन के लिए, और यहां तक ​​​​कि मनोविज्ञान के लिए भी। यहां तक ​​​​कि श्लेगल ने भाषा और चेतना की बातचीत का उल्लेख किया, और फर्डिनेंड डी सौसुरे, बीसवीं शताब्दी की शुरुआत के एक प्रमुख भाषाविद् (मैं बाद में भाषा विज्ञान में गणितीय विधियों के विकास पर उनके प्रभाव के बारे में बताऊंगा), भाषा की संरचना को इसके संबंधित के साथ जोड़ा। लोगों को। आधुनिक शोधकर्ता एल। पर्लोव्स्की राष्ट्रीय मानसिकता की विशेषताओं के साथ भाषा की मात्रात्मक विशेषताओं (उदाहरण के लिए, लिंग, मामलों की संख्या) की पहचान करते हुए आगे बढ़ते हैं (इस पर खंड 2.2, "भाषाविज्ञान में सांख्यिकीय तरीके")।

गणित और भाषा विज्ञान की बातचीत एक बहुआयामी विषय है, और मैं अपने काम में सभी पर ध्यान नहीं दूंगा, लेकिन सबसे पहले, इसके लागू पहलुओं पर।

अध्याय I. भाषाविज्ञान में गणितीय विधियों के अनुप्रयोग का इतिहास

1.1 XIX - XX सदियों के मोड़ पर संरचनात्मक भाषाविज्ञान का गठन

भाषा का गणितीय विवरण एक तंत्र के रूप में भाषा के विचार पर आधारित है, जो बीसवीं शताब्दी की शुरुआत के प्रसिद्ध स्विस भाषाविद् फर्डिनेंड डी सौसुरे के पास वापस जाता है।

उनकी अवधारणा की प्रारंभिक कड़ी तीन भागों से मिलकर बनी प्रणाली के रूप में भाषा का सिद्धांत है (भाषा ही है भाषा: हिन्दी, भाषण - पासवर्ड, और भाषण गतिविधि - भाषा: हिन्दी), जिसमें प्रत्येक शब्द (सिस्टम का सदस्य) को अपने आप में नहीं, बल्कि अन्य सदस्यों के संबंध में माना जाता है। एक अन्य प्रमुख भाषाविद् के रूप में, डेन लुई हेजेल्म्सलेव ने बाद में उल्लेख किया, सॉसर "भाषा के लिए एक संरचनात्मक दृष्टिकोण की मांग करने वाले पहले व्यक्ति थे, अर्थात, इकाइयों के बीच संबंधों को रिकॉर्ड करके भाषा का वैज्ञानिक विवरण।"

भाषा को एक पदानुक्रमित संरचना के रूप में समझते हुए, सॉसर ने भाषाई इकाइयों के मूल्य और महत्व की समस्या को सबसे पहले प्रस्तुत किया। अलग-अलग घटनाओं और घटनाओं (जैसे, व्यक्तिगत इंडो-यूरोपीय शब्दों की उत्पत्ति का इतिहास) का अध्ययन स्वयं नहीं, बल्कि एक ऐसी प्रणाली में किया जाना चाहिए जिसमें वे समान घटकों के साथ सहसंबद्ध हों।

सौसुरे की भाषा की संरचनात्मक इकाई ने "साइन" शब्द पर विचार किया, जिसमें ध्वनि और अर्थ संयुक्त थे। इन तत्वों में से कोई भी एक दूसरे के बिना मौजूद नहीं है: इसलिए, मूल वक्ता भाषा में संरचनात्मक पूरे में एक अलग तत्व के रूप में एक बहुरूपी शब्द के अर्थ के विभिन्न रंगों को समझता है।

इस प्रकार, एफ डी सॉसर के सिद्धांत में, एक ओर, समाजशास्त्र और सामाजिक मनोविज्ञान के साथ भाषाविज्ञान की बातचीत को देखा जा सकता है (यह ध्यान दिया जाना चाहिए कि उसी समय, हसरल की घटना विज्ञान, फ्रायड के मनोविश्लेषण, आइंस्टीन के सापेक्षता के सिद्धांत थे। विकास, साहित्य, संगीत और ललित कला में रूप और सामग्री पर प्रयोग हो रहे थे), दूसरी ओर, गणित के साथ (संगति की अवधारणा भाषा की बीजगणितीय अवधारणा से मेल खाती है)। इस तरह की अवधारणा ने भाषाई व्याख्या की अवधारणा को इस तरह बदल दिया: घटना की व्याख्या उनकी घटना के कारणों के संबंध में नहीं, बल्कि वर्तमान और भविष्य के संबंध में की जाने लगी। व्याख्या किसी व्यक्ति के इरादों से स्वतंत्र नहीं रह गई है (इस तथ्य के बावजूद कि इरादे अवैयक्तिक हो सकते हैं, शब्द के फ्रायडियन अर्थ में "बेहोश")।

भाषाई तंत्र की कार्यप्रणाली देशी वक्ताओं की भाषण गतिविधि के माध्यम से प्रकट होती है। भाषण का परिणाम तथाकथित "सही ग्रंथ" है - भाषण इकाइयों के अनुक्रम जो कुछ पैटर्न का पालन करते हैं, जिनमें से कई गणितीय विवरण की अनुमति देते हैं। वाक्यात्मक संरचना का वर्णन करने के तरीकों का सिद्धांत सही ग्रंथों (मुख्य रूप से वाक्यों) के गणितीय विवरण के तरीकों के अध्ययन से संबंधित है। ऐसी संरचना में, भाषाई उपमाओं को उनके अंतर्निहित गुणों की सहायता से नहीं, बल्कि सिस्टम ("संरचनात्मक") संबंधों की सहायता से परिभाषित किया जाता है।

सौसुरे के विचारों को पश्चिम में महान स्विस भाषाविद् के युवा समकालीनों द्वारा विकसित किया गया था: डेनमार्क में - एल। हेजेल्म्सलेव, जिनका मेरे द्वारा पहले ही उल्लेख किया गया है, जिन्होंने अपने काम "भाषाई सिद्धांत के मूल सिद्धांतों" में भाषा के बीजगणितीय सिद्धांत को जन्म दिया। यूएसए - ई। सपिर, एल। ब्लूमफील्ड, सी। हैरिस, चेक गणराज्य में - रूसी वैज्ञानिक-प्रवासी एन। ट्रुबेट्सकोय।

भाषा के अध्ययन में सांख्यिकीय नियमितताओं को आनुवंशिकी के संस्थापक जॉर्ज मेंडल के अलावा किसी और ने नहीं निपटाया। यह केवल 1968 में था कि भाषाविदों ने पाया कि, अपने जीवन के अंतिम वर्षों में, वह गणित के तरीकों का उपयोग करके भाषाई घटनाओं के अध्ययन से प्रभावित थे। मेंडल ने इस पद्धति को जीव विज्ञान से भाषाविज्ञान में लाया; 1990 के दशक में, केवल सबसे साहसी भाषाविदों और जीवविज्ञानियों ने इस तरह के विश्लेषण की व्यवहार्यता का दावा किया था। सेंट के मठ के अभिलेखागार में। ब्रनो में टोमाज़, जिसका मठाधीश मेंडल था, चादरें "मैन", "बाउर", "मेयर" में समाप्त होने वाले उपनामों के कॉलम और कुछ अंशों और गणनाओं के साथ मिलीं। परिवार के नामों की उत्पत्ति के औपचारिक कानूनों की खोज के प्रयास में, मेंडल जटिल गणना करता है, जिसमें वह जर्मन भाषा में स्वरों और व्यंजनों की संख्या, शब्दों की कुल संख्या, उपनामों की संख्या को ध्यान में रखता है। आदि।

हमारे देश में, संरचनात्मक भाषाविज्ञान लगभग उसी समय विकसित होने लगा जैसे पश्चिम में - 19वीं-20वीं शताब्दी के मोड़ पर। इसके साथ ही एफ डी सॉसर के साथ, एक प्रणाली के रूप में भाषा की अवधारणा को कज़ान विश्वविद्यालय के प्रोफेसरों एफ.एफ. द्वारा उनके कार्यों में विकसित किया गया था। फोर्टुनाटोव और आई.ए. बाउडौइन डी कर्टेने। बाद वाले ने लंबे समय तक डी सॉसर के साथ पत्राचार किया, क्रमशः जिनेवा और कज़ान भाषाविज्ञान के स्कूलों ने एक दूसरे के साथ सहयोग किया। यदि सौसुरे को भाषाविज्ञान में "सटीक" विधियों का विचारक कहा जा सकता है, तो बॉडौइन डी कर्टेने ने उनके आवेदन के लिए व्यावहारिक नींव रखी। वह भाषाविज्ञान को अलग करने वाले पहले व्यक्ति थे (as शुद्धभाषाविज्ञान (मानवतावादी विषयों का एक समुदाय जो भाषा और भाषण के माध्यम से आध्यात्मिक संस्कृति का अध्ययन करता है) से सांख्यिकीय विधियों और कार्यात्मक निर्भरता का उपयोग करने वाला विज्ञान)। वैज्ञानिक स्वयं मानते थे कि "भाषाविज्ञान निकट भविष्य में उपयोगी हो सकता है, केवल भाषाशास्त्र और साहित्यिक इतिहास के साथ अनिवार्य संघ से मुक्त"। भाषाविज्ञान में गणितीय विधियों की शुरूआत के लिए ध्वनिविज्ञान "परीक्षण का मैदान" बन गया - भाषा प्रणाली के "परमाणु" के रूप में लगता है, जिसमें सीमित संख्या में आसानी से मापने योग्य गुण होते हैं, विवरण के औपचारिक, कठोर तरीकों के लिए सबसे सुविधाजनक सामग्री थी। ध्वन्यात्मकता ध्वनि में अर्थ के अस्तित्व को नकारती है, इसलिए अध्ययनों में "मानव" कारक को समाप्त कर दिया गया। इस अर्थ में, स्वनिम भौतिक या जैविक वस्तुओं की तरह हैं।

स्वनिम, धारणा के लिए स्वीकार्य सबसे छोटे भाषाई तत्वों के रूप में, एक अलग क्षेत्र का प्रतिनिधित्व करते हैं, एक अलग "अभूतपूर्व वास्तविकता"। उदाहरण के लिए, अंग्रेजी में, ध्वनि "टी" को अलग-अलग उच्चारण किया जा सकता है, लेकिन सभी मामलों में, अंग्रेजी बोलने वाला व्यक्ति इसे "टी" के रूप में देखेगा। मुख्य बात यह है कि स्वनिम अपना मुख्य - सार्थक - कार्य करेगा। इसके अलावा, भाषाओं के बीच अंतर ऐसे हैं कि एक भाषा में एक ध्वनि की किस्में दूसरी में विभिन्न स्वरों के अनुरूप हो सकती हैं; उदाहरण के लिए, अंग्रेजी में "एल" और "आर" अलग हैं, जबकि अन्य भाषाओं में वे एक ही स्वर की किस्में हैं (जैसे अंग्रेजी "टी", आकांक्षा के साथ या बिना उच्चारण)। किसी भी प्राकृतिक भाषा की विशाल शब्दावली बहुत कम संख्या में स्वरों के संयोजन का एक समूह है। उदाहरण के लिए, अंग्रेजी में, लगभग एक लाख शब्दों के उच्चारण और लिखने के लिए केवल 40 स्वरों का उपयोग किया जाता है।