Семантический электронный словарь. Семантические словари

Частотный грамматико-семантический словарь языка художественных произведений (с электронным приложением) как особый лексикографический продукт

The frequency, grammatical and semantic Vocubulary of language of works of art by A. P.Chekhov (with the electronic appendix) as a special lexicographic product in described.

Читателю предлагается лексикографический труд нового типа, в котором реализовано сочетание Словаря и электронного Корпуса текстов. Это сочетание создаёт новые возможности работы со словарём и позволяет читателю проводить дальнейшее самостоятельное исследование особенностей языка и творчества писателя.

Словарь выпущен в электронном виде (на диске) вместе с приложением. Данное электронное издание содержит: 1. «Частотный грамматико-семантический словарь языка художественных произведений ». Авторы: , ; 2. Электронный корпус художественных текстов, на базе которого создавался словарь. Создатели: , ; 3. Программное средство для работы с корпусами текстов «Компьютерная информационно-исследовательская система для работы с электронными корпусами текстов „ИСТОК“». Разработчики: , ; 4. Методическое руководство по работе с системой «ИСТОК» и корпусом текстов. Авторы: ,

Корпус, как и словарь, создан в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета МГУ. В этом проекте принимали участие также студенты филологического ф-та МГ, С. Гусева, А. Чернышова, С. Воробей, М. Фалдина, работавшие в спецсеминаре «Создание и исследование авторских корпусов текстов».


В данном Словаре и Корпусе представлены все законченные художественные произведения (без вариантов и редакций). Тексты даются по академическому изданию в 30 т. – М.: Наука, 1974 – 1983.

Количественная характеристика Словаря и Корпуса . Количество текстов – 600 (17 пьес, 583 прозаических произведений); количество словоупотреблений – 1 271 664 (пьесы –176 308; проза – 1 095 356); количество разных словоформ – 101 282 (пьесы – 23 093; проза – 96 141); количество разных лексем – 36 419 (пьесы 11 802; проза – 34 763 (без сведения вариантов)). Словоупотребления на других языках представлены в корпусе, как и в Словаре, только словоформами. Исключение составляют только написанные латиницей существительные, грамматически связанные с русскими словами и являющиеся частью русского текста.

В Словаре четыре раздела. В первом разделе дано описание состава лексических единиц художественных произведений. Этот раздел содержит более 34 тысяч заглавных единиц. Во втором разделе дано описание состава отдельных групп и рядов единиц, выделенных из общего словника на семантическом основании. При составлении «подсловарей» мы пытались отобрать такие группы слов, которые представляют интерес с лингвистической, литературоведческой, когнитивной точек зрения. В третьем разделе приведены некоторые результаты количественного анализа лексики художественных произведений. В четвёртом разделе дано описание электронного приложения к Словарю.

Структура словарной статьи . Полная словарная статья даётся в разделе I. Она содержит: (1) заглавное слово; (2) его грамматическая характеристика; (3) его количественная характеристика; (4) данные о вариантах. В части случаев после заглавного слова даётся (5) семантический комментарий. В тех случаях, когда описать значение единицы сложно, приводится контекст употребления с указанием произведения. При фамилиях даётся указание на произведение, в котором упомянуто данное лицо, и краткая информация об этом лице. Частотные характеристики в словаре . Для каждой единицы словаря дана количественная информация двух типов: количество употреблений и количество текстов, в которых использовано слово. При работе с количеством употреблений мы столкнулись с огромным дословным совпадением двух произведений: комедии «Иванов» (1887 г.) и драмы «Иванов» (1889 г.). В Словаре лексический материал более раннего произведения используется только в том случае, если он уникален. Во всех остальных случаях количество употреблений и число текстов даётся без учёта пьесы «Иванов» (1887). Грамматическая характеристика в словарных статьях . Частеречная характеристика, даваемая в Словаре, в целом соответствует системе грамматических классов, используемых в «Грамматическом словаре русского языка » . Отдельно описываются звукоподражания, буквы, ноты, части слов, средства рубрикации и компоненты иностранного текста. Лексическая вариативность , омонимия и полисемия . Варианты слов мы стремились свести в одну словарную статью. Лексическая омонимия полнозначных слов в Словаре и Корпусе последовательно разрешалась. Особо оформляется часть переносных значений типа «предмет, животное > лицо». Для самых регулярных единиц, имеющих частотные употребления фразеологического типа, была проделана дополнительная работа по разделению полнозначных и неполнозначных употреблений. Семантический комментарий и иллюстративные примеры . В Словаре последовательно комментировались омонимы (комментарий не даётся только для омонимов типа предикатив /наречие, предлог/наречие). Мы старались также описать значение тех слов, которые могут быть непонятны вне контекста, имеют в контексте нестандартное значение или требуют знания реалий. В качестве основы при работе над семантическим комментарием использовался «Толковый словарь русского языка с включением сведений о происхождении слов» (отв. ред. , М., 2007). При составлении комментария мы опирались также на книгу «Что непонятно у классиков, или Энциклопедия русского быта XIX века» (М., 1998) и другие источники.


Корпус размечен следующими типами информации : 1. Словоформа; 2. Начальная форма слова; 3. Название произведения; 4. Подзаголовок и посвящение; 5. Год написания произведения; 6. Периодизация (мы даём три известные нам периодизации); 7. Тип текста: прозаический или драматический; 8. Подпись; 9. Жанр текста; 10. Авторский жанр; 11. Речевой жанр; 12. Место написания; 13. Тип повествователя; 14, 15. Набор тем и Тема; 16. Семантический класс (Гео; Лицо; Имя; Цвет; Звук; Произ); 17. Части речи; 18. Особые употребления; 19. Том и страница в собрании сочинений. При разметке корпуса типами информации мы предприняли попытку решить, в частности, следующие лингвистические задачи: 1. Речевой жанр – речевой жанр текста. Речевой жанр, по определению, это «типовая модель построения речевого целого» [Бахтин: 151]. Построение (процесс создания), структура (архитектоника) жанра определяются многими факторами, но все они находятся в состоянии соподчиненности между собой и образуют определенную целостность на базе внутреннего единства всех формообразующих компонентов. Всего у Чехова можно выделить около 25 различных речевых жанров; 2. Тип повествования – это указание на то, от какого лица написано произведение. Обычно чеховские тексты написаны от первого или от третьего лица. Однако некоторые произведения (например, «Ярмарочное “итого”», «Кое-что об », «Письма» и другие) представляют собой набор отрывков, которые созданы от лица разных персонажей. В таких случаях мы не можем однозначно определить, от какого лица написано произведение, но можем выделить несколько комбинаций, например «первое (несколько) лицо » или «третье / первое лицо ». 3. Темы - наименования тем произведений. Мы предприняли попытку эмпирического выделения тем с опорой на лексический состав, так как автоматического алгоритма разметки тем не существует. Система позволяет просматривать как комбинации тем (по комбинации можно отыскать соответствующее произведение), так и каждую тему отдельно (можно составить список произведений на данную тему).


Основные функции и возможности системы . Корпусная информационно-исследовательская система «Исследование Словаря, Текстовых Особенностей, Конкордансов» («ИСТОК») позволяет: (а) просматривать и копировать в файл имеющиеся словари и конкордансы; (б) получать новые словари и конкордансы путём комбинирования тех типов информации, которыми размечен корпус; (в) работать с каждым произведением в полнотекстовом режиме и получать справочную информацию о нём и о его единицах. Работа в системе возможна в трёх режимах: (1) «Конкорданс», (2) «Текст», (3) «Справочные материалы». Главным является режим «Конкорданс». Через него осуществляются основные виды операций с корпусом – работа со словниками, контекстами и переход в полный текст произведений. Он даёт доступ к типам информации, которыми размечен корпус. Компоненты конкорданса – словник и контексты – располагаются в разных окнах. Каждый из конкордансов группирует материал корпуса особым образом в соответствии с выбранным типом информации. Словник конкорданса может быть отсортирован трояким образом – по алфавиту , по частоте, а также c конца единиц. Контексты также могут быть отсортированы различным образом. При работе с конкретным контекстом можно вызвать вспомогательное окно, в котором показан текст произведения, либо перейти в полнотекстовый режим, нажав на закладку «Текст». Для единиц некоторых конкордансов («Слова», «Названия произведений», «Особые употребления») автоматически выдаётся словарная статья из справочных материалов. Помимо уже готовых конкордансов, выбираемых из меню «Тип информации», система позволяет получать новые конкордансы. Для этого используется функция «Фильтр». Установка Фильтра на одном из элементов словника конкорданса позволяет «пересечь» информацию, содержащуюся в конкордансах разного типа. Полезной функцией системы является возможность анализа совместной встречаемости элементов. Сочетаемость удобно также исследовать с помощью функции «Сортировка контекстов». Режим «Справочные материалы» позволяет просматривать две базы данных : «Примечания и персоналии» и «Семантический комментарий». В первой собраны «Примечания к произведениям » (по Академическому изданию) и справочная информация о некоторых связанных с и/или упоминаемых им лицах. Вторая база содержит семантические комментарии к выделенным лексическим единицам произведений.

Со Словарём можно ознакомиться на сайте лаборатории http://www. philol. msu. ru/~lex/. Вопросы и пожелания просим направлять на электронный адрес *****@***msu. ru.

Литература.

Проблемы текста. Опыт философского анализа // Вопросы литературы. 1976. № 10.


Словарь русского языка С.И. Ожегова содержит четыре толкования слова «мера»: «1. Единица измерения. 2. Граница, предел проявления чего-н. 3. Средство для осуществления чего-н., мероприятие. 4. Старая русская единица емкости сыпучих веществ, а также сосуд для измерения их». Похоже, что в искомом словосоче-тании слово «мера» употребляется во втором или в третьем значе-нии.
Безопасность С. И. Ожегов определяет как "состояние, при котором не угрожает опасность, есть защита от опасности", а безо-пасный толкуется как "не угрожающий опасностью, защищающий от опасности". Что же такое опасность? С.И. Ожегов полагает, что это - "возможность, угроза чего-н. очень плохого, какого-н. несчастья". Наиболее подходящим для целей нашего исследования представляется понимание меры безопасности как средства или мероприятия защиты от чего-нибудь плохого, какого- нибудь несчастья.
Примерно к таким же выводам приводит семантическое толкование слова «защита», которое, согласно С.И. Ожегову, имеет четыре значения: « 1. см. защитить. Искать защиты. Будь мне защи-
той. Взять под свою защиту 2. То, что защищает, служит обороной. 3. собир. Защищающая сторона в судебном процессе. Выступление защиты. 4. собир. Часть спортивной команды, имеющая задачу не допустить мяч, шайбу в свои ворота. Играть в защите».
«Защитить, -щищу, - щитишь; - щищенный (-ен, -ена); кого- что. Охраняя, оградить от посягательств, от враждебных действий, от опасности. З. обиженного, город от врага. 2. Предохранить, обезопасить от чего-н. з. от холода. 3. что. Отстоять (мнение, взгля-ды) перед чьей-н. критикой возражениями. З. свою точку зрения. 4. В целях получения соответствующей квалификации публично (на заседании ученого совета или перед специальной комиссией) обосновать положения своей диссертации, проекта, диплома. З. диссертацию на соискание ученой степени кандидата наук».
Хотя термины «меры безопасности» и «меры защиты» являются устойчивыми словосочетаниями, ни один из словарей не дает его определения. А толкование слов «мера», «безопасность», «защита» в других словарях русского языка мало отличается от толкования словаря С.И. Ожегова.
Выбирая из множества возможных вариантов, можно сделать вывод, что в искомом случае мера безопасности - это мероприятие или средство защиты, охраны, ограждения, предохранения от посягательств, враждебных действий опасности, чего-нибудь плохого, какого-нибудь несчастья. Может быть, такое определение приемлемо в быту, но вряд ли оно может служить опорой для проведения научных исследований или в качестве рабочего определения.
Второй вывод, к которому приводит семантическое толкование: словосочетания «меры безопасности» и «меры защиты» не имеют различий. Очевидно, по этой причине они издавна использовались как синонимы.

Еще по теме 2.1. Семантическое толкование:

  1. ИЗ ИСТОРИИ ЕВРОПЕЙСКОЙ РИТОРИКИ СО ВРЕМЕН ЕЕ ЗАРОЖДЕНИЯ. ФИЛОСОФСКАЯ И СЕМАНТИЧЕСКАЯ ЦЕННОСТЬ ОПЫТА РИТОРИЧЕСКИХ ИССЛЕДОВАНИЙ

Третий тип словарей - так называемые семантические или смысловые словари в которых исходным (заглавием словарной статьи) является смысл.

Как должен быть организован семантический словарь? В основу кладется специально разработанный формальный способ записи смысла (скорее всего это должна быть не плоскостная а трехмерная пространственная структура). Элементарному смыслу ставится в соответствие правописание (означающее языкового знака). Цепочки значений (регулярных в языке) реализуются в плане выражения. Такой словарь мыслится как очень сложно организованный. Самым трудным является разработка формальной записи смысла. Почти вся лингвистика последних лет занимается разработкой разных способов записи смысла потому что смысл в отличие от формы слова от его звучания и правописания не дан нам в непосредственном наблюдении: мы его не можем ни увидеть ни услышать ни пощупать мы его можем только сознательно ощутить. Но ведь как-то он представлен в нашем сознании! Мы пытаемся моделировать смыслы находящиеся в нашем мозгу придумывая некую специальную смысловую запись.

Попытка изображения смысла или семантического представления (Сем. П) фразы на плоскости (И.А. Мельчук) Зарецкая Е. Н. Риторика: Теория и практика речевой коммуникации. - 4-е изд. - М.: Дело 2002. - 480 с..

А сообщает В что А хочет чтобы В стал Х-м самого А - с целью чтобы это сообщение каузировало чтобы В стал Х-м

Возможные чтения (Сем. П) фразы:

Ваня твердо обещал Пете вечером принять <что вечером он примет> Машу самым теплым образом.

Разработка самых разных видов смысловой записи - это краеугольный камень лингвистики второй половины XX века. Есть определенные достижения в этой сфере; одним из них и является специально разработанная семантическая запись И.А. Мельчука на базе которой им создается словарь. Даже беглый взгляд на рисунок позволяет понять сколь сложно организовано описание смысла.

Понятно, что семантический словарь - это словарь будущего потому что только наличие такого словаря может реально обеспечить автоматический перевод с одного языка на другой. Уже говорилось что перевод - это вычитывание информации из текста и представление этой информации средствами другого языка. Для того чтобы осуществить автоматический перевод надо понятый смысл суметь задать формально т.е. выработать формальную запись позволяющую фиксировать смыслы которые человек распознает читая текст скажем на родном языке. Словарь организованный по принципу словесных параллелей (стол - table) т.е. обычный двуязычный (или многоязычный) словарь - слабый помощник переводчику поскольку перевод никогда пословно не осуществляется (неверные методики преподавания иностранного языка методом пословного перевода приводят к тому что человек не может заговорить на этом языке). Переводить можно только целые конструкции потому что только в рамках предложения можно раскодировать информацию которая никогда не является суммой смыслов составляющих элементов. И только получив эту общую информацию ее можно выразить средствами другого языка. Речь человека не является пословной калькой с другого языка. Русское здравствуйте! переводится на английский язык как How do you do? что в прямом переводе не имеет ничего общего с оригиналом тем не менее это единственный правильный перевод. Важно понять что адекватный перевод является непословным всегда а не только в отдельных случаях. Это - норма.

Двуязычный словарь ставит в соответствие друг другу два знака при едином понятии т.е. плане содержания - это соответствие двух означающих (по одному на каждый язык) одному означаемому. Значение слова нигде не описывается а признается понимаемым носителем того языка который представлен в словаре второй частью.

Многоязычный словарь ничем не отличается в этом отношении от двуязычного: знаку первого языка через понятый смысл ставятся в соответствие знаки в других языках. На этом принципе основаны все многоязычные словари.

Раздел семиотики и логики, исследующий отношение языковых выражений к обозначаемым объектам и выражаемому содержанию. Семантическая проблематика обсуждалась еще в античности, однако только на рубеже 19 20 вв. в трудах Ч. Пирса, Ф. де Соссюра, Ч.… … Философская энциклопедия

См. Семасиология. Литературная энциклопедия. В 11 т.; М.: издательство Коммунистической академии, Советская энциклопедия, Художественная литература. Под редакцией В. М. Фриче, А. В. Луначарского. 1929 1939. семантика … Литературная энциклопедия

- [Словарь иностранных слов русского языка

В программировании система правил истолкования отдельных языковых конструкций. Семантика определяет смысловое значение предложений алгоритмического языка. По английски: Semantics См. также: Языки программирования Финансовый словарь Финам.… … Финансовый словарь

семантика - и, ж. sémantique f. 1. лингв. Смысловое значение (слова, оборота речи и т. п.). Семантика слова. БАС 1. При дворе и в домах знатных вельмож с 1718 г. регулярно устраивались ассамблеи, заседания Всепьянейшего собора. семантика которое остается в… … Исторический словарь галлицизмов русского языка

Семасиология, смысл, значение Словарь русских синонимов. семантика сущ., кол во синонимов: 8 значение (27) … Словарь синонимов

- (от греческого semantikos обозначающий), 1) значения единиц языка. 2) То же, что семасиология, раздел языкознания, изучающий значения единиц языка, прежде всего слов и словосочетаний. 3) Один из основных разделов семиотики … Современная энциклопедия

- (от греч. semantikos обозначающий) 1) значения единиц языка.2) То же, что семасиология, раздел языкознания, изучающий значение единиц языка, прежде всего слов.3) Один из основных разделов семиотики … Большой Энциклопедический словарь

Изучение способа использования слов и передаваемых ими значений … Словарь терминов антикризисного управления

СЕМАНТИКА, и, жен. 1. То же, что семасиология. 2. В языкознании: значение, смысл (языковой единицы). С. слова. С. предложения. | прил. семантический, ая, ое. Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949 1992 … Толковый словарь Ожегова

Книги

  • Семантика имени (Имя-2) , . Сборник "Семантика имени" (Имя-2) отражает традиции анализа имен собственных в тексте в Московской семиотической школе. Древнейшие тексты анализируются в работах Вяч. Вс. Иванова и В. Н.…
  • Семантика предложения и нереферентные слова , И. Б. Шатуновский. Монография посвящена исследованию большого круга сложных проблем, имеющих важное значение не только для лингвистики, но также для логики, психологии и философии языка. К их числу относятся:…

Русский семантический словарь является шеститомным изданием, в котором в многоступенчатых классах слов представлена система современной русской общеупотребительной лексики. Первичной единицей описания в Словаре является значение слова; такие значения сгруппированы по частям речи и далее - по лексико-семантическим классам слов и их отдельным участкам.
Издание обращено к специалистам-языковедам, лексикографам, преподавателям, а также к широкому кругу людей, изучающих русский язык или пользующихся словарём в поисках сведений о целом классе слов, а также об отдельном слове, его значении. Словарь в целом охватывает около 300 000 лексических единиц - значений слов и фразеологизмов Каждый том Словаря представляет собой отдельное законченное произведение и может быть использован как самостоятельное лексикографическое исследование.

Слова указующие (местоимения).
Раздел «Русского семантического словаря» «Слова указующие (местоимения)» содержит описание лексической системы русских местоименных слов. Пользование предлагаемым Словарем предполагает предварительное ознакомление с настоящим комментарием к данному разделу и прилагаемыми далее схемами.

Проблема семантической классификации слов указующих, анализа и описания их множеств является значительно более сложной, чем задача соответствующего описания слов именующих - имен, наречий и глаголов. Это объясняется прежде всего высокой степенью абстракции местоименных значений, а также, в ряде случаев, отсутствием более или менее определенных, уловимых границ между отдельными значениями многозначного слова. Трудности, которые здесь встают перед лексикографом, те же, что и при семантическом анализе предлогов, союзов или частиц: их расчленение на значения непривычно и может показаться искусственным. Составитель собственно семантического словаря оказывается перед выбором: либо принять традиционное и достаточно часто повторяющееся во всех грамматиках и толковых словарях описание, либо, ожидая упреков за непривычность и сложность классификации, постараться вникнуть в структуру местоименного слова и выявить те смыслы, которые объединяют отдельные значения разных местоимений в единые ветви лексического древа. Именно эта вторая задача и должна стоять перед исследователем семантической структуры местоимения.


Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Русский семантический словарь, Толковый словарь, систематизированный по классам слов и значений, Шведова Н.Ю., 2002 - fileskachat.com, быстрое и бесплатное скачивание.

Скачать pdf
Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.