Список всех помет

Помета Семантика Терминал Нетерминал Фильтр Отрицание Синтаксис
Статьи с обращением к словарям
kwtype Символ ограничен статей или типом статей указанным в поле kwtype. + + + + kwtype="статья1" kwtype="статья1" kwtype= type1
kwset Символ ограничен одной из статей или типов статей, указанных в поле kwset. + + - + kwset=[type1,"статья1"] kwset=[type1,"статья1"]
kwsetf Ограничение аналогичное kwset, которое применяется к первому (а не к главному) слову группы. + + - + kwsetf=[type1,"статья1"]
label Символ ограничен списком из статьи указанной в поле label. + + - + label="статья1"
gztweight Добавляет вес к общему весу нетерминала в левой части правила. Прибавляемый вес находится в словарной статье в поле, название которого указывается в поле пометы gztweight. Помету gztweight можно использовать только вместе с пометой kwtype. + + - - kwtype="type1", gztweight=" type1weight"
Грамматические ограничения
gram Проверяет значения грамматических характеристик отдельно для каждого омонима. + + - + gram="sg,pl"
GU Проверяет значения грамматических характеристик отдельно для каждого омонима или для всех омонимов одновременно. - + - + GU=[nom,sg] GU=[sg] GU=&[nom,acc]
Согласования
gnc-agr Согласование по роду, числу и падежу: gender number case. + + - + Adj<gnc-agr[1]> Noun<gnc-agr[1]>
nc-agr Согласование по числу и падежу: number case. + + - + N1<nc-agr[2]> N2<nc-agr[2]>
c-agr Согласование по падежу: case. + + - + Noun<c-agr[3]> 'и' Noun<c-agr[3]>
gn-agr Согласование по роду и числу: gender number. + + - +
gc-agr Согласование по роду и падежу: gender case. + + - +
fem-c-agr Расширенное согласование gnc-agr, которое допускает рассогласование по роду, если у одного из членов согласования есть граммемы "fem,famn". + + - + Noun<fem-c-agr[1]> Noun<fem-c-agr[1]> Сработает так: + врач Анна - врач Михаил
after-num-agr Согласование пары прилагательное+существительное после числительного в русском, типа «5 американских президентов», но «2 американских президентА» + + -
sp-agr Согласование между субъектом и предикатом: subject predicate. + + - + Noun<sp-agr[4]> Verb<sp-agr[4]>
fio-agr Согласование двух объектов типа fio по формату записи. + + - +
geo-agr Согласование двух объектов географического тезауруса по принадлежности одной ветви геотезауруса. + + -
Регулярные выражения
wfm Регулярное выражение применяется к словоформе, которая является вершиной синтаксической группы. + + + + Word<wfm=".*банк(|a|у|е|ом)/">
wff Регулярное выражение применяется к первой словоформе синтаксической группы. + + + + Word<wff="им\\.">
wfl Регулярное выражение применяется к последней словоформе синтаксической группы. + + + + AnyWord<wfl="[0-9]{3}-[0-9]{2}-[0-9]{2}">; // номер телефона
Регистр букв в слове
h-reg1 Первая буква слова стоит в верхнем регистре. Помета применяется к началу фразы, а не к вершине. + + + Noun<h-reg1>
h-reg2 В верхнем регистре стоит первая буква слова и как минимум еще одна буква слова, как например, в слове «МосСтрой». + + +
h-reg Синоним h-reg2
l-reg Все буквы слова в нижнем регистре. + + +
Кавычки
quoted Слово или группа слов в кавычках. + + - + SomeQuote<quoted> SomeName<quoted>
l-quoted Слово или группа слов c открывающей кавычкой перед первым символом и без закрывающей кавычки после последнего символа. + + - +
r-quoted Слово или группа слов c закрывающей кавычкой после последнего символа и без закрывающей кавычки перед первым символом. + + - +
Специальное
fw Самое первое слово символа должно быть первым словом предложения. + - - + Lead_in<fw> ProperName<fw>
mw Многословная сущность (multiword). + - - + Noun<mw> SimpleWord<mw>
lat Слово состоит из букв латинского алфавита. + + + - Word<lat>
no_hom Символ должно состоять из омонимов с одной частью речи. + + - - Word<no_hom>
cut Слово или синтаксическая группа исключается из интерпретации. + + - - MainWords Context<cut>
rt Обозначает вершину получившейся синтаксической группы. Строго говоря, rt не является ограничением, а относится к синтаксическим операторам, описанным ранее. + + - - NP -> Adj Noun<rt>;
Словарность
dict Слово должно быть в морфологическом словаре. + - + +
Помета Семантика Терминал Нетерминал Фильтр Отрицание Синтаксис
Статьи с обращением к словарям
kwtype Символ ограничен статей или типом статей указанным в поле kwtype. + + + + kwtype="статья1" kwtype="статья1" kwtype= type1
kwset Символ ограничен одной из статей или типов статей, указанных в поле kwset. + + - + kwset=[type1,"статья1"] kwset=[type1,"статья1"]
kwsetf Ограничение аналогичное kwset, которое применяется к первому (а не к главному) слову группы. + + - + kwsetf=[type1,"статья1"]
label Символ ограничен списком из статьи указанной в поле label. + + - + label="статья1"
gztweight Добавляет вес к общему весу нетерминала в левой части правила. Прибавляемый вес находится в словарной статье в поле, название которого указывается в поле пометы gztweight. Помету gztweight можно использовать только вместе с пометой kwtype. + + - - kwtype="type1", gztweight=" type1weight"
Грамматические ограничения
gram Проверяет значения грамматических характеристик отдельно для каждого омонима. + + - + gram="sg,pl"
GU Проверяет значения грамматических характеристик отдельно для каждого омонима или для всех омонимов одновременно. - + - + GU=[nom,sg] GU=[sg] GU=&[nom,acc]
Согласования
gnc-agr Согласование по роду, числу и падежу: gender number case. + + - + Adj<gnc-agr[1]> Noun<gnc-agr[1]>
nc-agr Согласование по числу и падежу: number case. + + - + N1<nc-agr[2]> N2<nc-agr[2]>
c-agr Согласование по падежу: case. + + - + Noun<c-agr[3]> 'и' Noun<c-agr[3]>
gn-agr Согласование по роду и числу: gender number. + + - +
gc-agr Согласование по роду и падежу: gender case. + + - +
fem-c-agr Расширенное согласование gnc-agr, которое допускает рассогласование по роду, если у одного из членов согласования есть граммемы "fem,famn". + + - + Noun<fem-c-agr[1]> Noun<fem-c-agr[1]> Сработает так: + врач Анна - врач Михаил
after-num-agr Согласование пары прилагательное+существительное после числительного в русском, типа «5 американских президентов», но «2 американских президентА» + + -
sp-agr Согласование между субъектом и предикатом: subject predicate. + + - + Noun<sp-agr[4]> Verb<sp-agr[4]>
fio-agr Согласование двух объектов типа fio по формату записи. + + - +
geo-agr Согласование двух объектов географического тезауруса по принадлежности одной ветви геотезауруса. + + -
Регулярные выражения
wfm Регулярное выражение применяется к словоформе, которая является вершиной синтаксической группы. + + + + Word<wfm=".*банк(|a|у|е|ом)/">
wff Регулярное выражение применяется к первой словоформе синтаксической группы. + + + + Word<wff="им\\.">
wfl Регулярное выражение применяется к последней словоформе синтаксической группы. + + + + AnyWord<wfl="[0-9]{3}-[0-9]{2}-[0-9]{2}">; // номер телефона
Регистр букв в слове
h-reg1 Первая буква слова стоит в верхнем регистре. Помета применяется к началу фразы, а не к вершине. + + + Noun<h-reg1>
h-reg2 В верхнем регистре стоит первая буква слова и как минимум еще одна буква слова, как например, в слове «МосСтрой». + + +
h-reg Синоним h-reg2
l-reg Все буквы слова в нижнем регистре. + + +
Кавычки
quoted Слово или группа слов в кавычках. + + - + SomeQuote<quoted> SomeName<quoted>
l-quoted Слово или группа слов c открывающей кавычкой перед первым символом и без закрывающей кавычки после последнего символа. + + - +
r-quoted Слово или группа слов c закрывающей кавычкой после последнего символа и без закрывающей кавычки перед первым символом. + + - +
Специальное
fw Самое первое слово символа должно быть первым словом предложения. + - - + Lead_in<fw> ProperName<fw>
mw Многословная сущность (multiword). + - - + Noun<mw> SimpleWord<mw>
lat Слово состоит из букв латинского алфавита. + + + - Word<lat>
no_hom Символ должно состоять из омонимов с одной частью речи. + + - - Word<no_hom>
cut Слово или синтаксическая группа исключается из интерпретации. + + - - MainWords Context<cut>
rt Обозначает вершину получившейся синтаксической группы. Строго говоря, rt не является ограничением, а относится к синтаксическим операторам, описанным ранее. + + - - NP -> Adj Noun<rt>;
Словарность
dict Слово должно быть в морфологическом словаре. + - + +

Подробно про кавычки

Внуково "Внуково" "Внуково Внуково" ."
quoted no yes no no no
~quoted yes no yes yes yes
l-quoted no no yes no no
~l-quoted yes yes no yes yes
r-quoted no no no yes yes
~r-quoted yes yes yes no no
Внуково "Внуково" "Внуково Внуково" ."
quoted no yes no no no
~quoted yes no yes yes yes
l-quoted no no yes no no
~l-quoted yes yes no yes yes
r-quoted no no no yes yes
~r-quoted yes yes yes no no