TRANSFORMING OF THE PUSHDOWN RECOGNIZER WITH FINITE SET  OF STATES INTO RECOGNIZER WITH ONE STATE

Yuriy Ryazanov

doi:doi:

Home / Journals / Bulletin of Belgorod State Technological University named after. V. G. Shukhov / Volume 1 Issue 1 / TRANSFORMING OF THE PUSHDOWN RECOGNIZER WITH FINITE SET OF STATES INTO RECOGNIZER WITH ONE STATE

TRANSFORMING OF THE PUSHDOWN RECOGNIZER WITH FINITE SET OF STATES INTO RECOGNIZER WITH ONE STATE

Submit manuscript Download PDF
Text

To cite

Citations:

TRANSFORMING OF THE PUSHDOWN RECOGNIZER WITH FINITE SET OF STATES INTO RECOGNIZER WITH ONE STATE

Journal: BULLETIN OF BELGOROD STATE TECHNOLOGICAL UNIVERSITY NAMED AFTER. V. G. SHUKHOV Volume 1 № 1 , 2016

Rubrics: COMPUTER SCIENCE, HARDWARE AND CONTROL

CSCSTI 20.53

Yuriy Ryazanov ¹

Author and publication information

Authors:

1. Belgorod State Technological University named after V.G. Shukhov

Belgorod, Belgorod, Russian Federation

Type:

Article

Pages:

from 111 to 115

Status:

Published

Received:

25.01.2016

Accepted:

25.01.2016

Published:

25.01.2016

Subject area:

CSCSTI 20.53

Language:

Russian

Keywords:

context-free language, pushdown recognizer, state, equivalent transforming

Abstract and keywords

Abstract:
In this article the recognition of the problem of context-free languages is considered. Pushdown recognizers are used for its decision, which can have a finite set of states. In this work the class of pushdown recognizers and a finite set of states which can be transformed to equivalent recognizers with pushdown memory and one state without increase in power of a set of pushdown symbols. Their formal descriptions are given and on their basis rules of performance of transformation are provided. The example of transformation of the recognizer with final number of states to the recognizer with one state is presented. The records recognizers work at processing an input string, are given validating the executed transformations. The recognizer with one state in the course of recognition analyzes only the input string and the contents of the pushdown memory. It allows to reduce the number of parameters defining behavior of the recognizer with pushdown memory. The recognizer with one state has more compact idea, than the recognizer with a final set of states.

Keywords:
context-free language, pushdown recognizer, state, equivalent transforming

Text

Text (PDF): Read Download

Одной из важных задач обработки формальных языков является задача распознавания, которая заключается в определении принадлежности заданной цепочки заданному языку. Для решения задачи распознавания контекстно-свободных языков используются распознаватели с магазинной памятью (МП–распознаватели)
[1–7]. МП-распознаватель можно представить устройством, изображенным на рис. 1.

МП-распознаватель.tif

Рис. 1. МП-распознаватель

В работе [8] представлен алгоритм синтеза МП–распознавателей с конечным числом состояний, которые формально можно представить следующим образом:

МПⁿ = (Qⁿ, Sⁿ, Гⁿ, Iⁿ, Sⁿ, Pⁿ, Eⁿ, δⁿ, λⁿ, q₀ⁿ, qⁿ, γ₀ⁿ),

где Qⁿ – конечное множество состояний, Qⁿ = {q₀ⁿ, q₁ⁿ,…, q_mⁿ}; Sⁿ – конечное множество входных символов, включающее концевой маркер ˧, которым заканчивается входная цепочка; Гⁿ = Qⁿ È {Ñ} – конечное множество магазинных символов (равно множеству состояний, дополненному маркером дна магазина Ñ); Iⁿ – конечное множество операций над головкой, Iⁿ = (сдвиг, держать). Операция сдвиг перемещает головку на одну позицию вправо, а держать – не изменяет положения головки; Sⁿ – конечное множество операций над состоянием, Sⁿ = {сост(q₀ⁿ), сост(q₁ⁿ),…, сост(q_mⁿ)}. Операция сост(q_iⁿ) обозначает переход в состояние q_iⁿ; Pⁿ – множество операций над магазином, Pⁿ = {зам(γ₁), зам(γ₂), … зам(γ_i), …}. Операция зам(γ_i) заключается в выталкивании верхнего символа из магазина и последовательном вталкивании символов цепочки γ_i; Eⁿ – конечное множество значений выхода, Eⁿ = {допустить, отвергнуть};
q₀ⁿ – начальное состояние; qⁿ – допускающее состояние; γ₀ⁿ – начальное содержимое магазина, γ₀ⁿ = Ñ (магазин пуст);

δⁿ : Qⁿ ´ Sⁿ ´ Гⁿ ® Iⁿ ´ Sⁿ ´ Pⁿ – частичная функция переходов, которая состоянию, символу входной цепочки (находящемуся под головкой) и верхнему символу магазина ставит в соответствие операцию над головкой, состоянием и магазином, причем множество видов значений на тройке (q, a, x) равно {(сдвиг, сост(p), зам(x)), (держать, сост(p), зам(xr)), (держать, сост(x), зам(ε))}, где ε – пустая цепочка. Заметим, что на тройке (q, a, x) операция зам(x) не изменяет содержимого магазина, зам(xr) – добавляет один символ в магазин, а зам(ε) – выталкивает верхний символ из магазина.

λⁿ : Qⁿ ´ Sⁿ ´ Гⁿ ® Eⁿ – частичная функция выходов, которая состоянию, символу входной цепочки (находящемуся под головкой) и верхнему символу магазина ставит в соответствие значение выхода – допустить или отвергнуть. Значение функции на тройке (q, ˧, Ñ) равно допустить, а на всех остальных, на которых функция определена — отвергнуть.

Области определения функций δⁿ и λⁿ не пересекаются, а их объединение равно области отправления.

Тройка (q, α, γ), где q – состояние, α – часть входной цепочки, начиная с символа под головкой и заканчивая концевым маркером, γ – содержимое магазина, называется конфигурацией распознавателя МПⁿ. Исходной конфигурацией является (q₀ⁿ, α₀, Ñ), где α₀ – вся входная цепочка (головка находится над первым символом).

Пусть конфигурацией МПⁿ является тройка (q, aα, xγ), где a – символ под головкой, x – верхний символ магазина. Если на тройке (q, a, x) определена функция переходов δⁿ, то ее значение определяет операции над головкой, состоянием и магазином. При выполнении этих операций конфигурация изменяется. Если на тройке (q, a, x) определена функция выходов λⁿ, то процесс распознавания заканчивается с результатом, равным значению функции λⁿ. Такую конфигурацию назовем заключительной. Итак, работа МПⁿ заключается в изменении конфигураций. Последней является заключительная конфигурация, в которой определяется результат распознавания.

Покажем, что распознаватель МПⁿ можно преобразовать в распознаватель МП¹ с одним состоянием, который распознает тот же язык, что и МПⁿ. Формально МП¹ определим следующим образом:

МП¹ = (S¹, Г¹, I¹, P¹, E¹, δ¹, λ¹, γ₀¹),

где S¹ = Sⁿ, Г¹ = Гⁿ, I¹ = Iⁿ, P¹ = Pⁿ, E¹ = Eⁿ.

В МП¹ только одно состояние, поэтому операция над состоянием не имеет смысла, функции переходов δ¹ и выходов λ¹ определяются как

δ¹ : S¹ ´ Г¹ ® I¹ ´ P¹ и λ¹ : S¹ ´ Г¹ ® E¹ , а конфигурацией является двойка (α, γ).

Роль состояния в МП¹ будет играть верхний символ магазина, поэтому конфигурации (q, α, xγ) в МПⁿ будет соответствовать конфигурация (α, qxγ) в МП¹. Исходной конфигурации (q₀ⁿ, α₀, Ñ) распознавателя МПⁿ соответствует конфигурация (α₀, q₀ⁿÑ) в МП¹, поэтому начальным содержимым магазина в МП¹ будет q₀ⁿÑ. Определим функцию переходов δ¹ так, что если на i-ом шаге обработки входной цепочки МПⁿ находится в конфигурации (q, aα, xγ), то МП¹ на этом же шаге находится в конфигурации (aα, qxγ).

Пусть в конфигурации (q, aα, xγ) определена функция переходов δⁿ, тогда в конфигурации (aα, qxγ) должна быть определена функция переходов δ¹.

Если δⁿ (q, a, x) = (сдвиг, сост(p), зам(x)), то на i+1-ом шаге конфигурацией МПⁿ будет (p, α, xγ), а ей в МП¹ соответствует конфигурация (α, pxγ). Распознаватель МП¹ сменит конфигурацию (aα, qxγ) на (α, pxγ), если δ¹ (a, q) = (сдвиг, зам(p)).

Если δⁿ (q, a, x) = (держать, сост(p), зам(xr)), то на i+1-ом шаге конфигурацией МПⁿ будет (p, aα, rxγ), а ей в МП¹ соответствует конфигурация (aα, prxγ). Распознаватель МП¹ сменит конфигурацию (aα, qxγ) на (aα, pxγ), если δ¹ (a, q) = (держать, зам(rp)).

Если δⁿ (q, a, x) = (держать, сост(x), зам(ε)), то на i+1-ом шаге конфигурацией МПⁿ будет (x, aα, γ), а ей в МП¹ соответствует конфигурация (aα, xγ). Распознаватель МП¹ сменит конфигурацию (aα, qxγ) на (aα, xγ), если δ¹ (a, q) = (держать, зам(ε)).

Если в конфигурации (q, aα, xγ) распознавателя МПⁿ определена функция выходов λⁿ и λⁿ (q, a, x) = отвергнуть, тогда в конфигурации (aα, qxγ) распознавателя МП¹ должна быть определена функция выходов λ¹ и λ¹ (a, x) = отвергнуть.

Рассмотрим конфигурацию (q, ˧, Ñ) распознавателя МПⁿ, на которой определена функция выходов λⁿ и λⁿ (q, a, x) = допустить. Этой конфигурации в МП¹ соответствует конфигурация (˧, qÑ) в МП¹, т. е. входная цепочка закончилась и в магазине только допускающее состояние. Для того, чтобы убедиться в том, что в магазине действительно только допускающее состояние, вытолкнем его из магазина (δ¹ ((˧, q) = (держать, зам(ε))) и получим конфигурацию (˧, Ñ), в которой функция выходов λ¹ равна допустить (λ¹ (˧, Ñ) = допустить).

Таким образом, описаны правила преобразования МП-распознавателя с конечным множеством состояний в эквивалентный ему МП-распознаватель с одним состоянием.

Рассмотрим пример выполнения преобразования. МП-распознаватель с конечным множеством состояний можно задать таблицей (табл. 1), состоящей из четырех столбцов. В первом столбце указывается состояние, во втором – множество входных символов, в третьем – магазинный символ или пусто. Если МП-распознаватель находится в конфигурации (q, aα, xγ) и в таблице есть строка, в которой в первом элементе (столбце) записано состояние q, во втором – множество, содержащее символ a, в третьем – символ x или пусто, то в четвертом столбце записаны действия, которые должен выполнить распознаватель. Для сокращения таблицы в четвертом столбце не указывается операция над головкой держать, которая не изменяет положения головки, не указывается операция зам(x), которая не изменяет содержимого магазина, операция зам(ε) записывается как вытолкнуть, а операция зам(xr) – как втолкнуть(r). Если же МП-распознаватель находится в конфигурации (q, aα, xγ) и в таблице нет строки, в которой в первом элементе (столбце) записано состояние q, во втором – множество, содержащее символ a, в третьем – символ x или пусто, то цепочка отвергается.

В МП-распознавателе, представленном в табл. 1, состояние 1 – начальное, состояние 4 – допускающее, начальное содержимое магазина – магазин пуст.

В табл. 2 представлен протокол работы МП-распознавателя (табл. 1) при обработке цепочки adedc┤.

Таблица 1

МП-распознаватель с конечным множеством состояний

Текущее состояние	Входные символы	Верх магазина	Действия
1	a		сдвиг, сост(3)
1	b, c, d, e		сост(5), втолкнуть(2)
2	c		сдвиг, сост(4)
3	d, e		сост(9), втолкнуть(4)
4	d, e		сост(9), втолкнуть(2)
4	┤	Ñ	допустить
5	b		сдвиг, сост(6)
5	c	2	сост(2), вытолкнуть
5	d, e		сост(9), втолкнуть(7)
6	d, e		сост(9), втолкнуть(8)
7	d		сдвиг, сост(8)
8	с	2	сост(2), вытолкнуть
8	a		сдвиг, сост(5)
9	e		сдвиг, сост(10)
9	d		сдвиг, сост(11)
10	d, e		сост(9), втолкнуть(11)
11	a, c, d, e, ┤	2	сост(2), вытолкнуть
11	a, c, d, e, ┤	4	сост(4), вытолкнуть
11	a, c, d, e, ┤	7	сост(7), вытолкнуть
11	a, c, d, e, ┤	8	сост(8), вытолкнуть
11	a, c, d, e, ┤	11	сост(11), вытолкнуть

Таблица 2

Протокол работы МП-распознавателя

Шаг	Состояние	Символ	Магазин	Действие
1	1	a	Ñ	сдвиг, сост(3)
2	3	d	Ñ	сост(9), втолкнуть(4)
3	9	d	4 Ñ	сдвиг, сост(11)
4	11	e	4 Ñ	сост(4), вытолкнуть
5	4	e	Ñ	сост(9), втолкнуть(2)
6	9	e	2 Ñ	сдвиг, сост(10)
7	10	d	2 Ñ	сост(9), втолкнуть(11)
8	9	d	11 2Ñ	сдвиг, сост(11)
9	11	c	11 2 Ñ	сост(11), вытолкнуть
10	11	c	2 Ñ	сост(2), вытолкнуть
11	2	c	Ñ	сдвиг, сост(4)
12	4	┤	Ñ	допустить

В результате выполнения преобразования получим МП-распознаватель с одним состоянием, который можно задать таблицей (табл. 3), строки которой соответствуют магазинным символам и маркеру дна, а столбцы – входным символам и концевому маркеру. В клетке таблицы, находящейся в строке x и столбце a, записывается значение функции перехода или выхода на паре (a, x). Для того, чтобы не загромождать таблицу, операции держать и отвергнуть записывать не будем, а операцию зам(ε) будем записывать как вытолкнуть. Начальным содержимым магазина МП-распознавателя (табл. 3) будет 1 Ñ.

Таблица 3

МП-распознаватель с одним состоянием

	a	b	c	d	e	┤
1	зам (3) сдвиг	зам (2 5)	зам (2 5)	зам (2 5)	зам (2 5)
2			зам (4) сдвиг
3				зам (4 9)	зам (4 9)
4				зам (2 9)	зам (2 9)	вытолкнуть
5		зам (6) сдвиг	вытолкнуть	зам (7 9)	зам (7 9)
6				зам (8 9	зам (8 9)
7				зам (8)сдвиг
8	зам (5)сдвиг		вытолкнуть
9				зам (11)сдвиг	зам (10)сдвиг
10				зам (11 9)	зам (11 9)
11	вытолкнуть		вытолкнуть	вытолкнуть	вытолкнуть	вытолкнуть
Ñ						допустить

В табл. 4 представлен протокол работы МП-распознавателя (табл. 3) при обработке цепочки adedc┤. Сравнивая протоколы работы распознавателей можно сделать вывод о том, что на каждом шаге работы содержимое магазина МП-распознавателя с одним состоянием отличается от содержимого магазина МП-распознавателя с множеством состояний на соответствующем шаге только наличием в вершине магазина текущего состояния МП-распознавателя с множеством состояний.

Таким образом, в статье описаны правила преобразования МП-распознавателя с конечным множеством состояний в эквивалентный ему МП-распознаватель с одним состоянием, который в процессе распознавания анализирует только входную цепочку и содержимое магазина. Это позволяет сократить количество параметров, определяющих поведение распознавателя с магазинной памятью. Распознаватель с одним состоянием имеет более компактное представление, чем распознаватель с конечным множеством состояний. При этом, следует отметить, устранение множества состояний не приводит к расширению множества магазинных символов.

Таблица 4

Протокол работы МП-распознавателя с одним состоянием

Шаг	Символ	Магазин	Действие
1	a	1 Ñ	ЗАМ(3) СДВИГ
2	d	3 Ñ	ЗАМ(4 9) ДЕРЖАТЬ
3	d	9 4 Ñ	ЗАМ(11) СДВИГ
4	e	11 4 Ñ	ВЫТОЛК ДЕРЖАТЬ
5	e	4 Ñ	ЗАМ(2 9) ДЕРЖАТЬ
6	e	9 2 Ñ	ЗАМ(10) СДВИГ
7	d	10 2 Ñ	ЗАМ(11 9) ДЕРЖАТЬ
8	d	9 11 2 Ñ	ЗАМ(11) СДВИГ
9	c	11 11 2Ñ	ВЫТОЛК ДЕРЖАТЬ
10	c	11 2 Ñ	ВЫТОЛК ДЕРЖАТЬ
11	c	2 Ñ	ЗАМ(4) СДВИГ
12	┤	4 Ñ	ВЫТОЛК ДЕРЖАТЬ
13	┤	Ñ	ДОПУСТИТЬ

References

1. Schutzenberger M.P. «On context-free languages and pushdown automata», Information and Control 6:3 (1963). pp. 246. 264.

2. Aho A., Ul'man Dzh. Teoriya sintaksicheskogo analiza, perevoda i kompilyacii. M.: Mir. 1978. T. 1. 612 s.

3. L'yuis F., Rozenkranc D., Stirnz R. Teoreticheskie osnovy proektirovaniya kompilyatorov. M. : Mir, 1979. 656 s.

4. Opaleva E.A., Samoylenko V.P. Yazyki programmirovaniya i metody translyacii. SPb.: «BHV-Peterburg», 2005. 471 s.

5. Aho A., Lam M., Seti R., Ul'man Dzh. Kompilyatory. Principy, tehnologii i instrumentariy. M: Izdatel'skiy dom «Vil'yams», 2008. 1185 s.

6. Serebryakov, V.A. Teoriya i realizaciya yazykov programmirovaniya. M.: Fizmatlit, 2012. 233 s.

7. Polyakov V.M., Ryazanov Yu. D. Algoritm postroeniya nerekursivnyh programm-raspoznavateley lineynoy slozhnosti po determinirovannym sintaksicheskim diagrammam // Vestnik BGTU im. V.G. Shuhova. № 6. 2013. S. 194-199.

8. Ryazanov Yu. D. Sintez raspoznavateley s magazinnoy pamyat'yu po determinirovannym sintaksicheskim diagrammam // Vestnik VGU. Sistemnyy analiz i informacionnye tehnologii. 2014. №1. S. 138-145.

This work is licensed under Creative Commons Attribution 4.0 International

Submit manuscript Download PDF
Text JATS XML

To cite

Citations:

Confirmation

Регистрация