Cong ty Cong Nghe Tin hoc Nha truong | School@net - Bài viết | Thuật toán Phân tích từ-dưới-lên & Trình biên dịch trong phân tích câu

Hotline: 024.62511017

024.62511081

Phần mềm Dành cho nhà trường

Phần mềm Hỗ trợ học tập

Kho phần mềm

Đăng nhập | Đăng ký

Tìm kiếm

School@net

Xem bài viết theo các chủ đề hiện có

Hoạt động của công ty (726 bài viết)

Hỗ trợ khách hàng (498 bài viết)

Thông tin tuyển dụng (57 bài viết)

Thông tin khuyến mại (80 bài viết)

Sản phẩm mới (216 bài viết)

Dành cho Giáo viên (549 bài viết)

Lập trình Scratch (3 bài viết)

Mô hình & Giải pháp (156 bài viết)

IQB và mô hình Ngân hàng đề kiểm tra (127 bài viết)

TKB và bài toán xếp Thời khóa biểu (242 bài viết)

Học tiếng Việt (183 bài viết)

Download - Archive- Update (289 bài viết)

Các Website hữu ích (70 bài viết)

Cùng học (92 bài viết)

Learning Math: Tin học hỗ trợ học Toán trong nhà trường (78 bài viết)

School@net 15 năm (154 bài viết)

Mỗi ngày một phần mềm (7 bài viết)

Dành cho cha mẹ học sinh (124 bài viết)

Khám phá phần mềm (122 bài viết)

GeoMath: Giải pháp hỗ trợ học dạy môn Toán trong trường phổ thông (36 bài viết)

Phần mềm cho em (13 bài viết)

ĐỐ VUI - THƯ GIÃN (363 bài viết)

Các vấn đề giáo dục (1210 bài viết)

Bài học trực tuyến (1037 bài viết)

Hoàng Sa - Trường Sa (17 bài viết)

Vui học đường (275 bài viết)

Tin học và Toán học (220 bài viết)

Truyện cổ tích - Truyện thiếu nhi (180 bài viết)

Việt Nam - 4000 năm lịch sử (97 bài viết)

Xem toàn bộ bài viết (8223 bài viết)

Đăng nhập/Đăng ký

Thành viên có mặt

Khách: 13

Thành viên: 0

Tổng cộng: 13

Số người truy cập

Hiện đã có 89675676 lượt người đến thăm trang Web của chúng tôi.

Thuật toán Phân tích từ-dưới-lên & Trình biên dịch trong phân tích câu

Ngày gửi bài: 14/07/2009
Số lượt đọc: 3519

Mặc dù có nhiều lệnh gọi đệ quy trong các chương trình ở phần trước, có một bài tập hướng dẫn để loại đi sự đệ quy một cách có hệ thống. Mỗi lệnh gọi thủ tục có thể được thay bằng một thủ tục cất vào ngăn xếp và thay mỗi thủ tục trả về bởi một lệnh lấy khỏi ngăn xếp, bắt chước những gì hệ Pascal thực hiện để cài đặt đệ quy. Cũng vậy, nhớ lại rằng một lý do để làm điều này là nhiều lệnh gọi có vẻ như đệ quy nhưng lại không thực sự đệ quy. Khi một lệnh gọi thủ tục là hành động cuối cùng của một thủ tục, thì một lệnh goto đơn giản có thể được sử dụng. Nó chuyển expression và term vào những vòng lặp đơn giản có thể được trộn lại với nhau và được tổ hợp với factor để sinh ra một thủ tục duy nhất với một lệnh đẹ quy thực sự (lệnh gọi tới expression trong factor).

Cách nhìn này trực tiếp dẫn tới một phương pháp thật đơn giản để kiểm tra khi nào các biểu thức chính quy là hợp lệ. Một khi tất cả các lệnh gọi thủ tục đã được loại bỏ, ta thấy rằng mỗi ký hiệu kết thúc sẽ chỉ được quét khi nó bị bắt gặp. Việc xử lý duy nhất được thực hiện thực sự là kiểm tra xem có một dấu ngoặc phải sánh được với mỗi một dấu ngoặc trái hay không, khi nào thì mỗidấu "+" là được theo sau bởi một chữ cái hoặc một dấu "(", và khi nào thì mỗi dấu "*" là được theo sau bởi một chữ cái hoặc một dấu ")". Nghĩa là, việc kiểm tra khi nào một biểu thức chính quy là hợp lệ sẽ chủ yếu tương đương với việc kiểm tra xem có sự cân bằng số dấu ngoặc hay không. Điều này có thể được cài đặt một cách đơn giản bằng cách duy trì một biến đếm (counter), được khởi động là 0, được tăng lên khi bắt gặp một dấu ngoặc trái và được giảm đi khi bắt gặp một dấu ngoặc phải. Nếu biến đếm là 0 ở cuối biểu thức, và các ký hiệu "+" và "*" trong biểu thức thoả mãn các yêu cầu vừa được nêu, thì biểu thức là hợp lệ.

Dĩ nhiên, có những phân tích khác hơn là chỉ kiểm tra khi nào dãy nhập vào là hợp lệ: mục đích là để xây dựng cây phân tích (ngay cả theo cách ngầm định, như trong bộ phân tích từ-trên-xuống) cho công việc xử lý khác nữa. Có khuynh hướng là có thể làm điều này với các chương trình với cùng một cấu trúc chủ yếu như bộ kiểm tra dấu ngoặc đã được mô tả trong đoạn trước. Một kiểu bộ phân tích mà nó thực hiện theo cách này thường được gọi là bộ phân tích giảm-phép-dịch-chuyển. Ý tưởng là duy trì một ngăn xếp đẩy xuống (pushdown stack) chứa các ký hiệu kết và chưa kết. Mỗi bước trong việc phân tích sẽ hoặc là một bước dịch-chuyển, trong đó đưon giản là ký tự nhập kế sẽ được cất trên ngăn xếp, hoặc là một bước làm giảm, trong đó các ký tự tại đỉnh ngăn xếp được đối sánh với vế phải của một luật sinh nào đó trong văn phạm và được thay bằng ký tự chưa kết trên vế trái của luật sinh đó. (Khó khăn chính trong việc xây dựng một bộ phân tích giảm-phép-dịch-chuyểnlầ quyết định xem khi nào thì dịch chuyển và khi nào thì làm giảm. Đây có thể là một quyết định phức tạp, phụ thuộc vào văn phạm). Sau này,tất cả các ký tự nhập vào được dịch chuyểnvào trong ngăn xếp, và cuối cùng, ngăn xếp được làm giảm thành một ký hiệu chưa kết đơn lẻ.

Phân tích từ-dưới-lên thường được xem là phương pháp lựa chọn cho các ngôn ngữ lập trình thực sự, và có một tài liệu mở rộng việc phát triển các bộ phân tích cho các bộ văn phạm lớn có kiểu được yêu cầu để mô tả một ngôn ngữ lập trình. Mô tả ngắn gọn của chúng ta chỉ lướt qua bề mặt của các kết quả đã được tạo ra.

Trình biên dịch

Một trình biên dịch có thể được xem như một chương trình dịch một ngôn ngữ thành một ngôn ngữ khác. Ví dụ, một trình biên dịch Pascal dịch các chương trình từ ngôn ngữ Pascal thành ngôn ngữ máy của một máy cụ thể nào đó. Ta sẽ minh hoạ một cách làm điều này bằng cách tiếp tục với ví dụ đối-sánh-mẫu-biểu-thức-chính-quy; tuy nhiên, bây giờ ta mong muốn dịch từ ngôn ngữ của các biểu thức chính quy thành một "ngôn ngữ" cho các máy đối-sánh-mẫu, các mảng ch, next1, next2 của chương trình match (trong chương trình Thuật toán trong Đối sánh mẫu trong kỳ trước).

Tiến trình dịch chủ yếu là "một-một" : Với mỗi ký tự trong mẫu (ngoại trừ các dấu ngoặc đơn), ta muốn sinh ra một trạng thái cho máy đối-sánh-mẫu. Mẹo là lưu giữ dấu vết của thông tin cần thiết để đổ vào trong các mảng next1 và next2. Để làm điều đó ta sẽ chuyển mỗi một thủ tục trong bộ phân tích đệ-quy-xuống thành các hàm mà nó khởi tạo các máy đối-sánh-mẫu. Mỗi hàm sẽ thêm vào các trạng thái mới khi cần vào cuối của các mảng ch, next1 và next2 và trả về chỉ mục của trạng thái khởi đầu của máy đã được khởi tạo (trạng thái cuối sẽ luôn luôn là đầu vào cuối cùng trong các mảng). Ví dụ, hàm được cho dưới đây đối với luật sinh của sẽ tạo ra các trạng thái "hoặc" (or) cho máy đối-sánh-mẫu:

++

fuction expression: integer;

var ti, t2: integer;

begin

t1:=term; expression:=t1;

if p[j]= '+' then

begin

j:= j+1; state:= state+1; t2:=state; expression:=t2; state:=state+1;

setstate(t2, '', expression, t1);

setstate(t2-1,' ', state,state );

end;

end;

++

Hàm này sử dụng một thủ tục setstate mà nó chỉ đơn giản là đặt các đầu vào cho các mảng ch, next1 và next2 được chỉ mục bởi tham số đầu tiên chứa các giá trị được cho trong các tham số thứ 2, thứ 3 và thứ 4 tương ứng. Chỉ mục state lưu giữ tình trạng "hiện hành" của máy đang được xây dựng: Mỗi khi một trạng thái mới được tạo ra, state được tăng lên. Vì vậy các chỉ mục trạng thái cho máy sẽ tương ứng với một dãy lệnh gọi thủ tục cụ thể giữa giá trị của state ở đầu vào và giá trị state ở đầu ra. Chỉ mục trạng thái cuối là giá trị của state lúc thoát ra (chúng ta không thực sự " tạo" các trạng thái cuối cùng bằng cách tăng state trước khi thoát ra, vì điều này khiến cho nó dễ "trộn lẫn" trạng thái cuối cùng với trạng thái khởi đầu sau đó).

Với quy ước này, ta sẽ kiểm chứng (chú ý lệnh gọi đệ quy !) là chương trình ở trên cài đặt quy tắc cho việc tổ hợp hai máy với phép toán or. Trước hết máy dành cho phần đầu của biểu thức được xây dựng (một cách đệ quy), sau đó 2 trạng thái null mới được thêm vào và phần trhứ hai của biểu thức được xây dựng. Trạng thái null đầu tiên (với chỉ mục của biểu thức t2-1) là trạng thái cuối của máy cho phần đầu của biểu thức mà nó được chế tạo thành một trạng thái "no-op" để nhảy tới trạng thái kết thúc của máy cho phần thứ hai của biểu thức như được yêu cầu. Trạng thái null thứ hai (với chỉ mục t2) là trạng thái khởi đầu, như thế chỉ mục của nó là giá trị trả về cho expression và các đầu vào next1 và next2 được tạo ra để chỉ tới những trạng thái khởi đầucủa hai biểu thức. Chú ý là những biểu thức này được cấu tạo theo thứ tự đảo ngược với những gì ta mong muốn, do giá trị của state cho trạng thái no-op là không biết được cho đến khi lệnh gọi đệ quy tới expression được tạo ra.

Hàm trước tiên xây dựng một cái máy cho một và sau đó, nếu cần, trộn trạng thái kết thúc của máy đó với trạng thái khởi đầu của máy cho một khác. Điều này dễ dàng được thực hiện vì state là chỉ mục trạng thái kết thúc của lệnh gọi tới factor. Một lệnh gọi tới term mà không tăng state được thực hiện mẹo sau:

++

function term;

var t: integer;

begin

term:=factor;

if (p[j] = '(' ) or letter(p[j]) then

t:=term

end;

++

(chúng ta không cần dùng đến chỉ mục trạng thái khởi đầu được trả về bởi lệnh gọi thứ hai tới term, nhưng Pascal yêu cầu chúng ta đặt nó vào đâu đó, do đó ta sẽ bỏ nó vào một biến tạm i)

Hàm cho sử dụng các kỹ thuật tương tự để kiểm soát ba trường hợp của nó: một dấu ngoặc đại diện cho một lệnh gọi đệ quy trên expression; một ký hiệu v đại diện cho phép nối một trạng thái mới cuối chuỗi; và một dấu * đại diện cho các phép toán tương tự như các phép toán trong expression.

++

funtion factor;

var t1, t2: integer;

begin t1:=state;

if p[j] = '(' then

begin

j:= j+1; t2:= expression;

if p[j]=')' then j:=j+1 else error

end

else if letter(p[j]) then

begin

setstate(state, p[j], state+1, state+1);

t2:= state; j:=j+1; state:=state+1

end;

else error;

if p[j] <> '*' then factor:= t2 else

begin

setstate(state,' ', state+1, t2);

factor:=state; next1[t1-1]:= state;

j:= j+1; state:= state+1;

end;

end;

++

Với ví dụ của chúng ta, làm thế nào các trạng thái được kiến tạo cho mẫu (A*B+AC)D. Đầu tiên, trạng thái 1 được xây dựng cho A. Sau đó, trạng thái 2 được xây dựng cho toán hạng kết (closure) và trạng thái 3 được gắn vào cho B. Kế đó, dấu "+" được bắt gặp và các trạng thái 4, 5 được xây dựng bởi expression, nhưng các vùng của chúng không thể được đổ đầy cho đến khi thực hiện xong một lệnh gọi đệ quy với expression, và điều này cuối cùng gây ra việc tạo dựng các trạng thái 6 và 7. Cuối cùng phéo nối của D được điều khiển bởi trạng thái 8, để lại trạng thái 9 như là trạng thái kết thúc.

Bước cuối cùng trong việc phát triển một thuật toán đối-sánh-mẫu biểu-thức-chính-quy là gắn các thủ tục này lại với nhau cùng thủ tục match:

++

procedure matchall;

begin

j:=1; state:=1; next[0]:= expression;

setstate(state, ' ', 0,0);

for i:=1 to N-1 do

if match(i) >= i then

writeln(i);

end;

++

Chương trình này in ra tất cả các vị trí ký tự trong một chuỗi văn bản a[1..N] ở đó có một mẫu p[1..M] dẫn tới sự trùng khớp.

School@net

Những bài viết khác:

PHƯƠNG PHÁP KHỬ ĐỆ QUY ĐẶC BIỆT (24/08/2010)

GIẢI BÀI TOÁN NGƯỜI DU LỊCH NỔI TIẾNG BẰNG MÔ PHỎNG HÀNH VI CỦA ĐÀN KIẾN TRONG TỰ NHIÊN (10/08/2010)

Thuật toán: Heuristic bằng số thực (04/08/2010)

Duyệt từ 2 phía (31/07/2010)

Phương pháp phân rã hình học (12/07/2010)

Bàn thêm về thuật toán floyd-warshall (25/06/2010)

Thuật toán Karatsuba (23/05/2010)

THUẬT TOÁN SẮP XẾP VỚI ĐỘ PHỨC TẠP THỜI GIAN TUYẾN TÍNH (26/04/2010)

Quy hoạch động và ứng dụng (23/03/2010)

Thuật toán Floyd ứng dụng cho bài toán tìm đường đi ngắn nhất (19/02/2010)

Xem tiếp...

HỖ TRỢ KHÁCH HÀNG

Hướng dẫn đặt mua phần mềm trực tuyến

Hướng dẫn thanh toán

Bảo hành, đổi trả

Quy định, chính sách

Chính sách giao hàng

THÔNG TIN CÔNG TY

Giới thiệu về công ty

Thông tin Tuyển dụng

Thông tin Khuyến mại

TỔNG ĐÀI TRỢ GIÚP

Trang thông tin hỗ trợ khách hàng

Trang bán hàng trực tuyến

Đặt mua nhanh phần mềm

Tư vấn trực tiếp: 024.62511017


CÔNG TY CÔNG NGHỆ TIN HỌC NHÀ TRƯỜNG

Phòng 804 - Nhà 17T1 - Khu Trung Hoà Nhân Chính - Quận Cầu Giấy - Hà Nội Phone: 024.62511017 - 024.62511081 Email: kinhdoanh@schoolnet.vn
Bản quyền thông tin trên trang điện tử này thuộc về công ty School@net
Ghi rõ nguồn www.vnschool.net khi bạn phát hành lại thông tin từ website này
Site xây dựng trên cơ sở hệ thống NukeViet - phát triển từ PHP-Nuke, lưu hành theo giấy phép của GNU/GPL.