Hotline: 024.62511017

024.62511081

  Trang chủ   Sản phẩm   Phần mềm Dành cho nhà trường   Phần mềm Hỗ trợ học tập   Kho phần mềm   Liên hệ   Đăng nhập | Đăng ký

Tìm kiếm

School@net
 
Xem bài viết theo các chủ đề hiện có
  • Hoạt động của công ty (726 bài viết)
  • Hỗ trợ khách hàng (498 bài viết)
  • Thông tin tuyển dụng (57 bài viết)
  • Thông tin khuyến mại (80 bài viết)
  • Sản phẩm mới (216 bài viết)
  • Dành cho Giáo viên (549 bài viết)
  • Lập trình Scratch (3 bài viết)
  • Mô hình & Giải pháp (156 bài viết)
  • IQB và mô hình Ngân hàng đề kiểm tra (127 bài viết)
  • TKB và bài toán xếp Thời khóa biểu (242 bài viết)
  • Học tiếng Việt (183 bài viết)
  • Download - Archive- Update (289 bài viết)
  • Các Website hữu ích (70 bài viết)
  • Cùng học (92 bài viết)
  • Learning Math: Tin học hỗ trợ học Toán trong nhà trường (78 bài viết)
  • School@net 15 năm (154 bài viết)
  • Mỗi ngày một phần mềm (7 bài viết)
  • Dành cho cha mẹ học sinh (124 bài viết)
  • Khám phá phần mềm (122 bài viết)
  • GeoMath: Giải pháp hỗ trợ học dạy môn Toán trong trường phổ thông (36 bài viết)
  • Phần mềm cho em (13 bài viết)
  • ĐỐ VUI - THƯ GIÃN (363 bài viết)
  • Các vấn đề giáo dục (1210 bài viết)
  • Bài học trực tuyến (1037 bài viết)
  • Hoàng Sa - Trường Sa (17 bài viết)
  • Vui học đường (275 bài viết)
  • Tin học và Toán học (220 bài viết)
  • Truyện cổ tích - Truyện thiếu nhi (180 bài viết)
  • Việt Nam - 4000 năm lịch sử (97 bài viết)
  • Xem toàn bộ bài viết (8223 bài viết)
  •  
    Đăng nhập/Đăng ký
    Bí danh
    Mật khẩu
    Mã kiểm traMã kiểm tra
    Lặp lại mã kiểm tra
    Ghi nhớ
     
    Quên mật khẩu | Đăng ký mới
     
    Thành viên có mặt
    Khách: 3
    Thành viên: 0
    Tổng cộng: 3
     
    Số người truy cập
    Hiện đã có 89588728 lượt người đến thăm trang Web của chúng tôi.

    Các cấu trúc dữ liệu đặc biệt

    Ngày gửi bài: 06/10/2008
    Số lượt đọc: 3172

    Chỉ cần qua câu nói "Algorithms+Data Structures = Program" của Niklaus Wirth ta đã có thể thấy được tầm quan trọng của các loại cấu trúc dữ liệu [data structures] trong giải các bài toán tin. Ứng dụng 1 cách thuần thục hiệu quả các loại cấu trúc sẽ đem đến những thuận lợi vô cùng lớn cho các lập trình viên. Ngoài những cấu trúc dữ liệu chuẩn, quen thuộc như array, record, queue,... còn có 1 số cấu trúc dữ liệu khác có hiệu quả đặc biệt trong 1 số dạng bài tập. Mặc dù vậy, tài liệu tiếng việt về những cấu trúc này lại khá ít, đặc biệt là Interval Tree, Binary Indexed Tree và Range minimum Query. Trong chuyên đề này sẽ đề cập tới 1 số loại cấu trúc thường xuyên được sử dụng: Interval tree, Binary Indexed Tree, Heap, Range Minimum Query và Disjoint set. Để giúp bạn hiểu rõ các cấu trúc đó, sẽ có thêm 1 số ví dụ điển hình cho những ứng dụng khác nhau của chúng.

    I. Interval Tree.

    Interval Tree là 1 cấu trúc vô cùng hữu dụng, được sử dụng rất nhiều trong các bài toán về dãy số. Ngoài ra Interval Tree còn được sử dụng trong 1 số bài toán hình học. Có thể nói nếu nắm rõ Interval Tree bạn đã làm được 1 nửa số bài toán về dãy số rồi đấy!.

    Xin nói thêm thực ra Interval Tree tên gọi chính xác là Segment Tree nhưng cái tên Interval Tree được sử dụng nhiều hơn ở Việt Nam. Nếu tìm trong “Introduction to Algorithms 2nd Edition” thì bạn sẽ thấy 1 cấu trúc mang tên Interval tree nhưng với nội dung khác so với những gì sẽ được trình bày ở dưới đây.

    Ta sẽ xem xét 1 bài toán đơn giản sau để hiểu thế nào là cây Interval Tree:

    Bài toán: Cho 1 dãy số gồm N phần tử (N<=10000) ban đầu đều mang giá trị 0. Có 2 loại thao tác cơ bản:

    1. INC i gtr: tăng giá trị phần tử thứ i lên gtr đơn vị.

    2. GET L R: tìm và trả về tổng giá trị của các phần tử từ L tới R.

    Trong file input có M<=100000 thao tác. Yêu cầu tương ứng với mỗi thao tác GET đưa ra kết quả tương ứng trong file output. Dữ liệu đảm bảo các kết quả trong phạm vi longint.

    Thuật toán đơn giản nhất cho bài toán này là làm thô thiển: với mỗi thao tác INC ta tăng giá trị của A[i] và với mỗi thao tác GET tính lại tổng các số trong đoạn từ L tới R. Độ phức tạp thuật toán là O(M*N) không thể chạy được với những test lớn.

    Vậy làm cách nào để cải tiến thuật toán? Ta có thể dùng Interval Tree để làm giảm độ phức tạp của phép lấy tổng. Nếu làm như trên, mỗi thao tác GET sẽ thực hiện trong O(N), nếu dùng Interval Tree thì độ phức tạp chỉ còn là O(logN), bằng cách tính trước 1 số đoạn nhỏ trong đoạn [L,R] cần tính và khi tính tổng đoạn [L,R] chỉ cần tính tổng các đoạn nhỏ nằm trong nó.

    Cấu trúc cây Interval được sử dụng có thể mô tả như sau:

    - Gốc của cây là nút lưu tổng (tức là quản lý) các đoạn trong khoảng từ 1..N

    - Xét 1 nút bất kì lưu tổng đoạn từ L..R

    + Nếu L=R nút này không có con

    + Nếu L<>R, nút này có 2 con: con trái lưu tổng đoạn từ L tới Mid và con phải lưu tổng đoạn từ Mid+1 tới R, trong đó Mid=(L+R) div 2.

    VD: nếu 1 cây interval tree của 1 dãy có N=7 phần tử thì đồ thị miêu tả cây này sẽ có dạng: (số ghi tại mỗi nút là đoạn phần tử nó quản lý).


    Khi đó thao tác GET đoạn U,V có thể viết đơn giản như sau:

    GET(U,V,L,R) {lấy tổng đoạn U..V, đang xét đoạn L..R}

    1. if (VR) --> exit {ngoài đoạn U..V}

    2. if (U>L) and (V result+=A[L..R]; exit {thuộc hoàn toàn trong đoạn U..V}

    3. result+=GET(U,V,L,mid)+GET(U,V,mid+1..R); {đoạn đang xét giao với đoạn cần lấy tổng}

    Và gọi GET(U,V,1,n) với result khởi tạo bằng 0.

    Dễ thấy số lần thực hiện đệ quy nhỏ hơn O(2*logN) vì thủ tục GET này chỉ được gọi tiếp khi đoạn L..R giao và không thuộc đoạn U..V. Như vậy thao tác GET thay vì thực hiện trong O(N) nay đã có thể thực hiện trong O(logN). Còn thao tác INC thì sao? Rõ ràng thao tác INC không chỉ đơn giản là cập nhật lại phần tử thứ I như trước mà ta còn phải điều chỉnh cả cây Interval Tree sao cho đúng với mô tả. Để update lại cây Interval Tree với mỗi thao tác tăng giá trị phần tử thứ I ta phải tăng mỗi nút của cây mà quản lý I lên 1 giá trị gtr. Hàm INC được viết lại:
    INC(i,gtr,L,R){xét nút L..R, cần tăng I lên gtr đơn vị}

    1. if (L>i) or (R exit {khoảng đang xét không chứa i}

    2. A[L..R]+=gtr{nút này có chứa I}

    3. INC(i,gtr,L,mid)

    4. INC(i,gtr,mid+1,R)

    Độ phức tạp của thao tác INC cũng không vượt quá O(2*logN) vì độ cao của cây interval luôn nhỏ hơn logN.

    Như vậy độ phức tạp của thao tác INC mặc dù tăng từ O(1) lên O(logN) nhưng độ phức tạp chung của bài toán chỉ còn lại là O(MlogN) nhanh hơn hẳn so với thuật toán thô sơ ban đầu.

    (Lưu ý: đây chỉ là bài ví dụ, trên thực tế có những cách nhanh hơn để xử lý bài toán này mà không dùng tới interval tree).

    Qua ví dụ trên ta cũng có thể hiểu qua phần nào về cấu trúc và ý nghĩa sử dụng của Interval tree: Gốc là nút lưu toàn bộ thông tin (mà trong ví dụ là tổng) từ 1 tới N, từ gốc thông tin 1 nút được chia nhỏ ra quản lý ở 2 nút con trái và phải cho tới khi mỗi nút chỉ lưu thông tin của 1 phần tử. Lợi ích trong phương pháp sử dụng interval tree là với 1 số đoạn con ta có thể lấy trực tiếp được thông tin trong đoạn con đó mà không phải đi lấy thông tin trong từng phần tử nhỏ trong đoạn, việc này giúp giảm độ phức tạp trong các thao tác từ O(N) xuống O(logN).

    Tư tưởng của Interval tree là dùng “chia để trị”: “chia” đoạn lớn thành các đoạn nhỏ hơn để có thể “trị” nhanh chóng.

    1 câu hỏi khác được đặt ra là lưu trữ interval tree trong thực tế như thế nào, vì ta không thể hầu như không thể bỏ ra N^2 đoạn để lưu các đoạn từ L..R được, quá tốn bộ nhớ với N lớn. Câu trả lời là ta sẽ dùng 1 mảng 1 chiều để lưu trữ interval tree:

    Data for Interval Tree

    1. Root lưu đoạn 1..N, được lưu trữ ở A[1].

    2. Nếu Node I lưu đoạn [L..R] và L

    3. Thì Node 2*I lưu đoạn [L..mid] và Node 2*I+1 lưu đoạn [mid+1..R].

    Độ cao của interval tree luôn nhỏ hơn hoặc bằng logN. Như vậy bộ nhớ dùng cho interval tree là O(2^(logN+1). Trong thực tế có thể khai báo mảng O(N*3) hoặc O(N*4) là đủ. (Tất nhiên cũng có thể dùng Linklist – danh sách động để lưu interval tree nhưng cách này tốn bộ nhớ hơn và không tiện bằng, không hay được dùng). Nhược điểm của cách lưu này là ta không thể biết được đoạn [L..R] có được lưu trọn trong 1 nút không và nếu có thì nút đó là nút nào mà buộc phải lặp lại 1 quá trình với độ phức tạp O(logN) từ gốc tới đoạn [L..R].

    Các thông tin được lưu trong 1 node của interval tree là thông tin tổng hợp của đoạn mà nó quản lý, bởi vậy thông tin này phải là dạng tích luỹ được, ví dụ như tổng, hiệu, min hoặc max,...

    Từ sau đây ta gọi chung các thao tác sửa cây Interval là các thao tác UPDATE, các thao tác lấy thông tin từ cây là thao tác GET.

    Ứng dụng của cây Interval tree đa dạng, phong phú vô cùng. Sau đây ta sẽ tìm hiểu một số ứng dụng cơ bản và hay gặp nhất. Mỗi ví dụ sẽ mô tả 1 cách sử dụng interval tree tương đối khác nhau và thường gặp trong giải toán. 

    Ví dụ 1. Các bài toán cơ bản ứng dụng Interval Tree:

    a. Cho dãy số, có 1 số yêu cầu thuộc 2 loại thay đổi (tăng/gán lại) giá trị 1 phần tử hoặc tìm min, max các đoạn liên tiếp của dãy số: mỗi nút interval tree sẽ lưu giá trị min/max các phần tử nó quản lý.

    b. Cho dãy số, có 1 số yêu cầu gán thuộc 2 loại lại giá trị của 1 phần tử hoặc tìm tổng 1 số phần tử liên tiếp của dãy. Bài toán tương tự như ví dụ.

    Ví dụ 2: POSTERS – AMPPZ 2001.

    Tóm tắt đề bài: Có N tấm poster chiều cao 1. Theo thứ tự các tấm poster được dán lên 1 đoạn tường cũng có chiều cao 1. Đoạn tường được xây bởi các viên gạch 1*1, đánh số từ trái sang phải bắt đầu từ 1. Các tấm poster sẽ phủ 1 đoạn liên tiếp từ viên gạch Li tới viên gạch Ri, tấm poster được dán sau sẽ phủ lên tấm poster được dán trước. Vì vậy, sau khi dán xong cả N tấm poster thì có thể có những tấm poster không thể được nhìn thấy.

    Yêu cầu: Đếm số loại poster khác nhau có thể nhìn thấy được từ ngoài vào.

    Input: Dòng đầu ghi N là số tấm poster. Trong N dòng tiếp theo mỗi dòng chứa 2 số Li và Ri thể hiện đầu trái và đầu phải của tấm poster thứ i.

    Output: Duy nhất 1 dòng ghi số loại poster có thể nhìn thấy được.

    Giới hạn: N<=40000. Li,Ri<=10^9.

    Hướng dẫn:

    Bài toán có thể phát biểu 1 cách dễ hiểu như sau: Cho dãy số M phần tử, có 1 số thao tác tô màu các phần tử của dãy số. Sau khi kết thúc chuỗi thao tác đếm số màu khác nhau của dãy số trên. Với M nhỏ, ta chỉ cần lưu lại được màu của các phần tử sau đó xem có bao nhiêu màu khác nhau là được. Nhưng nếu xét trong bài toán POSTERS này, thì M của chúng ta sẽ có thể lên tới giá trị 10^9. Do đó, ta phải làm nhỏ lại giá trị này. Bằng cách nào? Nhận xét với 2 ô mà giữa chúng không có đầu mút của tấm poster nào thì chắc chắn màu sắc của chúng giống nhau. Từ đó ta thực hiện trộn tất cả các đầu mút của các đoạn, sắp xếp tăng dần chúng. Thay vì phải xét tất cả các ô (có thể lên tới 10^9 ô) ta chỉ cần xét các ô là đầu mút của các đoạn, số lượng này chỉ khoảng 80000 số, hoàn toàn có thể lưu trữ được. Phương pháp ta vừa áp dụng còn được gọi là phương pháp “Rời rạc hoá”, ứng dụng hiệu quả nhiều trong các bài toán khác nhau, nhất là khi sử dụng các cấu trúc dữ liệu đặc biệt. Ý nghĩa chủ yếu là với 1 đoạn lớn các phần tử giống hệt nhau, không cần xét mọi phần tử mà chỉ xét 1 phần tử đại diện. Sau đây các bạn sẽ còn gặp nhiều bài toán sử dụng phương pháp này.

    Trở lại với bài toán của chúng ta, bây giờ phải sửa đổi màu các phần tử trong 1 đoạn liên tiếp. Với giới hạn M còn 80000 ta vẫn không thể làm thô được, mà sẽ dùng interval tree. Vì cuối cùng cần màu của mỗi phần tử nên cây interval được xây dựng phải bảo đảm điều kiện lấy được màu của các phần tử. Có 2 hướng lưu trữ cây interval như sau:

    1/ Tại mỗi nút lưu màu chung của các phần tử nó quản lý, khởi tạo là màu 0. Chính xác hơn là mỗi nút lưu màu cuối cùng mà nó được sửa, kèm theo thời gian nó được sửa thành màu đó. Quá trình sửa màu vẫn diễn ra bình thường nhưng kết hợp thêm cập nhật thời gian. Màu của 1 phần tử khi đó là màu của nút quản lý nó mà màu được cập nhật muộn nhất. Dễ thấy giá trị đó đúng là màu của phần tử đang xét. Để lấy màu ta chỉ cần đi từ gốc tới nút chứa duy nhất phần tử đó và chọn màu có thời gian lớn nhất.

    2/ Cây Interval lưu không chính xác màu của các nút mà chỉ lưu 1 cách gần đúng. 1 nút lưu màu nếu đó là màu chung của tất cả các phần tử nó quản lý, ngược lại lưu giá trị (-1). Ta sẽ kết hợp quá trình sửa đúng lại màu ch o các phần tử vào trong quá trình cập nhật và lấy giá trị các phần tử. Trong quá trình cập nhật, xét tới nút nào thuộc trong đoạn được tô mới màu thì gán luôn giá trị nút đó bằng màu mới và kết thúc (tương tự như bình thường), những nút cha của nút này được gán giá trị -1 (do màu các nút con của nó không còn giống nhau). Trong quá trình lấy giá trị phần tử, nếu 1 nút cha mang giá trị dương thì nút con sẽ mang giá trị của nút cha thay vì giá trị hiện thời của nó, cập nhật lại màu cần diễn ra trước khi xét tới các nút con của 1 nút.

    2 cách lưu trên đều khá đơn giản và dễ hiểu (theo tôi cách đầu tiên dễ hiểu và dễ cài đặt hơn còn cách thứ 2 cần hiểu rõ bản chất và tư duy mạch lạc, nếu không sẽ dễ nhầm lẫn giá trị các nút, nhưng nếu cài tốt sẽ nhanh và đỡ tốn bộ nhớ hơn cách đầu). Bạn nên thử cài lại bài toán theo cả 2 cách đã nêu và chọn cách phù hợp nhất cho mình. Tương tự hãy ứng dụng cây interval vào trường hợp tăng/giảm giá trị và tính tổng 1 số đoạn liên tiếp của dãy số.

    Ví dụ 3. MARS Map – Baltic OI 2001.

    Trên mặt phẳng toạ độ có N hình chữ nhật, có toạ độ các đỉnh trong khoảng từ 0 tới 30000. Tính diện tích phần mặt phẳng mỗi điểm bị phủ bởi ít nhất 1 hình chữ nhật.

    Input: Dòng đầu tiên ghi số N, trong N dòng tiếp theo mỗi dòng ghi 2 cặp số lần lượt là toạ độ điểm trái dưới và phải trên.

    Output: Duy nhất 1 số là tổng diện tích phần mặt phẳng bị phủ bởi ít nhất 1 hình chữ nhật.

    Giới hạn: N<=10000.

    Hướng dẫn:

    - Vì các toạ độ đều nguyên, nếu ta chia mặt phẳng thành lưới các ô vuông thì diện tích phần bị phủ bởi các HCN chính là số ô vuông thuộc ít nhất 1 HCN. Như vậy ta chỉ cần đếm với mỗi cột dọc rộng 1 đơn vị có bao nhiêu ô vuông như vậy là được.

    - Số ô bị phủ mỗi cột chỉ thay đổi khi các HCN phủ nó thay đổi. Do đó nếu giữa 2 cột i,i+1 không có sự thay đổi về các HCN phủ lên chúng thì số ô vuông bị phủ ở 2 cột này là bằng nhau. Sự thay đổi này chỉ có khi có 1 cạnh của 1 HCN hoàn toàn thuộc trên đường thẳng đứng giữa 2 cột trên.

    Từ 2 nhận xét trên ta đi tới thuật toán sau:

    - B1: sắp xếp chỉ số vị trí các cạnh thẳng đứng của các HCN theo chiều tăng dần, những cột thuộc giữa 2 chỉ số liên tiếp sẽ có số ô bị phủ bằng nhau, ta chỉ cần đếm lượng này rồi nhân với số lượng cột là được. Do đó chỉ xét 1 cột ngay sau vị trí 1 cạnh là đủ.

    - B2: xét các cột từ trái sang phải, nếu lần đầu tiên gặp 1 HCN (gặp cạnh dọc trái của nó) thì thêm đoạn mà nó phủ ở cột tương ứng, nếu đó là cạnh dọc phải của HCN thì loại bỏ đoạn mà nó phủ. Mỗi lần xét 1 cột đếm số lượng ô bị phủ của cột đó.

    Ta dùng interval tree cho quá trình này. Bài toán có thể được phát biểu lại như sau: Cho 1 dãy số có N số, có 1 số thao tác là tăng hoặc giảm 1 số phần tử liên tiếp của dãy lên 1 đơn vị, sau mỗi thao tác hỏi dãy số có bao nhiêu số lớn hơn 0. Với giá trị max toạ độ = 30000 thì giá trị N trên có thể lên tới 30000, nếu giá trị này lớn hơn sẽ rất khó khăn trong lưu trữ. Nhưng ta cũng có thể áp dụng phương pháp rời rạc hoá các đoạn liên tiếp giống nhau. Khi đó N lớn nhất chỉ bằng số HCN, tức là 10000 mà thôi, bài toán lúc này khác 1 chút: mỗi phần tử kèm 1 hằng giá trị, tính tổng hằng giá trị các phần tử lớn hơn 0.

    Với cách phát biểu này bài toán đã trở nên gần gũi hơn và dễ dàng giải quyết hơn rất nhiều. Chỉ cần lưu kèm mỗi nút cây interval là số lượng phần tử dương nó quản lý. Phần còn lại của bài toán xin nhường cho các bạn tự giải.

    Dạng mở rộng của interval tree:

    Ta đã thấy được sức mạnh của Interval tree trong xử lý bài toán dãy số. Vậy nếu với 1 bảng số thì sao? Nếu coi dãy số là 1 đoạn thẳng (1 chiều) thì bảng số có thể coi như 1 HCN (2 chiều), có sự mở rộng thêm 1 chiều nữa so với dãy số. Như vậy thì hoàn toàn có thể dùng Interval Tree theo 1 cách nào đó để xử lý các bảng số. Cây Interval Tree khi đó thường được gọi là Interval Tree 2D – Cây interval tree 2 chiều. Nếu như Interval Tree chỉ có 1 cách biểu diễn thông dụng và được dùng (tới 99.9% các bài toán dùng cấu trúc mô tả ở trên) thì lại có tới 2 cách hoàn toàn khác nhau để hiểu và biểu diễn Interval Tree 2D. Vậy thế nào là Interval Tree 2D? Xét ví dụ sau:

    Ví dụ 4: MATSUM - Al-Khawarizm 2006

    Cho ma trận N*N. Ban đầu tất cả các ô của ma trận đều mang giá trị 0. Các dòng đánh số từ 1 tới N từ trên xuống dưới, các cột được đánh số từ 1 tới N từ trái qua phải. Có 1 trình xử lý gồm 3 thao tác chính trên ma trận:

    1. SET x y num : gán giá trị của ô (x,y) giá trị num

    2. SUM x1 y1 x2 y2 : Tính và in ra tổng giá trị các ô trong HCN ô trái dưới (x1,y1) và phải trên (x2,y2) (x1<=x2, y1<=y2).

    3. END : kết thúc chương trình.

    Yêu cầu: viết chương trình đọc vào các lệnh của trình xử lý, tính và đưa ra kết quả của các thao tác SUM.

    Giới hạn: N<=1024.

    Định nghĩa HCN (x1,x2,y1,y2) là HCN giới hạn bởi 2 hàng x1,x2 và 2 cột y1,y2

    Cách 1: Quản lý song song cả 2 chiều:

    Với Interval tree thì các đoạn được chia đôi chia đôi dần. Sử dụng tư tưởng này trong Interval Tree 2D thì ta chia đôi theo cả 2D-2direction hàng và cột. Mỗi nút interval tree sẽ quản lý 1 bảng HCN nhỏ trong bảng HCN ban đầu và được chia thành 4 nút con. VD: 1 hình chữ nhật được chia làm 4 hình nhỏ hơn:

    Hay nói cách khác 1 nút (x1,x2,y1,y2) có thể có tối đa 4 nút con là (x1,mx,y1,my), (x1,mx,my+1,y1), (mx+1,x2,y1,my), (mx+1,x2,my+1,y2) với mx=(x1+x2)/2;my=(y1+y2)/2.

     

    Cây này hoàn toàn tương tự Interval tree, ta chỉ cần quản lý theo 2 chiều, có thể dùng mảng 1 chiều hoặc 2 chiều để quản lý tuỳ ý.

    Áp dụng vào bài toán trên ta lưu tại mỗi nút là tổng giá trị các ô mà HCN đó quản lý.

    Các hàm GET và UPDATE có thể viết hoàn toàn tương tự hàm với Interval tree, chỉ khác ở điểm từ 1 nút sẽ gọi tới 4 nút con thay vì 2. Độ phức tạp thuật toán cho các thao tác trở thành O(LogM*logN) chứ không phải là O(logN) nữa.

    Cách 2: Quản lý lần lượt theo từng chiều:

    Với bảng số M*N ta dùng M interval tree quản lý M hàng riêng rẽ (lớp cây T1). Tại nút (i,j) của cây lưu hàng K sẽ lưu tổng các ô từ i tới j của hàng K. Vì mỗi hàng đều có N cột nên số nút ở mỗi cây con này là bằng nhau. Giả sử có P nút con trong mỗi cây con này. Ta sử dụng lớp cây T2 gồm P cây interval nữa, mỗi cây sẽ quản lý M nút: cây thứ P sẽ quản lý nút thứ P của M cây interval trước đó. Vậy giá trị các ô trong HCN sẽ được truy xuất như thế nào? Với 1 HCN (xL,xR,yL,yR) thì đầu tiên ta tìm các nút thuộc đoạn (yL,yR) thuộc lớp cây T1. Với mỗi nút đó truy xuất dữ liệu ở cây tương ứng thuộc T2 và trong đoạn từ xL tới xR. Quá trình UPDATE dữ liệu cũng tương tự. Độ phức tạp thuật toán dạng này cũng là O(logM*logN) cho mỗi thao tác UPDATE và GET.

    2 cách biểu diễn trên khác nhau nhưng có cùng độ phức tạp khi xử lý.

    Yêu cầu tự viết các chương trình mô tả 2 dạng của cây Interval Tree 2D.

    Bài tập tự giải:

    1. CUTSEQ – Marathon 06-07.

    Cho số nguyên N và một dãy số nguyên a1, a2, …, aN. Nhiệm vụ của bạn là phải cắt dãy số trên thành một

    số dãy số (giữ nguyên thứ tự) thỏa mãn:

    - Tổng của mỗi dãy số không lớn hơn số nguyên M.

    - Tổng của các số lớn nhất trong các dãy trên là nhỏ nhất.

    Input:

    Dòng đầu gồm 2 số nguyên N và M.

    Dòng thứ hai gồm N số nguyên của dãy a1, a2, …, aN.

    Output:
    Gồm một số duy nhất là tổng của các số lớn nhất trong các dãy số trên. Nếu không có cách cắt nào thỏa mãn hai điều kiện trên, in ra -1.

    Giới hạn:

    -1 ≤ N ≤ 100000.

    -0 ≤ ai ≤ 106.

    -M< 263.

    2. The BUS – POI 2004.

    Tóm tắt đề bài: Cho lưới ô vuông M*N. Tại K nút (giao của hàng và cột) của lưới có 1 giá trị GT>0, các nút khác giá trị bằng 0. 1 đường đi từ ô (1,1) tới ô (M,N) của lưới là đường đi thoả mãn các điều kiện sau:

    - Đi theo các cạnh của lưới ô vuông, không đi theo các đường chéo.

    - Chỉ có thể đi từ nút (i,j) tới nút (i+1,j) hoặc nút (i,j+1).

    Giá trị của đường đi là tổng giá trị của các nút thuộc đường đi. Tìm đường đi có giá trị lớn nhất và đưa ra file output giá trị này.

    Input: dòng đầu tiên ghi 3 số nguyên M N K ý nghĩa trên. K dòng tiếp theo mỗi dòng ghi 3 số X Y GT ý nghĩa là nút (X,Y) có giá trị GT.

    Output: 1 dòng duy nhất ghi kết quả tìm được

    Giới hạn:

    -1<=M,N<=10^9.

    -K<=10^5

    -Kết quả trong phạm vi longint.

    3. POINTS and RECTANGES

    Trong mặt phẳng toạ độ cho N hình chữ nhật và M điểm. 1 điểm được gọi là thuộc 1 HCN nếu như điểm đó nằm trong phần mặt phẳng giới hạn bởi HCN đó.

    Yêu cầu: liệt kê mọi điểm trong số M điểm đã cho mà thuộc ít nhất 1 HCN.

    Input:

    Dòng đầu ghi 2 số nguyên N M ý nghĩa như trên.

    N dòng tiếp theo mỗi dòng ghi 4 số nguyên x1 y1 x2 y2 mô tả 1 HCN với đỉnh trái dưới (x1,y1) và phải trên (x2,y2).

    M dòng cuối cùng ghi toạ độ M điểm đã cho

    Output: Ghi ra mọi điểm thoả mãn (thứ tự bất kì).

    Giới hạn: 1<=M<=N<=20000.

    4.Greatest sub sequence:
    Cho dãy số A gồm N phần tử (N<=50000,|Ai|<=15000). Hàm GSS của 1 đoạn [x,y] được định nghĩa như sau: GSS(x,y)=GTLN(tổng Ai..Aj), với mọi x<=i<=j<=y. VD có dãy số {-1,2,3} thì GSS(1,2)=2, GSS(1,3)=3, GSS(2,3)=5,…
    Yêu cầu: tính giá trị hàm GSS của 1 số đoạn cho trước.

    Đoàn Mạnh Hùng

    Manhhung741@yahoo.com

    School@net (Theo THNT)



     Bản để in  Lưu dạng file  Gửi tin qua email


    Những bài viết khác:



    Lên đầu trang

     
    CÔNG TY CÔNG NGHỆ TIN HỌC NHÀ TRƯỜNG
     
    Phòng 804 - Nhà 17T1 - Khu Trung Hoà Nhân Chính - Quận Cầu Giấy - Hà Nội
    Phone: 024.62511017 - 024.62511081
    Email: kinhdoanh@schoolnet.vn


    Bản quyền thông tin trên trang điện tử này thuộc về công ty School@net
    Ghi rõ nguồn www.vnschool.net khi bạn phát hành lại thông tin từ website này
    Site xây dựng trên cơ sở hệ thống NukeViet - phát triển từ PHP-Nuke, lưu hành theo giấy phép của GNU/GPL.