Buffer Overflow hay BoF là lỗi tràn bộ đệm, có nguyên nhân gần giống với tình huốn tấn công SQL injection khi người dùng hay hacker cung cấp các biến đầu vào hay dữ liệu vượt quá khả năng xử lý của chương trình làm cho hệ thống bị treo dẫn đến từ chố dịch vụ (DoS) hay có khả năng bị các hacker lợi dụng chèn các chỉ thị trái phép nhằm thực thi các đoạn mã nguy hiểm từ xa. Có hai dạng lỗi tràn bộ đệm là stack-based và heapbased. Cả hai thành phần stack và heap đều được sử dụng để lưu trữ các biến người dùng khi chạy chương trình. Khi một chương trình được nạp vào bộ nhớ được chia thành 6 giai đoạn tương ứng với sơ đồ phân đoạn trong bộ nhớ như hình minh họa bên dưới :
Đầu tiên, các chỉ thị lệnh hay mã máy (phần tập tin thực thi nhị phân) sẽ được nạp qua phân đoạn text để thực thi các tác vụ của ứng dụng, vùng này được gán giá trị chỉ đọc có kích thước cố định tùy thuộc vào giá trị khởi tạo khi chương trình được nạp. Tiếp theo là phân doạn data chưa các biến toàn cục có giá trị khởi tạo ban đầu. Sau đó là vùng bss (below stack session) cũng dùng để lưu các biến toàn cục nhưng không có giá trị khởi tạo, kích thươc của vùng này và data cũng cố định khi chương trình được nạp. Và cuối cùng là vùng ENV, dùng để nạp các biến môi trường và đối số, cũng là giai đoạn sau cùng khi ứng dụng được nạp và thực thi.
Trong các phân đoạn trên thì phân doạn heap và stack là những nơi mà hacker sẽ tiến hành khai thác lỗi tràn bộ đệm, vùng heap dùng để cấp phát các biến động trong khi thực thi bở các lời gọi hàm như malloc(). Heap phát triển từ vùng bộ nhớ có địa chỉ từ thấp đến cao theo nguyên tắt FIFO (Firt in first out, biến nào nạp trước sẽ lấy ra sử dụng trước). Như hình dưới minh họa một nội dung của Heap :
Khi một ứng dụng sao chép dữ liệu mà không kiểm tra kích thước có phù hợp với khả năng lưu trữ hay không thi hacker sẽ tận dụng để cung cấp những dữ liệu có kích thươc lớn làm tràn heap và ghi đè lên các biến động khác dẫn đến tình trạng heap-based overflow. Còn vùng stack thì ngược lại dùng để lưu trữ các lời gọi hàm theo nguyên tắt LIFO (Last in first out, lời gọi nào nạp vào sau sẽ được sử dụng trước). Những biến được lưu trữ trong các vùng này sẽ chờ cho đến khi nhận được lời gọi hàm để thực thi, và mội khi các biến này bị ghi đè bởi một chương trình nguy hiểm nào đó thì chương trình sẽ thực hiện chỉ thị này của hacker thông qua lời gọi hàm của mình, và tình huống bị khai thác lỗi như vậy gọi là stack-based buffer overflow.
Shell Code
Shellcode hay paypload là thuật ngữ dùng để chỉ những chương trình thường có kích thước khá nhỏ mà hacker sẽ chèn vào đúng các vị trí thực thi lệnh kế tiếp của con trỏ khi bị tràn bộ đệm. Với mục tiêu sẽ tiến hành các hành động mà hacker mong muốn như trong phần video minh họa một dạng tấn công lỗi tràn bộ đệm trên Windows XP tôi chọn shell code là nạp giao diện dòng lệnh trên máy tính bị tấn công, shellcode này có tên là reserver_shell, ngoài ra có nhiều loại shell code khác nhau đã được viết sẳn như chèn các dll mới lên máy tính bị tấn công, hay tạo tài khoản người dùng mới … Các shellcode thường được viết bằng hợp ngữ và chèn trực tiếp vào các đoạn mã khai thác. Ví dụ vào ngày 26.3.2012 có một mã khai thác lỗi buffer overflow của UltraVNC 1.0.2 Client được công bố tại địa chỉ http://www.exploit-db..com/exploits/18666/ với shellcode là :
Các bước tiến hành khai thác buffer overflow
- Tìm vị trí hay các điểm gấy ra lỗi tràn bộ đệm của ứng dụng.
- Ghi các dữ liệu có kích thước lớn để vượt quá khả năng kiểm soát của chương trình.
- Ghi đè lên địa chỉ trả về của các hàm.
- Thay đổi chương trình thực thi bằng đoạn mã của hacker.
Như đoạn code bên dưới mô tả một tình huống bị lỗi bof của hàm bof (), do kích thước buffer chi chứa tối đa 8 kí tự nhưng hàm strcpy sao chép đến 20 kí tự vào bộ nhớ vượt quá khả năng lưu trữ đã được khai báo trong bộ nhớ đệm.
Các bạn hãy tham khảo thêm một ví dụ về tràn bộ đệm viết bằng ngôn ngữ C là overrun.c
Trong phần đầu của đoạn mã sẽ khai báo hai biến kiểu chuỗi và gán bộ nhớ cho chúng. Tiếp theo biến name sẽ được cấp phát 10 byte trong bộ nhớ (có thể lưu tối đa 10 kí tự) còn biến dangerous_system_command được cấp phát đến 128 byte, như vậy hacker có thể chạy đè (overrun) lên vùng nhớ của biến name thông qua các giá trị nhập vào qua biến dangerous_system_command để thực thi các shellcode của mình (chúng ta sẽ thảo luận về chủ đề shell code ở phần tiếp theo)
Khi các bạn biên dịch đoạn mã overrun.c trên linux sẽ cho kết quả như sau :
Như vậy, nếu như hacker nhập vào một biến có độ dài 16 kí tự thì sẽ bị tràn 6 kí tự cho phép thực thì các chỉ thị ngoài ý muốn như cat /etc/passwd trong hình 17.7 :
Tìm Kiếm Lỗi Tràn Bộ Đệm Của Ứng Dụng
Để tìm kiếm các lỗi tràn bộ đệm hacker có thể dùng công cụ BOU ( Buffer Overfolw Utility) kiểm tra xem các web site có bị lỗi buffer overflow hay không. Hay kiểm tra bằng công cụ OllyDbg như trong hình minh họa dưới sẽ xác định được các địa chỉ bị ghi đè.
Ngoài ra, chúng ta còn có thể dùng IDA Pro để xác định các ứng dụng bị lỗi tràn bộ đệm, sau đây là danh sách các chương trình dùng để kiểm tra lỗi BoF :
Tổng Kết
Trong chương này chúng ta đã tìm hiểu về quy trình nạp ứng dụng vào bộ nhớ và nguyên nhân dẫn đến tình trạng tràn bộ đệm, cần phân biệt trình tự xử lý của heap va stack. Các bạn lưu ý những công cụ mà hacker dùng để phát hiện lỗi cũng như các chương trình khai thác thông dụng.
Để không bị tấn công BoF thì các chương trình khi được viết cần tuân theo các quy tắt an toàn ngay từ lúc bắt đầu, kiểm tra lỗi cẩn thận với những chương trình debug như IDA Pro, OllDbg, đặc biệt quan tâm đến các hàm hay bị BoF như gets, strcpy …Bên cạnh đó khi biên dịch nên sử dụng các chương trình biên dịch an toàn như StackGuard nhằm ngăn chặn địa chỉ trả về bị ghi đè. Kiểm tra các biến đầu vào và hạn chế thực thi chương trình với quyền root (trên linux) hay quyền quản trị cao nhất trên Windows. Đặt các thông báo từ Google với từ khóa liên quan đến những chủ đề hay lỗi bảo mật cần quan tâm tại địa chỉ http://www . google . com / alerts như minh họa ..