NEWS

[SQLSERVER] SQL Server Parameter Sniffing trong Store Procedure

[SQLSERVER] SQL Server Parameter Sniffing trong Store Procedure
Đăng bởi: Thảo Meo - Lượt xem: 11852 08:02:24, 27/09/2017DATABASE   In bài viết

Bài viết hôm nay, mình sẽ nói về vấn đề Sql Parametter Sniffing trong sql server khi sử dụng Store Procedure.

Vậy Sql Parametter Sniffing là gì?

Khi một Stored Procedure được chạy lần đầu tiên, hoặc sau khi giải phóng SP cache, v.v… Bộ xử lý Optimizer trên SQL Server bắt buộc phải tạo ra một execution plan tương ứng cho Stored Procedure. Nó sẽ sử dụng các giá trị của tham số truyền vào, sử dụng các dữ liệu thống kê sẵn có để sinh ra một execution plan. Execution Plan này sẽ được lưu trong sp cache và được sử dụng cho các lần gọi Stored Procedure sau BẤT KỂ tham số truyền vào như thế nào.
Thông thường dữ liệu để thống kê trên Stored Procedure có sự khác biệt không đáng kê, do đó khi một Stored Procedure (SP) chạy tốt với tập dữ liệu này cũng sẽ đáp ứng được khi chạy với tập dữ liệu khác. Tuy nhiên một số trường hợp đặc biệt mà bản thân dữ liệu có sự phân bố không đều, dẫn đến 1 tập dữ liệu tương đối khác biệt với phần còn lại.
Parameter Sniffing rất tai hại nếu lần tạo execution plan đầu tiên mà các tham số truyền vào tương ứng với tập dữ liệu bất thường đó. Lúc này execution plan chỉ được coi là tối ưu với tập dữ liệu này mà hoàn toàn không tối ưu với phần lớn dữ liệu còn lại, dẫn đến hiệu năng thực hiện bị giảm sút nghiêm trọng.

sqlserver parameter sniffing store procedure

Tình huống:

Một ngày nọ, một thành viên trong nhóm Database của tôi gặp một hiện tượng kì lạ. Stored Procedure mà cậu ấy viết khi chạy trên môi trường test rất tốt, thời gian xấp xỉ 1 giây. Tuy nhiên khi đưa lên hệ thống thật, thì lại chạy ì ạch mất khoảng 30 giây.
Cậu ấy thay hết giá trị vào stored, chạy trên SSMS dưới dạng câu SQL bình thường thì lại chạy tốt. Vò đầu bứt tai một hồi cậu ấy đâm ra nghi ngờ khi sử dụng Stored Procedure và có kế hoạch thay hết Stored đã viết bằng dynamic sql để tăng hiệu năng.

Tình huống giả định

Giả sử trong CSDL ta có 2 table là Article và Category như sau:

sqlserver sniffing

Ngoài ra trên table Article ta cũng đánh index cho cột CateID để khi cần tìm kiếm theo điều kiện này sẽ được thực thi nhanh hơn.

Dữ liệu của table Category thì chỉ có 2 dòng dữ liệu với ID là 1 và 2. Tuy nhiên dữ liệu của table Article thì có đến 1000 dòng, và ta giả sử có 999 article thuộc category 1và chỉ có 1 article thuộc category 2.

Kế hoạch thực thi Select Query

Điều gì sẽ xảy ra nếu ta so sánh kế hoạch thực thi của 2 câu query sau:

sql parametter sniffing

Kết quả:

sql server sniffing parametter

=> Như bạn có thể thấy, 2 câu truy vấn này giống hệt nhau, chỉ khác mỗi giá trị của C.ID nhưng có kế hoạch thực thi rất khác nhau. Là do dữ liệu article của chúng ta tập trung hầu hết vào category 1, nên với câu truy vấn thứ nhất thì index ở field CateID hầu như không có ý nghĩa nữa. Tuy nhiên với câu truy vấn thứ hai thì khác, chỉ có mỗi một article thuộc category 2, nên việc dùng index ở field CateID là rất hữu ích. Chính vì vậy SQL Server đã sử dụng kế hoạch thực thi khác nhau cho hai trường hợp này.

Kế hoạch thực thi Stored Procedure

Tương tự như vậy, giả sử ta có stored procedure sau đây:

sql server parametter sniffing

Kiểm chứng kế hoạch thực thi trong 2 lần thực thi stored procedure với dữ liệu như bên trên. 

DBCC FREEPROCCACHE: dùng để xóa cache kế hoạch thực thi của SQL Server

sqlserver

Rõ ràng ta thấy SQL Server chỉ sử dụng 1 kế hoạch duy nhất cho 2 trường hợp này. Ta thử đổi lại thứ tự 2 lần thực thi stored procedure:

sqlserver parametter sniffing

Một lần nữa, ta thấy rằng SQL Server chỉ dùng 1 kế hoạch thực thi cho 2 lần gọi stored procedure này.

Nguyên nhân

Sở dĩ SQL Server chỉ dùng một kế hoạch thực thi cho các lần gọi stored procedure khác nhau là do nó có cơ chế cache lại kế hoạch thực thi. Tức là khi bạn thực thi stored đó lần đầu tiên, nó phải tính toán để đưa ra kế hoạch thực thi tốt nhất đối với tham số vừa truyền vào, và đồng thời ghi cache để lưu giữ lại kế hoạch thực thi này cho các lần gọi stored procedure tiếp theo.

Chính vì vậy, nếu lần đầu tiên bạn thực thi stored procedure với một giá trị tham số hiếm khi xảy ra (trong ví dụ này là tìm các article thuộc category 2) thì kế hoạch thực thi mà nó cache lại sẽ không phải tối ưu cho các lần gọi stored procedure để tìm các article thuộc category 1.

Đến đây thì bạn đã hiểu vì sao stored procedure của mình bị chậm rồi đấy :)

Hướng giải quyết

Có 6 hướng giải quyết sau:

  • Sử dụng "WITH RECOMPILE" trong stored procedure
  • Sử dụng "OPTION (RECOMPILE)"
  • Sử dụng "OPTION (OPTIMIZE FOR)"
  • Sử dụng biến thay thế trong stored procedures
  • Disable SQL Server Parameter Sniffing at the Instance Level
  • Disable Parameter Sniffing for a Specific SQL Server Query

Sử dụng "WITH RECOMPILE" trong stored procedure

Đây không phải là cách tối ưu, đây chỉ là option để yêu cầu SQL Server xây dựng lại kế hoạch thực thi mới mà không sử dụng kế hoạch thực thi từ cache. Điều này sẽ giúp SQL Server tính toán được kế hoạch thực thi tốt nhất ứng với mỗi lần thực thi cụ thể, với từng giá trị tham số khác nhau. Tuy nhiên sẽ làm tăng tải CPU dùng cho việc tính đi tính lại liên tục kế hoạch thực thi mới.

sqlserver parametter

Sử dụng "OPTION (RECOMPILE)"

Tương tự như trên, đây chưa phải là giải pháp tối ưu

sqlserver parametter sniffing

sqlserver parameteer

Kết quả sau khi đã chỉnh sửa stored procedure bằng một trong 2 cách bên trên

Sử dụng "OPTION (OPTIMIZE FOR)"

Option này cho phép bạn đặt giá trị tham khảo cho parameter để SQL dùng vào việc lập kế hoạch thực thi. Bạn phải chắc chắn rằng giá trị bạn cung cấp là phổ biến để có một kế hoạch thực thi tốt. Tham khảo thêm về cách sự dụng option này tại đây. Nhưng nếu bạn sử dụng SQL Server 2008 hoặc cao hơn, bạn có thể dùng OPTIMIZE FOR UNKNOWN để SQL Server tự quyết định giá trị đó thay bạn.

sqlserver parametter store procedure

Kết quả

sqlserver

Sử dụng biến thay thế trong stored procedures

Đây là cách thường được dùng nhất từ trước cho đến năm 2005. Người ta sử dụng một biến cục bộ khác để thay thế parameter truyền vào stored procedure

sql server parametter sniffing store procedure

Kết quả

sqlserver

Disable SQL Server Parameter Sniffing at the Instance Level

Đây không phải là cách tốt, và không được khuyến khích sử dụng, bạn có thể tham khảo thêm ở nguồn bên dưới.

Disable Parameter Sniffing for a Specific SQL Server Query

Sử dụng OPTION (QUERYTRACEON 4136)

sql server parametter

Kết quả

sqlserver parametter

Theo http://hoidaplaptrinh.net

Tags:

THÔNG TIN TÁC GIẢ

[SQLSERVER] SQL Server Parameter Sniffing trong Store Procedure
Đăng bởi: Thảo Meo - Lượt xem: 11852 08:02:24, 27/09/2017DATABASE   In bài viết

CÁC BÀI CÙNG CHỦ ĐỀ

Đọc tiếp