[SQLSERVER] Hướng dẫn sử dụng Index trong Sql server có hiệu quả

Đăng bởi: Thảo Meo - Lượt xem: 11079 08:37:59, 27/10/2017C#  In bài viết

Bài viết hôm nay, mình sẽ nói về Index trong Sqlserver, vậy cách viết câu lệnh Sql như thế nào để hiệu quả nhất.

Trong một câu lệnh SQL, một điều kiện tìm kiếm ở mệnh đề WHERE được gọi là sargable (viết tắt từ Search Argument-Able) nếu index có thể được sử dụng khi thực hiện câu lệnh (giả sử cột tương ứng có index). Ví dụ, với câu lệnh sau:

SELECT *
FROM dbo.Customer
WHERE CustomerID = 1234

thì điều kiện “CustomerID = 1234″ là sargable, vì nó cho phép index trên cột CustomerID được sử dụng.
Vì index giúp tăng hiệu năng của câu lệnh lên rất nhiều, việc viết code để sao cho các điều kiện tìm kiếm trở thành sargable là một mục tiêu rất quan trọng. Một nguyên tắc rất cơ bản trong SQL Server mà bạn có thể áp dụng trong rất nhiều trường hợp, đó là cột cần tìm phải đứng một mình ở một phía của biểu thức tìm kiếm, nói cách khác là không có hàm số hay phép tính toán nào áp dụng trên cột đó. Hãy xem xét hai câu lệnh dưới đây:

USE AdventureWorks
GO
-- câu lệnh 1 (non-sargable)
SELECT * FROM Sales.Individual
WHERE CustomerID+2 = 11002

-- câu lệnh 2 (sargable)
SELECT * FROM Sales.Individual
WHERE CustomerID = 11000

Hai câu lệnh trên cho cùng một kết quả, nhưng ở câu lệnh 1 điều kiện tìm kiếm của nó là non-sargable và index trên cột CustomerID trở nên vô dụng. Kế hoạch thực thi của nó cho thấy điều này:

index trong sqlserver

Câu lệnh 1 dẫn đến thao tác Clustered Index Scan, tức là quét cả cây clustered index, đồng nghĩa với quét bảng (vì clustered index chính là bảng). Do vậy mà chi phí của nó tăng vọt. Sở dĩ index đã không được sử dụng vì khi bạn áp dụng một phép tính toán trên cột, hệ thống phải thực hiện tính toán đó trên từng node trên cây index trước khi có thể lấy kết quả để so sánh với giá trị cần tìm. Vì thế nó phải duyệt tuần tự qua từng node thay vì tìm theo kiểu nhị phân (index seek, như với câu lệnh 2). Và đây là các con số thống kê về IO và thời gian thực hiện:
Câu lệnh 1 (non-sargable):

Table 'Individual'. Scan count 1, logical reads 3088, 
physical reads 35
CPU time = 0 ms, elapsed time = 259 ms.

Câu lệnh 2 (sargable):

Table 'Individual'. Scan count 0, logical reads 3, 
physical reads 3
CPU time = 0 ms, elapsed time = 19 ms.

Trên đây là một trường hợp đơn giản mà có lẽ không mấy ai mắc phải, tuy nhiên có những tình huống khác không hiển nhiên như thế. Ví dụ, khi cần tìm tất cả các đơn hàng được thực hiện trong ngày 21/08/2009, một cách trực giác có thể bạn nghĩ ngay đến một trong các cách làm sau:

SELECT *
FROM dbo.DonHang
WHERE CONVERT(VARCHAR,OrderDate,103) = '21/08/2009' --cắt bỏ phần thời gian, chỉ giữ lại phần ngày

-- hoặc
SELECT *
FROM dbo.DonHang
WHERE DATEPART(d,OrderDate) =21
AND DATEPART(m,OrderDate)=8
AND DATEPART(YEAR,OrderDate)=2009

Cả hai cách viết trên đều làm mất tác dụng index trên trường OrderDate. Cách viết đúng phải là:

SELECT *
FROM dbo.DonHang
WHERE OrderDate >= '20090821' AND OrderDate <= '20090822'
-- lưu ý chuỗi ngày tháng mặc định của ANSI có dạng yyyymmdd

Một ví dụ khác, bạn cần tìm tất cả các khách hàng có tên bắt đầu bằng chữ C, như Can, Công, Cường… Các cách viết sau là không sargable:

SELECT *
FROM dbo.Customer
WHERE SUBSTRING(Ten,1,1) = 'C'

--hoặc
SELECT *
FROM dbo.Customer
WHERE LEFT(Ten,1) = 'C'

Cách viết để thành sargable là:

SELECT *
FROM dbo.Customer
WHERE Ten LIKE 'C%'

Ở đây có một chi tiết thú vị, khi quan sát kế hoạch thực thi của câu lệnh ở ngay trên, bạn sẽ thấy điều kiện “Ten LIKE ‘C%’” được chuyển thành “Ten >=’C’ AND Ten< ‘D’” (vâng, chuỗi cũng so sánh lớn bé được như số), và điều kiện này hoàn toàn thích hợp với việc tìm kiếm bằng index.

Tuy nhiên, nếu bạn thay đổi yêu cầu một chút, tìm các khách hàng có tên chứa chữ ‘C’ ở bất kỳ vị trí nào, không chỉ ở đầu. Câu lệnh của bạn sẽ trở thành:

SELECT *
FROM dbo.Customer
WHERE Ten LIKE '%C%'

Khi đó index trên trường Ten lại bị mất tác dụng, vì hệ thống không có cách nào khác là dừng lại trên từng node, kiểm tra xem giá trị của trường Ten có chứa ký tự ‘C’ hay không. Trên thực tế đây là một thao tác rất tốn kém về tài nguyên, với các bài toàn như thế này cách làm hiệu quả hơn là dùng fulltext index và fulltext search.

Theo http://aptech.vn

Tags:

THÔNG TIN TÁC GIẢ

Founder Thảo Meo 1287 bài viết 17,044,375

NGUYỄN THẢO

Founder at LaptrinhVB.net

★★★★★

♥ Tình yêu thương chẳng hề hư mất bao giờ. (Cr 13,4)

=========================================================================

My skills includes .NET(C#, VB.NET), DevExpress, Java, Android, PHP,

Python, Sqlserver, Mysql, Reactjs, Dart, Flutter, API services and lot more...

Phone/Zalo/Telegram/WhatsApp: ☎️ (+84)933.913122

Zalo: https://zalo.me/0933913122

Email: nguyenthao.laptrinhvb@gmail.com

My Github: https://github.com/nguyenthao1988

Facebook: https://fb.com/Lewandowski28031988

Youtube Channel: https://www.youtube.com/@thaomeotv

=========================================================================

" Gửi tặng tác giả: Thảo Meo ly cà phê đầy năng lượng và cảm hứng. "

Mời Ad ly cafe

BÀI VIẾT LIÊN QUAN

Đăng bởi: Thảo Meo - Lượt xem: 11079 08:37:59, 27/10/2017C#  In bài viết

[SQLSERVER] Hướng dẫn sử dụng Index trong Sql server có hiệu quả

THÔNG TIN TÁC GIẢ

NGUYỄN THẢO

BÀI VIẾT LIÊN QUAN

CÁC BÀI CÙNG CHỦ ĐỀ

[DATABASE] Sử dụng Dynamic Data Masking trong sqlserver

[DATABASE] Hướng dẫn sử dụng Hàm ASCII trong sqlserver

[DATABASE] Hướng dẫn định dạng chữ Upper, Lower, Title và Capitalize trong sqlserver

[DATABASE] Cung cấp cơ sở dữ liệu các cơ sở hành chính Việt Nam (thành phố, tỉnh, huyện, phường, xã...) Excel file, Sqlite và Mysql

[SQLSERVER] Loại bỏ Restricted User trên database MSSQL

[SQLSERVER] Hướng dẫn truy vấn liệt kê các bảng table, lấy tên trường, kiểu dữ liệu, kích thước của một table bằng T-SQL

[DATABASE] Tổng hợp thủ thuật tăng tốc độ truy vấn trong sqlserver

[SQLSERVER] Hướng dẫn tạo file backup Database bằng file BAT

[SQLSERVER] Hướng dẫn tạo script sql từ ứng dụng Sqlserver management Studio

[SQLSERVER] Hướng dẫn di chuyển dữ liệu giữa các table (Insert into ... Select ... from)

[DATABASE] Khóa chính Primary Key trong Sqlserver

[SQLSERVER] Hướng dẫn join dũ liệu với comma separated

[DATABASE] Xóa lịch sử danh sách đăng nhập tài khoản trên SMSS Sqlserver Management Studio

[SQL SERVER] Bật chức năng hiển thị số thứ tự dòng Code trong Sqlserver Management Studio

[SQL SERVER] TOP 50 CÂU LỆNH SQLSERVER QUAN TRỌNG NÊN BIẾT (PHẦN 3)

[SQLSERVER] Hướng dẫn kiểm tra bản quyền License sql

[DATABASE] Xử lý kết quả truy vấn trả về NULL trong sqlsever sử dụng CONCAT_NULL_YIELDS_NULL

[SQLSERVER] Hướng dẫn liệt kê tất cả các procedure, function, view có sử dụng bảng table name

[SQLSERVER] Hướng dẫn sử dụng từ khóa WaitFor Delay để Sleep trong sql

[DATABASE] Đọc phiên bản phần mềm trên sqlserver

[SQLSERVER] Kiểu dữ liệu đặc biệt NULL trong sql server

[DATABASE] Chia sẽ hàm định dạng ngày giờ Like Facebook

[DATABASE] Sử dụng câu lệnh DROP IF EXISTS trong sqlserver 2016 trở lên

[DATABASE] Hướng dẫn thêm và cập nhật Extended Property Column trong Table Sqlserver

[C#] Hướng dẫn SELECT * FROM EXCUTE Store Procedure sql

LIÊN KẾT BẠN BÈ

[SQLSERVER] Hướng dẫn sử dụng Index trong Sql server có hiệu quả

THÔNG TIN TÁC GIẢ

NGUYỄN THẢO

BÀI VIẾT LIÊN QUAN

CÁC BÀI CÙNG CHỦ ĐỀ

LIÊN KẾT BẠN BÈ

ĐĂNG NHẬP

THÔNG BÁO LỖI

ĐĂNG KÝ THÀNH VIÊN

THÔNG BÁO LỖI

CHÍNH SÁCH VÀ ĐIỀU KIỆN SỬ DỤNG