Trình Tự Xử Lý Logic Của Câu Lệnh SELECT Trong SQL

Trong SQL, thứ tự thực hiện câu lệnh có vai trò quan trọng để hiểu cách hệ thống xử lý truy vấn. Dưới đây là các bước thực hiện một câu lệnh SELECT:

  1. FROM
  2. ON
  3. JOIN
  4. WHERE
  5. GROUP BY
  6. WITH CUBE or WITH ROLLUP
  7. HAVING
  8. SELECT
  9. DISTINCT
  10. ORDER BY
  11. TOP

Trong một số trường hợp, thì trình tự trên đây có thể có sự thay đổi, song đây là những trường hợp không phổ biến và ít khi gặp phải.

1. FROM

Mệnh đề FROM trong SQL được dùng để liệt kê các bảng cần thiết sử dụng trong truy vấn. Chính vì vậy khi thực hiện SELECT thì nó phải biết SELECT từ đâu, nên đương nhiên FROM nó sẽ phải chạy trước để xác định được những bảng cần dùng đến.

Cú pháp:

FROM table1
[ { INNER JOIN
| LEFT OUTER JOIN
| RIGHT OUTER JOIN
| FULL OUTER JOIN } table2
ON table1.column1 = table2.column1 ]

2. ON

Như ở trên ta thấy ON đi kèm với FROM, mục đích là để xác định điều kiện ràng buộc giữa 2 bảng với nhau, nó sẽ match dữ liệu ở 2 bảng theo điều kiện này, thường thực tế nó sẽ match các Id là chủ yếu.

3. JOIN

Mệnh đề JOIN được dùng để kết hợp các bản ghi từ hai hay nhiều bảng trong một Database. Các loại JOIN gồm có: INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL JOIN, SELF JOIN, CARTESIAN. Các bạn có thể search google về các loại này để tìm hiểu kỹ thêm nhé.

4. WHERE

Đây là mệnh đề được dùng để lọc kết quả bởi các điều kiện, kết quả trả về phải đáp ứng các điều kiện trong mệnh đề này. Khi đã có các table đích để lấy dữ liệu, thì chắc hẳn mới đến mệnh đề WHERE để lọc lại dữ liệu đó.

Cú pháp:

SELECT column1, column2, columnN 
FROM table_name
WHERE [conditions]

5. GROUP BY

Mệnh đề GROUP BY được sử dụng để kết hợp với câu lệnh SELECT để sắp xếp dữ liệu giống nhau thành các nhóm, nó tuân theo mệnh đề WHERE và đứng trước ORDER BY.

Cú pháp:

SELECT column1, column2
FROM table_name
WHERE [ conditions ]
GROUP BY column1, column2
ORDER BY column1, column2

6. WITH CUBE or WITH ROLLUP

Đây là mệnh đề mở rộng của GROUP BY, sử dụng để phát sinh các tổng trung gian từ các cột trong GROUP BY. Ở đây bạn có thể tìm hiểu thêm hàm GROUPING khi sử dụng CUBE và ROLLUP. Vì thế hiển nhiên nó sẽ chạy sau mệnh đề GROUP BY.

Ví dụ:

SELECT Id, ProductName, AVG(Price) as [AveragePrice] 
FROM Product 
GROUP BY Id, ProductName WITH ROLLUP;

7. HAVING

Mệnh đề này cho phép bạn khả năng để xác định các điều kiện để lọc nhóm kết quả nào sẽ xuất hiện trong kết quả cuối cùng.

Cú pháp:

SELECT column1, column2
FROM table1, table2
WHERE [ conditions ]
GROUP BY column1, column2
HAVING [ conditions ]
ORDER BY column1, column2

8. SELECT

Dùng để lấy kết quả từ một hay nhiều bảng. Sau khi các truy vấn thực hiện đến các bảng cần sử dụng, các điều kiện lấy giữ liệu, nhóm các dữ liệu, thì SELECT sẽ quyết định lấy về những thông tin nào (các cột) trong những bảng nào.

Ví dụ:

SELECT b.Id, b.Name, t.TypeName

FROM Books b INNER JOIN Type t ON b.TypeId = t.Id

Ví trụ trên SELECT sẽ lấy ra các thông tin từ bảng Books là: Id, Name và thông tin từ bảng Type là: TypeName

SELECT sẽ kết hợp với các mệnh đề khác để trở thành một câu truy vấn hoàn chỉnh, tuỳ thuộc vào yêu cầu lấy dữ liệu như thế nào.

9. DISTINCT

Mệnh đề Distinct được dùng kết hợp với SELECT để loại bỏ các bản ghi trùng lặp, chỉ lấy một bản ghi duy nhất trong kết quả trả về.

Ví dụ:

SELECT DISTINCT b.Id, b.Name, b.Price, t.TypeName

FROM Books b INNER JOIN Type t ON b.TypeId = t.Id

Mục đích sử dụng của nó như trên, nên hiển nhiên nó phải chạy sau SELECT rồi, phải SELECT ra được data thì mới có data để mà xét trùng đúng không?

10. ORDER BY

Mệnh đề này dùng để sắp xếp dữ liệu theo thứ tự tăng dần hoặc giảm dần dựa trên một hoặc nhiều cột. Lệnh ASC được sử dụng để sắp xếp tăng giần, còn lệnh DESC được sử dụng để sắp xếp theo giảm dần. Mặc định ASC nếu không chỉ rõ.

Cú pháp:

SELECT column-list

FROM table_name

[WHERE condition]

[ORDER BY column1, column2, .. columnN] [ASC | DESC];

Khi có đủ dữ liệu trả về thì đúng theo như yêu cầu đặt ra, khi đó chúng ta mới sắp xếp lại trật tự của chúng.

11. TOP

Mệnh đề dùng để lấy ra N bản ghi hoặc X phần trăm bản ghi từ kết quả trả về.

Cú pháp:

SELECT TOP number|percent column_name(s)

FROM table_name

WHERE [condition]

Lời kết

Trên đây là trình tự thực hiện câu lệnh trong SQL kèm code minh hoạ. Trong một số trường hợp, thứ tự trên có thể thay đổi, nhưng đó là những trường hợp không phổ biến, đồng thời trình tự trên đã được Microsoft[3] đưa ra, nên bạn có thể tin tưởng vào nó nhé.
Hy vọng thông tin này hữu ích cho bạn! :blush:

Nguồn tham khảo:


  1. https://builtin.com/data-science/sql-order-of-execution ↩︎

  2. https://matam-kirankumar.medium.com/sql-query-order-of-execution-37001da1462 ↩︎

  3. https://docs.microsoft.com/en-us/sql/t-sql/queries/select-transact-sql?view=sql-server-ver15 ↩︎

  4. https://towardsdatascience.com/how-sql-execution-orders-varies-across-databases-b5b949f34f31 ↩︎