fbpx
Học Viện Gravis > Blog > SEO > Tổng quan về công cụ tìm kiếm (SE) và cơ chế hoạt động

Tổng quan về công cụ tìm kiếm (SE) và cơ chế hoạt động

1. Định nghĩa

“Công cụ tìm kiếm” (Search Engine – SE) là những công cụ có chức năng tập hợp, sắp xếp, xử lí và giới thiệu dữ liệu trích xuất từ 1 máy chủ nội bộ, 1 website hay nhiều website khác nhau trên internet tới người dùng. SE ra đời nhằm phục vụ nhu cầu tìm kiếm thông tin ngày càng mở rộng của con người.

Có 3 loại SE là SE máy nội bộ (có thể không cần kết nối mạng để hoạt động – VD Search Tool của hệ điều hành), SE tích hợp trực tuyến (SE không hoàn chỉnh, chỉ là một chức năng giới hạn trong phạm vi 1 website) và SE là 1 website độc lập (SE hoàn chỉnh)

1.1 Danh sách các SE hoàn chỉnh

Học Viện Gravis Tổng quan về công cụ tìm kiếm (SE) và cơ chế hoạt động

Có rất nhiều SE hoàn chỉnh trên thế giới, trong đó nổ tiếng và có lượng cơ sở dữ liệu lớn nhất phải kể đến Google. Ngoài ra còn có 1 số SE quốc tế khác: Bing, Yahoo, DuckDuckGo, Ask.com, AOL, ….

Các quốc gia có ngôn ngữ đặc thù cũng đã và đang xây dựng SE riêng cho mình. Một số SE hướng đến thị trường nội địa như: Swisscows (Thụy Sỹ), Baidu (China), Yandex (Liên Bang Nga), Naver (Korean), Cốc Cốc (Việt Nam), v.v.

1.2 Những yếu tố cơ bản

Học Viện Gravis Tổng quan về công cụ tìm kiếm (SE) và cơ chế hoạt động
  • Để tạo thành 1 SE, cần xây dựng hệ thống quản trị
    cơ sở dữ liệu
    hệ thống máy truy tìm để lọc dữ liệu
    trong cơ sở dữ liệu ra trang kết quả tìm kiếm khi
    người dùng nhập từ khóa.
  • Cơ sở dữ liệu (database) là yếu tố then chốt đối với SE . Database càng lớn thì chất lượng SE đó càng được đánh giá cao.
  • Từ khóa (Keyword) là các yếu tố nhỏ cấu thành ngôn ngữ, ở đây ám chỉ những nhu cầu tìm kiếm của người dùng được chuyển hóa thành văn bản ngắn và được nhập vào ô tìm kiếm

2. Cách thức hoạt động

Bước 1: SE gửi bot (1 loại phần mềm dò tìm cỡ nhỏ) đến các website để thu thập dữ
liệu (crawl). Bot SE sẽ đi theo các liên kết (links) có trong website, và cũng sẽ thu thập
dữ liệu website khác nếu có liên kết thông thường trỏ qua lại từ website này với
website kia. Tất cả dữ liệu được gửi ngay lập tức về trung tâm cơ sở dữ liệu của SE.

Bước 2: Dữ liệu thu thập từ các website sẽ được ghi nhận và sắp xếp (index) vào cơ sở
dữ liệu. Tại đây các thuật toán liên tục đánh giá và chấm điểm sơ bộ các thành phần dữ
liệu này nhằm xác định những dữ liệu cần ưu tiên.

Bước 3: Khi người dùng thực hiện tìm kiếm bằng từ khóa nhất định, SE sẽ truy tìm
trong cơ sở dữ liệu đã index và trả về danh sách kết quả phù hợp nhất. Kết quả tìm kiếm
được đánh giá lần lượt dựa trên độ liên quan (relevance) và độ phổ biến (popularity),
rồi mới hiển thị ra cho người dùng dưới dạng các trang kết quả (Search Engine Result Pages – SERPS).

3. Google Search Engine

Học Viện Gravis Tổng quan về công cụ tìm kiếm (SE) và cơ chế hoạt động
  • Ra đời năm 1996 bởi Larry Page và Sergey Brin, 2 nghiên cứu sinh tiến sĩ của ĐH Stanford.
  • Khi Google ra đời, nó dần đánh bật các SE khác nhờ cơ chế hoạt động và đánh giá kết quả ưu việt hơn nên kết quả trả về có chất lượng tốt hơn. Cơ chế này hình thành bởi thuật toán đầu tiên – cốt lõi của Google SE – tên là PageRank.
  • Sau hơn 20 năm, Google đã trở thành SE thống trị thị trường tìm kiếm thế giới. Google.com cũng trở thành website được truy cập nhiều nhất, có cơ sở dữ liệu lớn nhất và mạng lưới thông tin sâu rộng nhất.

 

Trả lời