Google hoạt động như thế nào?

HỎI: Thầy có thể cho em biết Google hoạt động như thế nào? Khi mình nhập một từ khóa vào ô tìm kiếm, bằng cách nào Google có thể tìm ra website chứa nội dung phù hợp với câu truy vấn mà mình nhập vào?

ĐÁP:

Đối với người làm SEO, việc hiểu Google hoạt động như thế nào cũng giống như việc người con trai đang muốn “tán tỉnh” một cô gái. Đó là bạn phải hiểu rõ người đó suy nghĩ, mong muốn và hành động như thế nào thì mới có thể dễ dàng chinh phục được cô ta.

Việc làm SEO trên Google cũng vậy, người làm SEO phải hiểu cách thức hoạt động của Google mới mong được Google “để mắt” tới website của mình và đưa nó lên top.

Cách thức hoạt động của Google
Cách thức hoạt động của Google

Trước khi tìm hiểu xem Google hoạt động thế nào thì ta cần xem qua Google là gì và sứ mệnh của nó ra sao?

Google là một công cụ tìm kiếm (hay còn gọi là cỗ máy tìm kiếm: Search Engine) có lượng người dùng lớn nhất thế giới.

Nhiệm vụ của nó là tìm ra tài liệu, nội dung tốt nhất, phù hợp nhất với nhu cầu của người tìm.

Và tất nhiên, tài liệu này phải được số hóa và lưu trữ trên internet. Người dùng chỉ dùng công cụ tìm kiếm khi họ nhận được kết quả phù hợp nhất với nhu cầu của họ.

Do đó công việc và cũng là sứ mệnh của Google là tìm ra nội dung phù hợp nhất với nhu cầu của người search. Vậy, làm thế nào để Google tìm ra nội dung phù hợp nhất với nhu cầu của người dùng?

Các thành phần chính của Google

Nhìn một cách tổng quát, Google có 3 bộ phận để thực hiện công việc trên:

Bộ phận thu thập dữ liệu (thường gọi là Googlebot)

Bộ phận này là những tiến trình hoạt động tự động như một robot. Chúng đi quét và đọc (thuật ngữ tiếng Anh gọi là Crawling) những nội dung được đăng tải trên Internet.

Những con Googlebot đi từ trang này sang trang khác thông qua các đường link như một chú nhện đi trên tơ, nên nó còn được gọi là spider (con nhện).

Các thành phần chính của Google
Các thành phần chính của Google

Bộ phận lập chỉ mục (Index)

Bộ phận này chịu trách nhiệm phân loại, đánh giá, lập chỉ mục (thuật ngữ tiếng Anh gọi là Indexing) và lưu trữ những nội dung mà Googlebot đọc được vào cơ sở dữ liệu trên trung tâm dữ liệu (thuật ngữ tiếng Anh gọi là data center) của Google dựa trên từ khóa có trong trang web.

Bộ phận xử lí truy vấn và hiển thị kết quả

Bộ phận này có chức năng đánh giá, xếp hạng (thuật ngữ tiếng Anh gọi là rank) trang web (thông qua các thuật toán ranking) xem trang nào phù hợp nhất với nhu cầu tìm kiếm của người dùng.

Dựa trên các tiêu chí đánh giá của mình, Google đưa ra kết quả phù hợp cho người tìm kiếm và hiển thị nó trên trang kết quả tìm kiếm (trang này tiếng Anh gọi là google search results page).

Trang này chính là kết quả mà bạn nhìn thấy sau khi tìm bằng một từ khóa nào đó.

Các bước mà Google xử lý một câu truy vấn của người dùng khá phức tạp nếu mô tả chi tiết dưới góc nhìn của người lập trình. Tuy nhiên tôi sẽ diễn tả việc này một cách đơn giản nhất như hình dưới đây:

Cách thức hoạt động của Google
Cách thức hoạt động của Google

Bước 1: Khi người dùng nhập một từ khóa vào ô tìm kiếm của Google (thuật ngữ tiếng Anh gọi ô này là Google search box) và nhấn tìm kiếm. Câu truy vấn đó sẽ được gửi đến máy chủ web của Google.

Dựa vào câu truy vấn, máy chủ của web Google sẽ truy cập vào máy chủ index (index server).

Nội dung được lưu bên trong index servers tương tự như nội dung chỉ mục mà chúng ta thường thấy ở cuối các cuốn sách, loại sách nhiều trang (lưu ý: chỉ mục của sách khác với mục lục).

Có nghĩa là nó chỉ ra từ khóa mà người dùng muốn tìm chứa trong trang nào.

Bước 2: Từ thông tin này, index server sẽ gửi câu truy vấn đến máy chủ lưu trữ nội dung các trang web (thuật ngữ tiếng Anh gọi là doc server).

Tại đây, doc server sẽ tạo thêm phần mô tả, sắp xếp, đánh giá các trang và trả kết quả đến người dùng.

Nhìn qua các bước này, ta có thể hiểu được cách Google xử lý truy vấn của người dùng.

Google hoạt động như thế nào? Tại sao Google có thể trả về kết quả tìm kiếm đúng với từ khóa?

Đây là một câu hỏi rất hay. Hiểu về Google, hiểu về cách thức công cụ này hoạt động thì mới có thể làm SEO một cách bài bản và chuyên nghiệp!

Đến đây, tôi muốn đặt ra một số câu hỏi để các bạn thảo luận:

  1. Google kiếm tiền bằng cách nào thông qua công cụ tìm kiếm?
  2. Làm sao Google có thể biết được là có một website mới ra đời để đến quét đọc nội dung?
  3. Khi người dùng nhập vào một câu truy vấn thì tiêu đề và các dòng mô tả mà người dùng nhìn thấy trên trang kết quả tìm kiếm là lấy từ trên website xuống tại thời điểm đó hay lấy từ máy chủ của Google (doc servers)?
  4. Làm cách nào mà Google có thể lưu trữ được nội dung của gần như tất cả website trên toàn thế giới (trừ các nội dung không thể quyết được như nội dung mail, nội dung các trang quản trị…)?

Rất mong các bạn cùng thảo luận thông qua comment bên dưới.

Nhật Vy

Leave a Reply

Your email address will not be published. Required fields are marked *