Hotline : 0888 35 3335

seo-1-300x94-1-231x72-5

Hà Nội, Sài Gòn, Đà Nẵng

Blog

Cách Google và Thuật toán của nó hoạt động

Bạn có bao giờ ngồi vào bàn cờ mà không biết cách chơi không? Tôi ít nhất sẽ nghi ngờ sự thành công của nỗ lực này. Điều này cũng đúng đối với SEO – bạn không thể hoàn thành nó nếu bạn không biết Google hoạt động như thế nào.

Sau khi đọc bài viết này, bạn sẽ hiểu cách Google chọn những trang nào để hiển thị đầu tiên và cách bạn có thể giúp Google chọn theo hướng có lợi cho bạn.

Lần đầu tiên Google thu thập thông tin trên web

Thông thường, công việc của Google bắt đầu bằng việc thu thập thông tin.

Vì không có cơ quan đăng ký trung tâm cho tất cả các tài nguyên web trên thế giới, nên bằng cách nào đó, Google cần phải khám phá toàn bộ web một cách thường xuyên. Để thực hiện việc này, Google sử dụng phần mềm tự động được gọi là trình thu thập thông tin web hoặc đơn giản là Googlebot.

Googlebot thường xuyên lang thang trên Internet và tìm kiếm các trang web mới hoặc được cập nhật gần đây. Quá trình này được gọi là thu thập thông tin. Theo quy luật, nó được thực hiện theo một số cách.

Đầu tiên, Googlebot truy cập các trang mà nó đã được phát hiện trong các lần thu thập thông tin trước đó. Ở đây, nó theo sau tất cả các liên kết được tìm thấy ở đó hoặc sơ đồ trang web XML nếu có một trang được gửi. Tất cả các trang mới tìm thấy sau đó sẽ được thêm vào danh sách các trang để thu thập thông tin sau đó.

Thứ hai, Googlebot thu thập dữ liệu các trang do chủ sở hữu trang web gửi qua Google Search Console. Ở đó, trình thu thập thông tin lấy một phần khác của các trang web để thêm vào hàng đợi thu thập thông tin của nó.

Thông thường, Googlebot sẽ thu thập thông tin tất cả các trang mới mà nó tìm thấy. Tuy nhiên, một trang sẽ không được thu thập thông tin nếu :

Nếu một trang trùng lặp với một trang khác, Googlebot sẽ truy cập trang đó ít thường xuyên hơn để thu thập thông tin hiệu quả hơn.

Ngoài việc tìm kiếm các trang mới trên web, giai đoạn thu thập thông tin cũng bao gồm việc hiển thị (trực quan hóa) một trang mới được khám phá. Googlebot sử dụng trình duyệt Chrome để tải HTML, mã của bên thứ ba, JavaScript và CSS của trang.

Nếu bạn cảm thấy cần phải nghiên cứu sâu về chủ đề này, có tuyệt vời của chúng tôi hướng dẫn về cách trình thu thập thông tin của Google hoạt động để đọc.

Sau đó, Google thêm các trang vào chỉ mục

Sau khi Googlebot tìm thấy một trang mới, nó sẽ cố gắng hiểu nội dung của trang này. Quá trình này được gọi là lập chỉ mục. Nó bao gồm phân tích kỹ lưỡng tất cả các yếu tố của trang như nội dung văn bản, thẻ meta và thuộc tính, hình ảnh và video, v.v.

Theo quy luật, tất cả các trang mới được phát hiện và thu thập thông tin sau đó sẽ được lập chỉ mục. Ngoại lệ duy nhất là nếu trang có lệnh noindex trong thẻ hoặc tiêu đề. Trong trường hợp này, Googlebot sẽ không lập chỉ mục trang.

Khi hoàn tất lập chỉ mục, trình thu thập thông tin lập danh mục trang trong chỉ mục của Google – cơ sở dữ liệu của Google Tìm kiếm. Hiện tại, chỉ mục của Google đếm hàng trăm tỷ trang web .

Sau khi trang mới này được lập chỉ mục, nó đã sẵn sàng để cung cấp cho người tìm kiếm.

Khi Google nhận được một truy vấn, nó sẽ cung cấp các kết quả tìm kiếm

Mỗi khi người dùng nhập một truy vấn vào hộp Tìm kiếm, Google sẽ chuyển sang chỉ mục của nó để tìm và cung cấp các kết quả phù hợp nhất. Quy trình này được gọi là “phục vụ” và bao gồm tám bước.

  SEO thương mại điện tử: Cách thúc đẩy doanh số bán hàng với lưu lượng truy cập không phải trả tiền

Vào thời điểm bạn gửi yêu cầu tìm kiếm của mình, Google sẽ tính đến một số yếu tố giúp thu hẹp chỉ mục và lọc ra các kết quả không liên quan.

Đây là những gì Google kiểm tra ngay cả trước khi bạn nhấn Enter:

Sau khi bạn gửi yêu cầu tìm kiếm của mình tới Google, thì Google phải hiểu ý nghĩa thực sự đằng sau truy vấn của bạn. Không phải lúc nào người dùng cũng biết cách viết chính xác nội dung nào đó hoặc viết cụm từ truy vấn theo cách quản trị viên web làm.

Điều đầu tiên Google làm cho vấn đề đó là nhận dạng từ mới và sửa lỗi chính tả . Google sử dụng các mô hình hiểu ngôn ngữ tự nhiên để giải mã các từ không xác định, lỗi sai và khái niệm. Điều này chủ yếu đạt được bằng cách xem toàn bộ truy vấn thay vì tập trung vào một từ.

Sau đó, Google xác định ý nghĩa và mục đích của truy vấn . Trước đó, Google đã khớp các từ trong truy vấn với các từ trên trang mà không hiểu nghĩa của chúng. Mọi thứ đã thay đổi với giới thiệu thuật toán Hummingbird vào năm 2013. Đó là khi Google bước vào kỷ nguyên mới của tìm kiếm ngữ nghĩa và phát triển khả năng hiểu ý nghĩa của truy vấn hơn là các từ khóa riêng lẻ. Bản cập nhật này là tiền thân của hệ thống Trí tuệ nhân tạo đã trở thành bước đột phá lớn nhất trong xử lý ngôn ngữ tự nhiên.

Tôi sẽ thành thật với bạn. Các SEO trên toàn cầu đang cố gắng tìm ra các thuật toán AI mà Google sử dụng, nhưng chủ đề là bất cứ điều gì nhưng rõ ràng. Có thể, đó là vì Google không muốn chia sẻ bí mật kinh doanh của mình. Hoặc có thể đó là người phát ngôn của Google không đủ hiểu biết. Dù sao, bài đọc rõ ràng và có thẩm quyền nhất về chủ đề này là bài đăng này của Barry Schwartz .

Có 3 hệ thống xử lý ngữ nghĩa mà Barry nhấn mạnh: RankBrain, Neural Matching và BERT. Chúng được đưa ra dần dần và mục tiêu của chúng trùng lặp. Vì vậy, tôi đã chia phạm vi ảnh hưởng của họ để đơn giản hóa vấn đề này cho bạn:

Bằng cách áp dụng ba thuật toán AI này và nâng cao quy trình bằng một số nghệ thuật tối, Google hiểu ý nghĩa của truy vấn và chuyển sang giai đoạn tiếp theo.

Khi Google hiểu được ý nghĩa và mục đích của truy vấn tìm kiếm của bạn, thì Google sẽ kiểm tra xem bạn có đang tìm kiếm thứ gì đó yêu cầu thông tin cập nhật và mới nhất hay không (tin tức, chính trị, sự kiện, v.v.).

Để phát hiện xem bạn có đang tìm kiếm thông tin hiện tại hay không, Google áp dụng mô hình toán học của Truy vấn Deserves Freshness (QDF) cho truy vấn của bạn. Đầu tiên, mô hình xác định rằng chủ đề đó là nóng nếu các trang web tin tức hoặc các bài đăng trên blog đang tích cực đăng tải về chủ đề đó. Hoặc đơn giản là nếu lượng tìm kiếm về một chủ đề tăng lên. Khi Google kết luận đó là chủ đề bạn muốn nhận được thông tin mới nhất, thì Google sẽ thưởng cho nội dung cập nhật có thứ hạng cao hơn.

Ví dụ: khi bạn tìm kiếm “ Prince harry và meghan ”, bạn có thể sẽ thấy một số tin tức về họ. Vì vậy, Google hiển thị các Câu chuyện hàng đầu với tin tức mới nhất về cặp đôi này ở đầu SERP.

Cùng với việc kiểm tra QDF, Google sẽ kiểm tra truy vấn của bạn để xem liệu truy vấn của Google có phải là truy vấn mà Google cho là không thể chấp nhận được để trả về nội dung không đáng tin cậy hay không. Các truy vấn và trang như vậy được gọi là Tiền của Bạn hoặc Cuộc sống của Bạn (YMYL). Theo quy định, đây là các chủ đề về sức khỏe, an toàn, tài chính, v.v.,.

 

Có thể phân biệt các truy vấn về Tiền của bạn hoặc Cuộc sống của bạn và đối sánh chúng với nội dung phù hợp với bản cập nhật Medic. Nếu Google quyết định rằng truy vấn yêu cầu nội dung YMYL, thì Google sẽ đánh giá kiến ​​thức chuyên môn, tính có thẩm quyền và độ tin cậy (E-A-T) của các trang có liên quan, người tạo của chúng và các trang web nói chung. Các trang có điểm E-A-T cao hơn cuối cùng sẽ được xếp hạng cao hơn.

Ví dụ: nếu bạn tìm kiếm “ sàn giao dịch chứng khoán ”, SERP đầu tiên sẽ chủ yếu bao gồm các trang có độ tin cậy cao như Nasdaq, Sở giao dịch chứng khoán London, Sở giao dịch chứng khoán New York, v.v.

Tùy thuộc vào loại truy vấn bạn nhập, SERP có thể trông khác nhau. Ví dụ: cùng với mười liên kết màu xanh lam, nó có thể hiển thị một loạt quảng cáo, kết quả Sơ đồ tri thức, bản đồ, v.v.

Vì vậy, trước khi trả về SERP cuối cùng, Google sẽ quyết định loại kết quả tìm kiếm nào sẽ phù hợp nhất. Như thực tiễn cho thấy, cấu trúc SERP phụ thuộc nhiều vào mục đích tìm kiếm :

Cũng có sự khác biệt đáng chú ý giữa cách Google chọn những tính năng SERP nào để hiển thị cho tìm kiếm trên thiết bị di động và máy tính để bàn.

Ví dụ: SERP trên điện thoại di động có các tính năng độc đáo sau: Mở rộng tìm kiếm này Tinh chỉnh tìm kiếm này (Các tính năng dự đoán), Bảng tri thức với tính năng Xem trong 3D, Ngắn gọn Video và Câu chuyện trên web.

Trong khi đó, có một số tính năng được hiển thị thường xuyên hơn trên máy tính để bàn, ví dụ: quảng cáo và đoạn trích nổi bật. Dưới đây là một ví dụ về sự khác nhau của SERP đầu tiên cho cùng một truy vấn có thể trông như thế nào:

Logic đằng sau sự khác biệt như vậy nằm ở cách chúng ta sử dụng hai loại thiết bị này. Khi ở máy tính để bàn, chúng tôi có nhiều thời gian hơn để nghiên cứu nội dung văn bản. Ngược lại, khi chúng ta sử dụng điện thoại, chúng ta mong muốn tìm thấy thông tin càng nhanh càng tốt. Vì vậy, Google “trang bị” cho SERP nhiều tính năng dự đoán và trực quan hơn.

Sau khi Google nắm được các khái niệm trong truy vấn và các trang, Google sẽ xem xét mức độ tương ứng của thông tin trên trang web với truy vấn tìm kiếm. Để đánh giá mức độ liên quan của nội dung, Google phân tích văn bản, hình ảnh và video cũng như tất cả các yếu tố meta như tiêu đề, mô tả meta và thẻ alt.

Những trang nào có liên quan hơn, tức là đáp ứng tốt nhất các yêu cầu của người dùng, sẽ được xếp hạng cao hơn. Điều đó nói rằng, bạn nên nhớ rằng mức độ liên quan của nội dung, mặc dù rất quan trọng, không phải là yếu tố xếp hạng duy nhất. Đó là sự kết hợp của nhiều yếu tố có thể đảm bảo các vị trí cao trên SERP.

Google xếp hạng các trang ưu tiên nội dung chất lượng và đáng tin cậy nhất. Trên thực tế, nó cố gắng đạt được sự cân bằng phù hợp về mức độ liên quan và thẩm quyền của thông tin ở giai đoạn này.

Điều đầu tiên Google làm cho mục đích này là đánh giá chất lượng nội dung của trang. Vì vậy, nó xác định các tín hiệu chứng tỏ chuyên môn, tính có thẩm quyền và độ tin cậy về một chủ đề nhất định. Quá trình này bao gồm những điều sau:

  12 Chiến thuật SEO lỗi thời cần tránh vào năm 2022

Và vì Google đặt trải nghiệm người dùng lên trên hết, nó cũng kiểm tra xem trang có dễ điều hướng và sử dụng hay không – khả năng sử dụng của trang. Quá trình này cũng khá phức tạp và bao gồm những điều sau:

Rõ ràng, các trang cung cấp cả chất lượng và khả năng sử dụng có xu hướng xếp hạng cao hơn trong kết quả tìm kiếm.

Khi truy vấn của bạn được phân tích từ mọi góc độ và các thuật toán AI đã hoàn thành công việc của mình, Google cuối cùng sẽ trả về các kết quả tìm kiếm phù hợp nhất. Chỉ cần nhìn vào hình ảnh bên dưới – toàn bộ quá trình này chỉ mất một phần nhỏ giây.

Sự thật thú vị

Do đó, để cải thiện chất lượng tìm kiếm, Google làm việc với Người đánh giá chất lượng tìm kiếm – một nhóm các nhà đánh giá độc lập từ khắp nơi trên thế giới. Người đánh giá đánh giá mức độ hiệu quả của tìm kiếm và liệu kết quả tìm kiếm được cung cấp có đáp ứng mục đích tìm kiếm của người dùng hay không. Ngoài ra, họ đánh giá chất lượng của kết quả tìm kiếm dựa trên Chuyên môn, Độ tin cậy và Độ tin cậy của nội dung. Điều quan trọng là họ thực hiện tất cả những điều đó tuân thủ nghiêm ngặt Nguyên tắc xếp hạng chất lượng .

Bên cạnh các bài kiểm tra chất lượng tìm kiếm, Google cũng chạy lại các thử nghiệm song song với sự trợ giúp của Người đánh giá chất lượng. Google hiển thị cho Người xếp hạng hai bộ kết quả tìm kiếm khác nhau: một bộ có thay đổi được đề xuất và một bộ không có. Sau đó, họ hỏi Người xếp hạng họ thích kết quả nào hơn và tại sao.

Xếp hạng do Người đánh giá chất lượng cung cấp không ảnh hưởng trực tiếp đến thứ hạng của một trang. Thay vào đó, thông tin này được tổng hợp để giúp Google đo lường hiệu quả hoạt động của các thuật toán tìm kiếm.

Hơn thế nữa, Google chạy thử nghiệm lưu lượng truy cập trực tiếp để xem cách những người thực tương tác với một tính năng đang được thử nghiệm. Nó bật tính năng này cho một nhóm nhỏ người dùng và sau đó so sánh kết quả với một nhóm kiểm soát. Nếu kết quả không đủ đáp ứng, tính năng này sẽ không được phê duyệt để tích hợp thêm.

Để hoàn thành bức tranh, hãy đi sâu vào các bản cập nhật mới nhất của Google.

Về cơ bản, các bản cập nhật của Google có thể được chia thành hai nhóm.

Nhóm đầu tiên là các cập nhật nhỏ. Theo quy luật, chúng sẽ không được người tìm kiếm chú ý và dẫn đến biến động xếp hạng nhẹ cho người làm SEO. Google thường không cung cấp bất kỳ chi tiết nào về những thay đổi như vậy.

Nhóm thứ hai bao gồm các bản cập nhật thuật toán chính (cốt lõi) của Google, được quan tâm đặc biệt vì đôi khi chúng thay đổi đáng kể cuộc chơi cho cả người dùng và SEO. Dưới đây, tôi đã tổng hợp một số cập nhật nổi bật nhất trong 7 năm qua.

Kết luận

Thuật toán Google Tìm kiếm sẽ luôn bị bao quanh bởi bí ẩn, bất kể cộng đồng SEO toàn cầu cố gắng tấn công nó như thế nào. Lý do là Google muốn ngăn chặn bất kỳ thao tác nào đối với kết quả tìm kiếm từ bên thứ ba và do đó chỉ tiết lộ một phần nhỏ về cách thức hoạt động thực sự của nó.

Tôi hy vọng rằng bài viết của tôi đã gỡ bỏ sự bí mật và giúp bạn hiểu một số điều cơ bản về cách Google và thuật toán của nó hoạt động. Nếu bạn có bất kỳ câu hỏi nào, chào mừng bạn đến với các bình luận.