Công cụ tìm kiếm (Google) hoạt động như thế nào? 

559 lượt xem

Quá trình cào dữ liệu, lập chỉ mục và xếp hạng của google bot. Hãy cùng webaffiliatevn

Như các bạn đã biết, các công cụ tìm kiếm như google là bộ máy trả lời tự động, chúng trả lời bất kì truy vấn nào chúng ta yêu cầu. Chúng khám phá nội dung của các trang web, và sắp xếp các nội dung đó nhằm mục đích cung cấp kết quả phù hợp nhất thõa mãn nhu cầu tìm kiếm thông tin của người sử dụng công cụ tìm kiếm.

Để trang web của bạn có thể hiển thị trong trang đầu của bộ máy tìm kiếm trước tiên nội dung bài viết của bạn phải được lập chỉ mục. Đây là phần quang trọng nhất trong SEO: Nếu trang web của bạn không thể được tìm thấy, sẽ không có cách nào để nó xuất hiện trong SERPs (Trang kết quả của Công cụ tìm kiếm).

Công cụ tìm kiếm làm việc như thế nào?

Quá trình công cụ tìm kiếm làm việc trải qua 3 giai đoạn:

  1. Thu thập dữ liệu: Google thả ra những con robot quét trên mạng internet những nội dung, xem qua mã nguồn của từng trang web mà nó tìm thấy.
  2. Lập chỉ mục: Lưu trữ và sắp xếp nội dung tìm thấy trong quá trình thu thập thông tin. Khi một trang nằm trong chỉ mục, nó sẽ được hiển thị do kết quả của các truy vấn có liên quan.
  3. Xếp hạng: Cung cấp các phần nội dung sẽ trả lời tốt nhất cho truy vấn của người tìm kiếm, điều đó có nghĩa là các kết quả được sắp xếp theo thứ tự phù hợp nhất tới ít liên quan nhất.

Giai đoạn 1: Thu thập dữ liệu

Thu thập dữ liệu là quá trình khám phá nội dung trên internet trong đó công cụ tìm kiếm thả ra các con robot (được gọi là trình thu thập thông tin hay google bot) để tìm nội dung mới và cập nhật. Nội dung có thể khác nhau – đó có thể là trang web, hình ảnh, video, PDF, v.v. – nhưng bất kể định dạng, nội dung đều được phát hiện bởi các liên kết.

Googlebot bắt đầu bằng cách tìm nạp một vài trang web, ưu tiên số một là trang chủ và sau đó theo các liên kết trên các trang web đó để tìm URL mới. Trình thu thập thông tin của google (hay còn gọi là spider) bằng cách bò theo liên kết mới này, nó sẽ tìm thấy nội dung mới và thêm nội dung đó vào chỉ mục của google có tên là Caffeine – một cơ sở dữ liệu lớn về các URL được phát hiện. Sau đó khi người dùng tìm kiếm thông tin, thì url đó sẽ được hiển thị nếu nó phù hợp nhất với nhu cầu tìm kiếm của họ.

Chỉ mục (index) là gì?

Công cụ tìm kiếm xử lý và lưu trữ thông tin họ tìm thấy trong một chỉ mục. Google có một cơ sở dữ liệu khổng lồ chứa tất cả nội dung họ đã khám phá.

Công cụ tìm kiếm xếp hạng các trang web

Khi ai đó thực hiện tìm kiếm, các công cụ tìm kiếm sẽ quét chỉ mục trong cơ sở dữ liệu cho nội dung có liên quan cao nhất, phù hợp nhất nhằm thõa mãn nhu cầu của người sử dụng công cụ tìm kiếm. Thứ tự kết quả tìm kiếm theo mức độ liên quan được gọi là xếp hạng.

Một trang web được xếp hạng cao khi nội dung trang web đó đáp ứng tốt các yêu cầu của người dùng chứ không chỉ là đáp ứng tốt các yêu cầu kĩ thuật.

Bạn cũng có thể chặn google bot thu thập  một phần hoặc toàn bộ website của bạn hoặc hướng dẫn các công cụ tìm kiếm để tránh lưu trữ các trang nhất định trong chỉ mục của chúng.

Bạn cũng có thể chặn trình thu thập crawl dữ liệu một phần hoặc toàn bộ trang web nhằm tránh, không cho chúng thu thập dữ liệu và lập chỉ mục.

Lưu ý: Trong SEO, không phải tất cả các công cụ tìm kiếm đều như nhau. Có thể trên google trang web của bạn đứng top 5 nhưng trên bing lại đứng top 1.

Mặc dù có hơn 30 công cụ tìm kiếm web lớn, nhưng cộng đồng SEO thực sự chỉ chú ý đến Google. Tại sao? Câu trả lời ngắn gọn là vì phần lớn khi tìm kiếm điều gì đó mọi người thường sử dụng google. Theo thống kê số người sử dụng google tìm kiếm lên đến 90% gấp khoảng 20 lần Bing và Yahoo kết hợp, nên khi làm SEO, không chỉ riêng ở Việt Nam, mọi người thường mặc định nó là SEO google.

Làm thế nào để biết google đã tìm thấy và thu thập dữ liệu trên website của bạn hay chưa?

Một cách đơn giản để kiểm tra điều này là vào google.com.vn và gõ site:<url của website bạn> Ví dụ site:webaffiliatevn.com

Số kết quả mà google hiển thị tuy không chính xác, nhưng nó cho bạn biết rằng trang web của bạn đã được google biết đến và lập chỉ mục.

Để có kết quả chính xác hơn, hãy theo dõi và sử dụng báo cáo Độ bao phủ trong Google Search Console.

Với công cụ này, bạn có thể gửi sơ đồ trang web cho google và theo dõi số lượng trang thực sự đã được thêm vào chỉ mục của Google.

Nếu trang web của bạn không hiển thị ở bất cứ đâu trong kết quả tìm kiếm, có một vài lý do sau:

  • Trang web của bạn hoàn toàn mới và chưa được thu thập thông tin.
  • Trang web của bạn không được liên kết đến từ bất kỳ trang web bên ngoài.
  • Điều hướng trang web của bạn làm cho robot khó thu thập thông tin một cách hiệu quả.
  • Trang web của bạn chứa một số mã cơ bản được gọi là chỉ thị trình thu thập thông tin đang chặn các công cụ tìm kiếm.
  • Trang web của bạn đã bị Google phạt vì các thủ thuật spam.

Hầu hết mọi người nghĩ về việc đảm bảo Google có thể tìm thấy các trang quan trọng của họ, nhưng họ quên rằng có những trang bạn không muốn Googlebot tìm thấy. Chúng có thể bao gồm những thứ như URL cũ có nội dung ít, kém chất lượng, duplicate content, URL trùng lặp.

Vậy làm sao để google không index những nội dung như thế này?, hãy sử dụng robot.txt.

Robots.txt

Các tệp Robots.txt được đặt trong thư mục gốc của các trang web (ví dụ: yourdomain.com/robots.txt) tệp này cho google bot biết được phần nào trên website của bạn nên và không nên thu thập dữ liệu, cũng như tốc độ chúng thu thập dữ liệu trang web của bạn.

Cách Googlebot xử lý tệp robot.txt

  • Nếu google bot không thể tìm thấy tệp robot.txt, nó sẽ tiến hành thu thập dữ liệu trên trang web.
  • Nếu google bot tìm thấy tệp robots.txt, nó sẽ tuân theo các đề xuất và tiến hành thu thập dữ liệu trang web.
  • Nếu Googlebot gặp lỗi trong khi cố gắng truy cập tệp robot.txt của trang web và không thể xác định xem có tồn tại hay không, nó sẽ không thu thập dữ liệu website của bạn.

Tối ưu hóa ngân sách thu thập dữ liệu!

Ngân sách thu thập là số lượng URL trung bình Googlebot sẽ thu thập dữ liệu trên trang web của bạn trước khi rời khỏi, vì vậy, thu thập thông tin tối ưu hóa đảm bảo rằng Googlebot không lãng phí thời gian để bò qua các trang không quan trọng của bạn. Ngân sách thu thập là quan trọng nhất trên các trang web rất lớn với hàng chục nghìn URL , nhưng không bao giờ là ý tưởng tồi để chặn trình thu thập thông tin truy cập nội dung mà bạn chắc chắn không quan tâm. Chỉ cần đảm bảo không chặn quyền truy cập của trình thu thập thông tin vào các trang bạn đã thêm các chỉ thị khác, chẳng hạn như thẻ canonical hoặc noindex. Nếu Googlebot bị chặn từ một trang, nó sẽ không thể theo dõi điều hướng trên trang đó

Xác định tham số URL trong GSC

Một số trang web (phổ biến nhất là  thương mại điện tử) cung cấp cùng một nội dung trên nhiều URL khác nhau bằng cách nối thêm các tham số nhất định vào URL. Nếu bạn đã từng mua sắm trực tuyến, có khả năng bạn đã thu hẹp tìm kiếm của mình thông qua các bộ lọc.

Ví dụ: bạn có thể tìm kiếm mua giày cho nữ trên Tiki, sau đó tùy chỉnh tìm kiếm của bạn theo kích cỡ, màu sắc và kiểu dáng. Mỗi lần bạn tùy chỉnh, nếu bạn để ý sẽ thấy URL thay đổi một chút.

https://www.tiki.vn/products/san-pham/nu/?carget=dam&color=xanh
https://tiki.vn/shopindex.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123$affid=43, ? url này khác url trên nhưng vẫn là mua đầm nữ màu xanh. Nội dung giống như url trên nhưng có chứa link affiliate.

Làm cách nào Google biết phiên bản URL nào sẽ phục vụ cho người tìm kiếm? Google thực hiện công việc khá tốt khi tự mình tìm ra URL đại diện, nhưng bạn có thể sử dụng tính năng Thông số URL trong Google Search Console để cho Google biết chính xác cách bạn muốn họ xử lí với các trang của mình. Nếu bạn sử dụng tính năng này để báo cho Googlebot, không thu thập dữ liệu cho URL có tham số ____, thì về cơ bản, bạn đang yêu cầu ẩn nội dung này khỏi Googlebot, điều này có thể dẫn đến việc xóa các trang đó khỏi kết quả tìm kiếm. Đó là những gì bạn muốn nếu các tham số đó tạo các trang trùng lặp, nhưng không lý tưởng nếu bạn muốn các trang đó được lập chỉ mục.

Bạn có thể tìm hiểu thêm cách cấu hình các thông số tại https://support.google.com/webmasters/answer/6080548?hl=vi

Trình thu thập thông tin có thể tìm thấy tất cả nội dung quan trọng của bạn?

Đôi khi một công cụ tìm kiếm sẽ có thể tìm thấy các phần trang web của bạn bằng cách thu thập thông tin, nhưng các trang hoặc phần khác có thể bị che khuất vì một lý do nào đó. Điều quan trọng là đảm bảo rằng các công cụ tìm kiếm có thể khám phá tất cả nội dung bạn muốn lập chỉ mục, không chỉ trang chủ của bạn.

Nội dung của bạn ẩn đằng sau các hình thức đăng nhập?

Nếu bạn yêu cầu người dùng đăng nhập, điền vào biểu mẫu hoặc trả lời khảo sát trước khi truy cập một số nội dung nhất định, công cụ tìm kiếm sẽ không thấy các trang được bảo vệ đó.

Google bot có thể sử dụng hình thức tìm kiếm trên website không?

Robot không thể sử dụng các hình thức tìm kiếm. Một số người tin rằng nếu họ đặt hộp tìm kiếm trên trang web của họ, công cụ tìm kiếm sẽ có thể tìm thấy mọi thứ mà khách truy cập của họ tìm kiếm.

Văn bản ẩn trong nội dung phi văn bản?

Không nên sử dụng các hình thức đa phương tiện (hình ảnh, video, GIF, v.v.) để hiển thị văn bản mà bạn muốn được lập chỉ mục. Mặc dù các công cụ tìm kiếm đang trở nên tốt hơn trong việc nhận dạng hình ảnh, nhưng không có gì đảm bảo họ sẽ có thể đọc và hiểu nó. Luôn luôn tốt nhất để thêm văn bản trong phần đánh dấu <HTML> của trang web của bạn.

Công cụ tìm kiếm có thể theo dõi điều hướng trang web của bạn?

Giống như googlebot cần khám phá trang web của bạn thông qua các liên kết từ các trang web khác, nó cần một đường dẫn liên kết trên trang web của riêng bạn để hướng dẫn nó bò từ trang này sang trang khác.

Nếu bạn đã có một trang nhưng nó không được liên kết đến từ bất kỳ trang nào khác thì nó không mạng lại hiểu quả so với việc bạn có những liên kết nội bộ giúp google bot bò từ trang này sang trang khác để quét website của bạn dễ dàng hơn.

Nhiều trang web mắc sai lầm nghiêm trọng trong việc cấu trúc điều hướng của họ theo những cách không thể tiếp cận với các công cụ tìm kiếm, giảm tỉ lệ trang web xuất hiện trong kết quả tìm kiếm.

Các lỗi điều hướng phổ biến có thể khiến trình thu thập thông tin không nhìn thấy tất cả trang web của bạn:

  • Có một điều hướng di động cho thấy kết quả khác với điều hướng trên destop của bạn
  • Bất kỳ loại điều hướng nào trong đó các mục menu không có trong HTML, chẳng hạn như điều hướng hỗ trợ JavaScript. Google đã thu thập thông tin tốt hơn và hiểu Javascript, nhưng đây vẫn chưa phải là một quy trình hoàn hảo. Cách chắc chắn hơn để đảm bảo một cái gì đó được tìm thấy, hiểu và lập chỉ mục bởi Google là bằng cách đưa nó vào HTML.
  • Cá nhân hóa, hoặc hiển thị điều hướng duy nhất cho một loại khách truy cập cụ thể so với những người truy cập khác, có thể dường như đang che giấu cho trình thu thập công cụ tìm kiếm.
  • Quên liên kết đến một trang chính trên trang web của bạn thông qua điều hướng của bạn – hãy nhớ rằng, các liên kết là các đường dẫn trình thu thập thông tin theo các trang mới!
  • Đây là lý do tại sao trang web của bạn nên có điều hướng rõ ràng và cấu trúc thư mục URL hữu ích.

Bạn có kiến ​​trúc thông tin tốt?

Kiến trúc thông tin là thực hành tổ chức và dán nhãn nội dung trên một trang web để cải thiện hiệu quả và khả năng tìm kiếm cho người dùng. Kiến trúc thông tin tốt nhất, trực quan giúp người dùng không cần phải suy nghĩ rất nhiều để lơướt qua trang web của bạn hoặc để tìm một cái gì đó.

Bạn đã sử dụng sơ đồ trang web chưa?

Sơ đồ trang web giống như một danh sách: danh sách các URL trên website của bạn mà trình thu thập thông tin có thể sử dụng để khám phá và lập chỉ mục nội dung của bạn.

Một trong những cách dễ nhất để đảm bảo Google tìm thấy các trang ưu tiên cao nhất của bạn là tạo một tệp đáp ứng các tiêu chuẩn của Google và gửi nó thông qua Google Search Console. Mặc dù việc gửi sơ đồ trang web không thay thế nhu cầu điều hướng trang web tốt, nhưng chắc chắn nó có thể giúp trình thu thập thông tin theo một đường dẫn đến tất cả các trang quan trọng của bạn.

Nếu trang web của bạn không có bất kỳ trang web nào khác liên kết đến nó, bạn vẫn có thể lập chỉ mục cho nó bằng cách gửi sơ đồ trang web XML của bạn trong Google Search Console.

Trình thu thập thông tin có bị lỗi khi họ cố truy cập URL của bạn không?

Trong quá trình thu thập dữ liệu URL trên trang web của bạn, trình thu thập thông tin có thể gặp lỗi. Bạn có thể truy cập module độ bao phủ trong Google Search Console để phát hiện các URL có thể xảy ra – báo cáo này sẽ hiển thị cho bạn các lỗi máy chủ và không tìm thấy lỗi. Các tệp nhật ký máy chủ (log) cũng có thể cho bạn thấy điều này.

Mã 4xx: Khi trình thu thập công cụ tìm kiếm không thể truy cập nội dung của bạn do lỗi máy khách

Lỗi 4xx là lỗi máy khách, nghĩa là URL được yêu cầu chứa cú pháp sai hoặc không thể thực hiện được. Một trong những lỗi 4xx phổ biến nhất là lỗi 404 not found. Điều này có thể xảy ra do lỗi chính tả URL, trang bị xóa hoặc chuyển hướng bị hỏng. Khi các công cụ tìm kiếm gặp lỗi 404, họ không thể truy cập URL. Khi người dùng gặpj 404, họ có thể thất vọng và rời đi.

Mã 5xx: Khi trình thu thập công cụ tìm kiếm không thể truy cập nội dung của bạn do lỗi máy chủ

Lỗi 5xx là lỗi máy chủ, nghĩa là máy chủ mà trang web được đặt không thể đáp ứng yêu cầu của người tìm kiếm hoặc công cụ tìm kiếm để truy cập trang. Trong báo cáo Lỗi thu thập dữ liệu của Google Search Console, có một tab dành riêng cho các lỗi này. Điều này thường xảy ra vì yêu cầu URL đã hết thời gian, vì vậy Googlebot đã từ bỏ yêu cầu. Rất may, có một cách để thông báo với cả người tìm kiếm và công cụ tìm kiếm rằng trang của bạn đã di chuyển – chuyển hướng 301.

Giả sử bạn chuyển một trang từ example.com/young-dogs/ sang example.com/puppies/ . Công cụ tìm kiếm và người dùng cần một cây cầu để chuyển từ URL cũ sang URL mới. Cây cầu đó là một chuyển hướng 301.

 

  Khi thực hiện 301 Khi không thực hiện 301
Liên kết công bằng Chuyển hướng liên kết từ url cũ trang sang url mới Quyền hạn từ URL trước đó sẽ không được chuyển sang phiên bản mới của URL.
Lập chỉ mục Giúp google tìm và lập chỉ mục phiên bản mới của trang. Lỗi 404 trên trang web của bạn không gây hại cho hiệu suất tìm kiếm, nhưng để cho các trang xếp hạng, bán hàng bị lỗi  404 có thể khiến chúng rơi ra khỏi chỉ mục, với thứ hạng và lưu lượng truy cập đi cùng với chúng.
Trải nghiệm người dùng Đảm bảo người dùng tìm thấy trang họ đang tìm kiếm Khách hàng khi nhấp vào link chết sẽ đưa họ đến các trang bị lỗi, thay vì trang dự định khi dùng chuyển hướng 301. Điều này gây ra trải nghiệm không tốt.

 

Bản thân mã trạng thái 301 có nghĩa là trang đã di chuyển vĩnh viễn đến một vị trí mới, do đó, tránh chuyển hướng URL đến các trang không liên quan với nội dung của url cũ. Nếu một trang đang xếp hạng cho một truy vấn và bạn 301 nó đến một URL có nội dung khác, nó có thể rớt hạng. 

Giai đoạn 2: Lập chỉ mục

Khi bạn đã đảm bảo trang web của mình được thu thập thông tin, tiếp theo hãy đảm bảo trang web có thể được lập chỉ mục. Trang web của bạn có thể được phát hiện và thu thập thông tin bởi một công cụ tìm kiếm nhưng không có nghĩa là nó sẽ được lưu trữ trong chỉ mục của họ. Trong phần trước về thu thập thông tin, bạn đã biết được cách cách công cụ tìm kiếm khám phá các trang web của bạn. Chỉ mục là nơi các trang khám phá được lưu trữ

Các trang bị xóa khỏi chỉ mục khi nào?

  • URL đang trả về lỗi “không tìm thấy” (4XX) hoặc lỗi máy chủ (5XX) – Điều này có thể là vô tình (trang đã bị di chuyển và chuyển hướng 301 không được thiết lập) hoặc cố ý (trang đã bị xóa và 404 để làm cho nó bị xóa khỏi chỉ mục)
  • URL có thẻ meta noindex được thêm vào – Chủ sở hữu trang web có thể thêm thẻ này để hướng dẫn công cụ tìm kiếm bỏ qua trang khỏi chỉ mục của nó.
  • URL đã bị phạt thủ công vì vi phạm Nguyên tắc quản trị trang web của công cụ tìm kiếm và do đó, đã bị xóa khỏi chỉ mục.
  • URL đã bị chặn thu thập thông tin với việc thêm mật khẩu cần thiết trước khi khách truy cập có thể truy cập trang.

Nếu bạn tin rằng một trang trên website của bạn trước đây trong chỉ mục của Google không còn hiển thị nữa, bạn có thể sử dụng công cụ Kiểm tra URL (trong google search console) để tìm hiểu trạng thái của trang hoặc sử dụng Tìm nạp url có tính năng “yêu cầu lập chỉ mục” để gửi các URL riêng lẻ vào chỉ mục.

Thẻ meta robot

Thẻ meta robot có thể được sử dụng trong <head> mã HTML của trang web. Nó có thể loại trừ tất cả hoặc các công cụ tìm kiếm cụ thể. Dưới đây là các chỉ thị meta phổ biến nhất và những tình huống bạn có thể áp dụng.

  • Index / noindex cho các công cụ tìm kiếm biết liệu trang có nên được thu thập và giữ trong chỉ mục của công cụ tìm kiếm để truy xuất hay không. Nếu bạn chọn sử dụng “noindex”, bạn đang thông báo với các trình thu thập thông tin là trang đó bạn muốn loại khỏi chỉ mục của google. Theo mặc định, các công cụ tìm kiếm cho rằng họ có thể lập chỉ mục tất cả các trang, vì vậy sử dụng thuộc tính “index” là không cần thiết.Trường hợp nào bạn nên sử dụng thẻ “noindex”: Bạn có thể chọn đánh dấu một trang là “noindex” nếu bạn đang cố gắng bỏ các trang có nội dung kém chất lượng khỏi chỉ mục của Google trên trang web của bạn (ví dụ: trang hồ sơ do người dùng tạo) bạn vẫn muốn khách hàng cập truy cập được, nhưng không cho google index những trang này.

 

  • Follow / nofollow cho các công cụ tìm kiếm xem các liên kết trên trang nên được theo dõi hay không theo dõi. Theo dõi kết quả của các chương trình trong các bot theo các liên kết trên trang của bạn và chuyển một phần uy tín đến các URL đó. Hoặc, nếu bạn chọn sử dụng “nofollow”, các công cụ tìm kiếm sẽ không theo dõi hoặc chuyển bất kỳ phần uy tín cho các liên kết trên trang.

Cũng giống như Index / noindex mặc định, tất cả các trang được coi là có thuộc tính “follow”. Khi nào bạn sử dụng: nofollow thường được sử dụng cùng với noindex khi bạn đang cố gắng ngăn trang bị lập chỉ mục cũng như ngăn trình thu thập thông tin theo dõi các liên kết trên trang.

 

  • Noarchive được sử dụng để hạn chế các công cụ tìm kiếm lưu một bản sao được lưu trong bộ nhớ cache của trang. Theo mặc định, các công cụ sẽ duy trì các bản sao hiển thị của tất cả các trang mà chúng đã lập chỉ mục, có thể truy cập được cho người tìm kiếm thông qua liên kết được lưu trong bộ nhớ cache trong kết quả tìm kiếm.

Trường hợp nào bạn sử dụng thuộc tính ‘noarchive’: Nếu bạn quản trị một trang web thương mại điện tử và giá của bạn thay đổi thường xuyên, bạn có thể xem xét thẻ Noarchive để ngăn người tìm kiếm thấy giá quá cũ.

Dưới đây là một ví dụ về thẻ meta robot, sử dụng thuộc tính noindex, nofollow

<! DOCTYPE html>

<html>

<head>

<meta name = “robot” content = “noindex, nofollow” />

</head>

<body> … </body>

</ html>

Ví dụ này loại trừ tất cả các công cụ tìm kiếm khỏi việc lập chỉ mục trang và theo dõi liên kết trên trang nào. Nếu bạn muốn loại trừ nhiều trình thu thập thông tin, như googlebot và bing bot, bạn có thể sử dụng nhiều thẻ loại trừ robot.

Giai đoạn 3: Xếp hạng

Bạn đã có bao giờ đặt câu hỏi: Khi người nào đó gõ từ khóa vào thanh tìm kiếm, google làm cách nào để trả về các trang web có liên quan, phù hợp nhất? Quá trình đó gọi là xếp hạng hoặc sắp xếp thứ tự kết quả tìm kiếm theo mức độ phù hợp nhất tới ít liên quan nhất.

Để xác định mức độ liên quan, các công cụ tìm kiếm sử dụng các thuật toán, một quy trình hoặc công thức mà thông tin lưu trữ được truy xuất và sắp xếp theo cách có ý nghĩa. Các thuật toán này đã trải qua nhiều thay đổi trong những năm qua để cải thiện chất lượng kết quả tìm kiếm.

Google thực hiện điều chỉnh thuật toán mỗi ngày – một số cập nhật này là các chỉnh sửa chất lượng nhỏ, trong khi các cập nhật khác là các cập nhật thuật toán rộng được triển khai để giải quyết một vấn đề cụ thể, như thuật toán Penguin để giải quyết spam liên kết (backlink).

Vai trò của các liên kết trong SEO

Khi nói về các liên kết trong SEO, thì có thể kể đến liên kết nội bộ và liên kết ra bên ngoài. Trong khi các liên kết nội bộ là các liên kết trỏ đến các trang khác trên cùng một website, thì các liên kết ra bên ngoài là liên kết trỏ đến trang web khác thuộc một website khác.

Backlink hoạt động rất giống với giới thiệu WoM (Truyền miệng) ngoài đời thực. Lấy ví dụ là cửa hàng cà phê giả định.

  • Giới thiệu từ người khác là tốt nhất,

Ví dụ: Nhiều người khác nói về Coffee Tony là tốt nhất thị trấn, trong SEO giống như bạn có được backlink từ nhiều website khác nhau.

Đối với backlink nên quan trọng chất lượng hơn là số lượng, tránh đi backlink ở những web kém uy tín.

  • Giới thiệu từ chính bạn = thiên vị, vì vậy không phải là một dấu hiệu tốt cho độ uy tín.

Ví dụ: Jenny tuyên bố rằng Jenny’s Coffee là tốt nhất trong thị trấn.
Trong backlink: tự mình viết bài pr về web của mình. 

  • Các giới thiệu từ các nguồn không liên quan hoặc chất lượng thấp = không phải là dấu hiệu tốt và thậm chí có thể khiến bạn bị gắn cờ vì spam.
    Ví dụ: Jenny trả tiền để có những người chưa bao giờ ghé thăm quán cà phê của cô ấy nói với người khác rằng nó tốt như thế nào.
    Trong backlink: ví dụ như web bạn đang nói về dịch vụ Seo nhưng lại đặt backlink ở những web nói về cờ bạc, cá độ. 
  • Không có giới thiệu = độ uy tín không rõ ràng.
    Ví dụ: Cà phê của Jenny có thể tốt, nhưng bạn không thể tìm thấy bất cứ ai có ý kiến ​​nên bạn không chắc chắn.

Trong backlink: Website của bạn không có một backlink trang web nào trỏ đến cả.

Vai trò của nội dung trong SEO

Bất cứ khi nào ai đó thực hiện tìm kiếm, có hàng ngàn kết quả có thể tìm thấy, vậy làm thế nào để các công cụ tìm kiếm quyết định trang nào mà người tìm kiếm sẽ tìm thấy giá trị? Một phần phần quan trọng trong việc xác định nơi trang của bạn sẽ xếp hạng cho một truy vấn nhất định là nội dung trên trang của bạn phù hợp với mục đích của truy vấn như thế nào. Nói cách khác, trang này có khớp với các từ đã được tìm kiếm và giúp hoàn thành nhiệm vụ mà người tìm kiếm đang cố gắng thực hiện không?

Do google tập trung vào làm hài lòng người tìm kiếm, không có điểm chuẩn nghiêm ngặt nào về nội dung của bạn nên dài bao nhiêu, mật độ từ khóa là bao nhiêu hoặc nội dung bạn đặt trong thẻ tiêu đề. nhưng quan trọng là người dùng thích đọc nội dung của bạn.

Google RankBrain

RankBrain là thành phần máy học của thuật toán cốt lõi của Google. Máy học là một chương trình máy tính tiếp tục cải thiện dự đoán của mình theo thời gian thông qua các quan sát và dữ liệu mới. Nói cách khác, nó luôn luôn cải tiến và bởi vì nó luôn luôn cải tiến nên kết quả tìm kiếm sẽ không ngừng được cải thiện.

Nói một cách đơn đơn giản Google Rankbrain có thể tự động thay đổi thuật toán của google, sau đó xét xem thuật toán nào tối ưu nhất, trả về thông tin hữu ích cho người dùng nhất thì sẽ được Rankbrain giữ lại.

Ví dụ ngày 8/8/2019 khi bạn search “size giày cho nam” thì web cafia đang đứng trên nhưng ngày hôm sau nếu RankBrain phát hiện trang web giaytot.com cung cấp nội dung tốt hơn, hữu ích hơn, các chỉ số tương tác của người dùng trên web này nhiều hơn thì nó sẽ được tăng thứ hạng.

Điều này có ý nghĩa gì với SEO?

Vì Google sẽ tiếp tục tận dụng RankBrain để quảng bá nội dung hữu ích, phù hợp nhất, vì thế bạn cần tập trung vào việc ý định của người tìm kiếm hơn bao giờ hết. Cung cấp thông tin hữu ích và trải nghiệm tốt nhất có thể cho những người tìm kiếm thì chắc trang web sẽ tăng thứ hạng.

Làm sao để biết trang của bạn có sự tương tác tốt? Dựa vào các yếu tố sau:

  • Số lần nhấp chuột (lượng truy cập từ tìm kiếm)
  • Thời gian trên trang (Lượng thời gian khách truy cập trên một trang trước khi rời khỏi )
  • Tỷ lệ thoát (tỷ lệ phần trăm của tất cả các phiên trên trang web nơi người dùng chỉ xem một trang)
  • Pogo-sticking (nhấp vào kết quả sau đó nhanh chóng quay lại SERP để chọn kết quả khác)
Đánh giá post

Các kênh thông tin của chúng tôi

Disclaimer: Thông tin trong bài viết không phải là lời khuyên đầu tư từ Coin98 Insights. Hoạt động đầu tư tiền mã hóa chưa được pháp luật một số nước công nhận và bảo vệ. Các loại tiền số luôn tiềm ẩn nhiều rủi ro tài chính.

You cannot copy content of this page

Contact Me on Zalo