Chào mừng bạn đến với Thế giới SEO

Mình mới tìm hiểu về SEO (Search Engine Optimization). Nên hầu hết những bài viết ở website Thế giới SEO này là do mình tập hợp từ các website viết và chia sẻ kinh nghiệm thực tiễn về SEO hàng đầu Việt Nam như Làm SEO, Việt SEO.net, v.v...

Do vậy nếu bạn có copy lại vui lòng tôn trọng bản quyền tác giả bằng cách ghi nguồn rõ ràng như mình đã ghi cuối mỗi bài viết.

Tuesday 27 July 2010

Google sitelinks vẫn còn là bí ẩn thú vị

Google sitelinks luôn là bí ẩn thú vị dù đôi khi mang đến phiền toái. Rất nhiều bài viết, thảo luận từ các chuyên gia SEO, nhà quản trị web từ xưa đến nay về Google sitelinks cũng chỉ dừng lại ở mức… phỏng đoán (SEO nói chung cũng luôn bí ẩn, nhưng ít ra Google đã chia sẻ tài liệu và rất nhiều bài viết chi tiết về từng khía cạnh trong đó).

Nhân sự kiện Google vừa cập nhật sitelinks tuần rồi, mình cũng muốn chia sẻ vài trải nghiệm nho nhỏ về Google sitelinks.

Thế Google sitelinks là gì?

Sitelinks, tức là “liên kết” của một site, thường là liên kết nội (internal links) hiển thị ngay bên dưới URL hay snippet (phần mô tả nội dung trang web được Google chọn) trên kết quả tìm kiếm (SERPs), giúp người dùng có thể vào các trang bên trong trang web mà không cần phải vào trang chủ. Bằng cách này, theo Google, sitelinks như là shortcuts giúp tiết kiệm thời gian của người dùng.

Theo cách “truyền thống” và đầy đủ nhất thì Google sẽ hiển thị tối đa 8 liên kết bên dưới URL dù rằng 1 site có thể có hơn 8 sitelinks (như site nhạc Mp3 Zing có tới 24 sitelinks, xem bên dưới).

Google sitelinks của LamSEO.com trên Google.com

Google sitelinks của LamSEO.com trên Google.com ngày 27/7/2010 với từ khóa "lamseo".

Nhưng từ tháng 3/2009, Google đã thử nghiệm hiển thị sitelinks theo chiều ngang, tối đa 4 liên kết và nằm ngay bên dưới snippet (thay vì URL như truyền thống). Các liên kết này thường là phần bên trái của bộ 8 links khi hiển thị đầy đủ.

Sitelinks của LamSEO.com theo chiều ngang trên Google Việt Nam với từ khóa "lam seo"

Sitelinks của LamSEO.com theo chiều ngang trên Google Việt Nam với từ khóa "lam seo"

Google xác định sitelinks như thế nào?

Đây chính là câu hỏi chưa có đáp án chính xác và toàn diện nhất. Google chỉ bật mí rất chung chung:

“We only show sitelinks for results when we think they’ll be useful to the user. If the structure of your site doesn’t allow our algorithms to find good sitelinks, or we don’t think that the sitelinks for your site are relevant for the user’s query, we won’t show them.

At the moment, sitelinks are completely automated. We’re always working to improve our sitelinks algorithms, and we may incorporate webmaster input in the future.”

tạm dịch sát nghĩa:

“Chúng tôi chỉ hiển thị sitelinks cho những kết quả mà chúng tôi NGHĨ chúng hữu ích với người dùng. Nếu cấu trúc site không cho phép giải thuật của chúng tôi tìm những sitelinks tốt, hoặc chúng tôi không nghĩ rằng sitelinks liên quan đến truy vấn của người dùng, thì chúng tôi sẽ không hiển thị chúng.

Hiện tại, sitelinks được xác định một cách tự động. Chúng tôi luôn cố gắng cải tiến giải thuật sitelinks và có thể trong tương lai chúng tôi sẽ tham khảo thêm ý kiến của webmaster”

Giả thuyết “chấp nhận được”

Google chỉ hiển thị sitelinks với những từ khóa mà bạn đạt tỉ lệ click (CTR) cực kỳ cao (đến mức nào thì chưa thể xác định), thường là các từ khóa thương hiệu, tên miền. Ví LamSEO.com sẽ hiển thị với các từ khóa như: lamseo.com, lamseo, lam seo, làm seo, tư vấn seo, tu van seo.

Google chỉ hiển thị những liên kết mà Googlebot có thể dò tìm từ trang chủ, thường là HTML links được đặt cao ở HTML sourceđược click nhiều nhất.

Phản biện vài giả thuyết…

Sitelinks chỉ dành cho site có trên 1 năm tuổi. Thực tế thì mình đã từng chứng kiến các site chỉ ra đời hơn 1 tháng đã có sitelinks (như Thuanthien.zing.vn) dù mình không phủ nhận tuổi đời tên miền có ảnh hưởng nhất định trong sitelinks và SEO nói chung.

Sitelinks chỉ hiển thị với các trang có nhiều liên kết ngoại với backlinks chứa anchor text là tên trang web. Mình có site cá nhân DuNguyen.com đang hiển thị những sitelinks cho trang Tag (/proxy) mà mình chưa bao giờ chú trọng phải xây dựng liên kết hay internal links.

Sitelinks của DuNguyen.com trên Google Việt Nam.

Sitelinks của DuNguyen.com trên Google Việt Nam.

Sitelinks chỉ hiển thị liên kết nội bộ. Hãy nhìn sitelinks của Zing.vn hiện tại, bạn sẽ thấy có 2 link đến mp3.zing.vn và me.zing.vn mà subdomain được Google xem như là site riêng.

Sitelinks của www.zing.vn có 2 link đến mp3.zing.vn và me.zing.vn

Sitelinks của www.zing.vn có 2 link đến mp3.zing.vn và me.zing.vn

Google chỉ hiển thị sitelinks của trang chủ. Hãy xem Zing Mp3 có sitelinks từ chuyên trang video clip.

Mp3 Zing có sitelinks ở chuyên trang Video clip.

Mp3 Zing có sitelinks ở chuyên trang Video clip.

Google chỉ hiển thị liên kết/trang web có traffic cực cao hoặc được click nhiều nhất trang. Hãy xem phần “cách khóa sitelink” bên dưới, bạn sẽ thấy nhận định này là sai.

Làm thế nào để có sitelinks như ý?

Câu hỏi đặt ra “làm thế nào để có sitelinks?” cũng được các chuyên gia thảo luận rất nhiều. Theo phỏng đoán bên trên thì mình thấy 2 điều kiện tiên quyết để có sitelinks gồm: đạt CTR cực cao (so với các site xếp dưới ở top 10 kết quả tìm kiếm) với một số từ khóa (không nhất định phải là brand) và nên tạo các HTML links đặt cao ở mã nguồn HTML, thường là các link trong Top Menu/Navigation. Trong đó CTR là do người dùng quyết định nhưng bạn có thể chủ động tối ưu thông tin hiển thị (page title, description/snippet, URL) cũng như tận dụng HTML links thay vì javascript ở Navigation/Menu (ngoài ra có thể tạo Breadcrumbs cho các trang con).

Để tối ưu sitelinks, ngoài làm tốt 2 điều căn bản trên, bạn có thể khóa (block) các liên kết không muốn hiển thị và “chờ đợi” Google sẽ tìm link khác.

Cách khóa sitelink không mong muốn

Ngay đầu bài viết mình đã nói sitelinks đôi khi mang đến phiền phức. Hmm, đúng là như vậy, bởi nó được tạo tự động, và vì vậy, không phải lúc nào cũng hiển thị link mình mong muốn. “Tai nạn nghề nghiệp” dưới đây là một ví dụ.

Một ngày cuối tuần cách đây 2 tháng (tuần cuối tháng 5/2010) (khi này mình không còn làm fulltime cho VNG nên không quản lý sâu sát Webmaster tools của các site Zing), một số cộng đồng online đưa tin Zing Mp3 đang cố tình tạo xì-căng-đan với 1 sitelink rất nhạy cảm.

Một sitelink rất nhạy cảm của Zing Mp3 ngày 29/5/2010

Một sitelink rất nhạy cảm của Zing Mp3 ngày 29/5/2010

Mình vội vàng login vào Google Webmaster Tools để khóa sitelink đó lại.

Log in vào Google Webmaster Tools, chọn tab Sitelinks

Log in vào Google Webmaster Tools, chọn tab Sitelinks

Vào Site Configuration, tab Sitelinks, chọn sitelink không mong đợi đó, tiến hành “block”.

Khóa (block) 1 site link không mong muốn.

Khóa (block) 1 site link không mong muốn.

Ngoài ra, để chắc chắn, mình cũng cập nhật robots.txt lẫn yêu cầu Google remove những trang nhạy cảm đó ra khỏi index. Và chờ đợi. May thay, khoảng 8 giờ sau Google đã cập nhật sitelinks mới, dẫu thỉnh thoảng Google vẫn hiện cache trong 1 tuần đầu tiên.

Mình chắc chắn rằng sitelink nhạy cảm trên là ngoài ý muốn, không hề có traffic trước đó và chỉ xuất hiện khi Google cập nhật giải thuật sitelinks lần đó. Xem pageviews của URL đó trong Google Analytics sẽ thấy rõ điều đó.

Không cần có nhiều lượt xem để có 1 sitelink!

Không cần có nhiều lượt xem để có 1 sitelink!

Du NguyễnLamSEO.com

(Vui lòng ghi rõ nguồn LamSEO.com khi đăng lại bài viết này. Trân trọng cảm ơn)

Monday 12 July 2010

Sử dụng kỹ thuật Cloaking, Adwords bị Google Search phạt

Trong số những tin nổi bật tuần rồi thì mình đặc biệt lưu ý trường hợp Google Adwords Help bị người anh em Google Search “cho đi bụi” (banned – cho ra khỏi kho dữ liệu/index).

Theo đó vào sáng ngày 1/7/2010 khi người dùng gõ “Adwords Help” hay “Google Adwords Help” đều không thấy trang Adwords Help Center. Tương tự với chính URL của trang này. Search Engine Land đã kịp chụp lại những hình ảnh này.

Google AdWords Help Banner

Ảnh: Search Engine Land.

Trước đó 1 ngày, blogger Ba Lan Bartek Krzemień là người đầu tiên chia sẻ về việc snippet (đoạn mô tả trang web trên kết quả tìm kiếm) của Google Adwords “có vấn đề”, đặc biệt là từ “hidden”.

Google AdWords Help Cloaking
Ảnh: Search Engine Land

Sau đó Search Engine Land điều tra kỹ thì thấy Google Adwords Help đang sử dụng kỹ thuật Cloaking*, nên nội dung bản cache khác với bản mà người dùng nhìn thấy khi vào trang. Đây là một thủ thuật mà Google Search liệt vào “blackhat” và vì vậy, Google Adwords Help đã vi phạm điều lệ của người anh em.

Một phát ngôn viên từ Google cũng khẳng định chuyện này là có thật và cho rằng Google Adwords Help đã “vô tình” mắc lỗi, và đã nhanh chóng sửa lỗi.

Thực ra năm 2005 Google Support cũng từng vô tình dùng kỹ thuật Cloaking nhưng gần như sửa lỗi ngay tức thì.

Ngoài ra vài tháng trước, Google Webmaster Central cũng đã từng chia sẻ một báo cáo về việc đội ngũ Google Products làm SEO tệ như thế nào. Điều này cho thấy nhận thức về SEO (Search Engine Optimization) của các đội ngũ/sản phảm khác của Google là rất hạn chế.

*Cloaking: kỹ thuật blackhat SEO để làm cho nội dung người dùng nhìn thấy khác với nội dung mà Google lưu. Xem thêm về kỹ thuật Cloaking tại blog của anh Hà Tuấn, VinaLink.

Du NguyễnLàm SEO

(Vui lòng ghi rõ nguồn LamSEO.com khi đăng lại bài viết. Trân trọng cảm ơn.)