Giữ cấu trúc URL đơn giản

Giữ cấu trúc URL đơn giản

Cấu trúc URL của trang web nên càng đơn giản càng tốt. Xem xét tổ chức nội dung của bạn để các URL được xây dựng một cách logic và theo cách thức dễ hiểu nhất đối với con người (khi có thể, các từ có thể đọc được thay vì các số ID dài).

Ví dụ: nếu bạn đang tìm kiếm thông tin về hàng không, một URL như : http://en.wikipedia.org/wiki/Aviation sẽ giúp bạn quyết định xem nên nhấp vào liên kết đó hay không. Một URL như http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, ít hấp dẫn hơn đối với người dùng.

Xem xét sử dụng dấu chấm câu trong URL của bạn. URL http://www.example.com/green-dress.html hữu ích hơn nhiều so với http://www.example.com/greendress.html. Chúng tôi khuyên bạn nên sử dụng dấu gạch nối (-) thay vì dấu gạch dưới (_) trong URL của bạn.

URL quá phức tạp, đặc biệt là các URL chứa nhiều tham số, có thể gây ra sự cố cho trình thu thập thông tin bằng cách tạo ra số lượng URL không cần thiết trỏ đến nội dung giống hệt nhau hoặc tương tự trên trang web của bạn. Do đó, Googlebot có thể tiêu tốn nhiều băng thông hơn mức cần thiết hoặc có thể không thể lập chỉ mục hoàn toàn tất cả nội dung trên trang web của bạn.

Nguyên nhân thường gặp của vấn đề này
Số lượng URL không cần thiết có thể do một số vấn đề gây ra. Bao gồm các:

lọc phụ của một số mặt hàng Nhiều trang web cung cấp quan điểm khác nhau của cùng một tập hợp mục hoặc kết quả tìm kiếm, thường cho phép người dùng lọc nhóm này sử dụng các tiêu chí được xác định (ví dụ: chỉ cho tôi khách sạn trên bãi biển). Khi các bộ lọc có thể được kết hợp theo cách phụ gia (ví dụ: khách sạn trên bãi biển và trung tâm thể dục), số lượng URL (lượt xem dữ liệu) trong các trang web sẽ bùng nổ. Tạo một số lượng lớn các danh sách khách sạn hơi khác một chút, bởi vì Googlebot chỉ cần xem một số ít các danh sách mà nó có thể truy cập vào trang cho mỗi khách sạn.

Ví dụ:
Khách sạn tại "mức giá trị":
Http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
Tài sản của khách sạn ở "mức giá trị" trên bãi biển:
Http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
Khách sạn tại "mức giá trị" trên bãi biển và có trung tâm thể dục:
Http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
Tạo ra các tài liệu động. Điều này có thể dẫn đến những thay đổi nhỏ do quầy, dấu thời gian hoặc quảng cáo.
Các tham số có vấn đề trong URL. Ví dụ, ID phiên có thể tạo ra số lượng lớn số lượng trùng lặp và số lượng URL lớn hơn.
Sắp xếp các tham số. Một số trang web mua sắm lớn cung cấp nhiều cách để sắp xếp cùng một mục, dẫn đến một số lượng URL lớn hơn nhiều. Ví dụ:
Http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance & Search_category = 25
Tham số không liên quan trong URL, chẳng hạn như tham số giới thiệu. Ví dụ:
http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage= OPD + Sản phẩm + Trang & cat = 79
Http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
Http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
Các vấn đề trong lịch. Lịch tự động tạo ra có thể tạo liên kết đến ngày trong tương lai và ngày trước đó mà không có hạn chế vào ngày bắt đầu kết thúc. Ví dụ:
Http://www.example.com/calendar.php?d=13&m=8&y=2011
Http://www.example.com/calendar/cgi?2008&month=jan
Liên kết tương đối bị hỏng. Liên kết tương đối bị hỏng có thể gây ra khoảng cách vô hạn. Thường xuyên, vấn đề này phát sinh vì các yếu tố đường dẫn lặp đi lặp lại. Ví dụ: Http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/ Category / health / 070223 / html / category / business / 070302 / html / category / community / 070413 / html / FAQ.htm


Các bước để giải quyết vấn đề này


Để tránh những vấn đề tiềm ẩn với cấu trúc URL, chúng tôi khuyên bạn nên làm như sau:

Xem xét việc sử dụng tệp robots.txt để chặn truy cập của Googlebot vào URL có vấn đề. Thông thường, bạn nên xem xét chặn URL động, chẳng hạn như URL tạo kết quả tìm kiếm hoặc URL có thể tạo không gian vô hạn, chẳng hạn như lịch. Sử dụng biểu thức chính quy trong tệp robots.txt của bạn có thể cho phép bạn dễ dàng chặn một số lượng lớn URL.
Bất cứ khi nào có thể, tránh sử dụng ID phiên trong các URL. Thay vào đó hãy sử dụng cookie. Kiểm tra Nguyên tắc Quản trị Trang web của chúng tôi để biết thêm thông tin.
Bất cứ khi nào có thể, hãy rút ngắn URL bằng cách tỉa các tham số không cần thiết.
Nếu trang web của bạn có lịch vô hạn, hãy thêm thuộc tính nofollow vào liên kết tới các trang lịch tương lai được tạo động.
Kiểm tra trang web của bạn cho liên kết tương đối bị hỏng