GoogleBot이 마케팅 URL을 색인하려고하는 경우 걱정해야합니까?

https://stackoverflow.com/questions/814554

03-07-2019
|

문제

Google이 인덱스를하려는 링크 수를 알게되어 놀랐습니다.

http://www.example.com/?c=123
http://www.example.com/?c=82
http://www.example.com/?c=234
http://www.example.com/?c=991

이들은 파트너 사이트의 링크로 존재하는 캠페인입니다.

지금 당장 사이트의 모든 페이지와 마찬가지로 사이트가 완료 될 때까지 로봇 파일에 의해 거부 당하고 있습니다.

이와 같은 링크를 다루는 가장 좋은 접근법은 Robots.txt 파일을 덜 제한적으로 만들기 전에 무엇이 가장 좋은지 궁금합니다.

나는 그것들이 다른 URL로 취급되고 Google의 검색 결과에 나타나기 시작하는 것이 걱정됩니다. 그것들은 모두 같은 페이지에 해당합니다 - 주거나 가져갑니다. 나는 사람들이 그대로 그들을 찾아서 클릭하는 것을 원하지 않습니다.

지금까지 최고의 아이디어는 다음과 같이 쿼리 문자열이 포함 된 페이지를 렌더링하는 것입니다.

 // DO NOT TRY THIS AT HOME. See edit below
 <% if (Request.QueryString != "") { %>

    <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

 <% } %>

이 작업을 수행해야합니까? 이것이 최선의 접근 방식입니까?

편집하다: 이것은 밝혀졌습니다 좋은 접근 방식이 아닙니다. Google은 NoIndex가없는 다른 페이지와 동일한 콘텐츠를 가진 페이지에서 NoIndex를보고 있음이 밝혀졌습니다. 분명히 그것은 그것들이 똑같은 것으로 보이고, noindex는 우선 순위를 따릅니다. 결과적으로 내 사이트는 Google에서 완전히 사라졌습니다. 경고 : 그것은 내가 동시에 한 일이었을 수도 있지만, 나는이 접근법을 위험에 빠뜨리지 않을 것입니다.

해결책

이것은 일종의 것입니다 rel="canonical" 설계되었습니다. Google은 그것에 대한 블로그 기사를 게시했습니다.

다른 팁

예, Google은 다른 URL로 해석합니다.

웹 서버에 따라 다시 작성 필터를 사용하여 검색 엔진의 매개 변수를 제거 할 수 있습니다. URL 재 작성 필터 Tomcat, Or 모드 재 작성 아파치를 위해.

개인적으로 추적 매개 변수가 제거 된 상태에서 같은 페이지로 리디렉션됩니다.

페이지가 자체 폴더에 존재하지 않는 한 최상의 접근 방식처럼 보입니다.이 경우 Robots.txt 파일을 수정하여 해당 폴더를 무시할 수 있습니다.

색인화되지 않아야하는 리소스의 경우 페이지로드에서 간단한 수익을 선호합니다.

if (IsBot(Request.UserAgent)
    return;

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow