블로그 게시물에 달린 댓글 수를 프로그래밍 방식으로 확인

StackOverflow https://stackoverflow.com/questions/47869

  •  09-06-2019
  •  | 
  •  

문제

특정 블로그 게시물의 댓글 수를 확인하는 가장 효율적인 방법은 무엇입니까?우리는 새로운 웹 앱에 대한 데이터를 저장하고 싶습니다.우리는 RSS 피드뿐만 아니라 고유 링크 UR1의 목록을 가지고 있습니다.

도움이 되었습니까?

해결책

내가 올바르게 이해했다면 블로그 게시물로 알려진 HTML 페이지의 댓글 수를 경험적으로 추정하기를 원하십니까?

특정 블로그에는 작업을 쉽게 해주는 몇 가지 기능이 있는 경우가 많습니다.당신이 내 것을 보면 http://kstruct.com/ 댓글이 있는 모든 페이지에 'X Responses'라고 표시되어 있으므로 블로그별로 작업을 수행할 수 있다면 별로 어렵지 않을 것입니다.

일반적인 내용이 필요하다면 댓글에서 감지할 수 있는 몇 가지 공통 기능이 있을 것 같습니다.우선, 그 안에 있는 모든 링크에는 rel="nofollow" 속성이 있을 가능성이 높으므로 블록 내에서 이를 보면 해당 링크가 주석임을 암시할 수 있습니다.

찾아야 할 가장 흥미로운 점은 동일한 사이트의 게시물 구조가 변경되었다는 것입니다.예를 들어, 각 댓글에는 사람들이 직접 링크할 수 있는 자체 앵커가 있을 가능성이 매우 높으므로 동일한 페이지에서 특정 페이지에 있는 <a name="XXX"> 태그의 다른 수를 볼 수 있습니다. 상대적인 댓글 수에 대한 아이디어를 얻을 수 있는 사이트입니다.

Michael Stum이 지적했듯이 페이지에 Comment-RSS 피드가 있으면 구조화된 형식으로 댓글 데이터를 얻을 수 있기 때문에 생활이 훨씬 쉬워집니다.

하지만 전체적으로 보면 일반적으로 해결하기에는 상당히 어려운 문제가 될 것이라고 생각합니다.

다른 팁

블로그를 귀하가 관리하는 경우 "postID = 2인 댓글에서 개수(commentid) 선택"이 가장 좋습니다.URL만 있지만 여전히 블로그/DB인 경우 "WHERE postID = (SELECT 무엇이든 FROM 게시물 WHERE permalink = url)" 하위 쿼리를 생성하거나 URL에서 게시물에 대한 댓글을 결합하는 방법을 만들어야 합니다.

원격 블로그라면 블로그마다 HTML이 다른 문제가 있습니다.기본적으로 HTML을 구문 분석하고 "div class=comment"와 같은 반복 요소를 찾는 파서를 구축해야 합니다.하지만 이는 대부분 서로 다른 블로그에 대한 수작업이 될 것입니다.

일부 블로그에는 HTML이나 인터페이스 어딘가에 댓글 수를 계산하는 것과 같은 더 나은 방법이 있을 수 있지만 표준화된 방법은 없습니다.

편집하다:Comment-RSS 피드를 받은 경우 5월 XPath와 같이 XML 노드를 계산하는 메커니즘을 사용하면 행운이 따릅니다. 세다.

블로그에는 거의 항상 댓글을 위한 RSS 피드가 있습니다.그것이 있다면 피드가 99%의 시간 동안 표준을 따르기 때문에 정확한 댓글 수를 확인할 수 있습니다.블로그가 자신의 블로그라도 이미 RSS 피드를 생성하고 있다면 굳이 DB를 호출하지 마세요.피드를 생성하기 위해 이미 해당 작업을 수행했으므로 XML 노드만 순회하는 것이 합리적입니다.이렇게 하면 추가 오버헤드가 없습니다(이 정보를 얼마나 자주 얻으려는지에 따라 다름).

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top