문제

나는 추적하는 것을 좋아합니다 delicious.com/popular RSS 피드. 그러나 최근에는 항목에 점점 더 많은 아시아 페이지가 있습니다. 나는 아시아 언어를 이해하지 못하기 때문에 어떻게 든 피드에서 필터링하고 시간을 절약하고 싶습니다.

나는 무언가를 사용하여 요리하려고 노력했습니다 야후 파이프, 그러나 그것을 작동시킬 수 없었습니다.

이 일을하는 방법이 있습니까?

도움이 되었습니까?

해결책

나는 운이 좋았다 http://pipes.yahoo.com/pipes/pipe.info?_id=yjh1arp_3hgapi23tpvyrq

파이프의 소스에는 모든 정보가 있지만 키 비트는 Regex와 함께 필터를 실행하는 것입니다. ^[A-Za-z 0-9 \.,\?'""!@#\$%\^&\*\(\)-_=\+;:<>\/\\\|\}\{\[\]~]+$`.

이렇게하면 제목에 표준 ASCII를 사용하는 공급이 필터링됩니다. 불행히도 이것은 "Résumé"와 같은 단어를 필터링한다는 것을 의미하지만, 알고있는 언어의 일반적인 비 영어 문자를 포함하도록 Regex를 조정하는 것은 매우 쉽습니다.

다른 팁

문자의 X% 이상이 이해할 수있는 언어의 스크립트에 할당 된 코드 블록에서 나오지 않는 제목을 건너 뛰고 싶을 것입니다. 예를 들어, 그리스어, 러시아어, 아랍어, 히브리어, 아르메니아, 중국어, 일본어, 한국어, 인디언 등을 읽을 수 없다면 문자의 10%가 U+0000에서 범위에 있지 않은 제목을 거부합니다. U+0233. 이것은 라틴 알파벳을 남깁니다. 10%와 같은 여백을 남기는 아이디어는 구두점 마크에 대한 것입니다. 또한 기술 기사는 기본 알파벳에없는 기호를 사용할 수 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top