이 편집자 및 OP-ED Aggregator 프로젝트에 가장 적합한 언어는 무엇입니까?

StackOverflow https://stackoverflow.com/questions/1261667

  •  12-09-2019
  •  | 
  •  

문제

나는 내가 따르고 싶은 많은 영어 신문의 편집자 및 op-ed 페이지를위한 애그리 게이터를 찾고 있습니다. 목표는 국제적으로 따르고 싶은 12 개의 신문에서 편집 작품 모음 인 HTML을 생성하는 것입니다. 그래서 아침에 인쇄 할 수 있습니다. 이것은 매우 좁은 요구 사항이므로 이미 사용할 수있는 것을 찾을 수 없었기 때문에 스스로 글을 쓰려고 생각합니다.

이제 저는 이전의 삶에서 ~ 8 년 동안 프로그래머였습니다 (이제 MBA 이후 월스트리트 인 "어두운면"으로 흔들렸습니다). 나는 스크립팅 언어를 잘 선택할 수 있도록 프로그래밍에 대해 오늘 충분히 잘 알고 있지 않으므로 어떤 언어가 가장 적합한 언어가 될지 확신 할 수 없습니다 (성능은 핵심 문제, HTML을 구문 분석하는 라이브러리, 텍스트 처리 및 데이터를 끄는 것입니다. 라이브 웹 페이지가 더 중요합니다).

추신 : 나는 새로운 언어를 배우지 않습니다 (이전에는 x86 ASM, C 및 Visual C ++/MFC에서 광범위하게 일했습니다).

도움이 되었습니까?

해결책

파이썬과 우수한 것을 사용하십시오 LXML HTML 스크래핑 라이브러리. CSS 선택기를 지원하는데, 이는 큰 편의성이며 다소 빠릅니다. 깨진 HTML도 잘 처리합니다.

다른 팁

해석 된 언어는 코드 생성과 잘 어울리므로 Perl 또는 Ruby에 대해 생각해야합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top