이 편집자 및 OP-ED Aggregator 프로젝트에 가장 적합한 언어는 무엇입니까?
-
12-09-2019 - |
문제
나는 내가 따르고 싶은 많은 영어 신문의 편집자 및 op-ed 페이지를위한 애그리 게이터를 찾고 있습니다. 목표는 국제적으로 따르고 싶은 12 개의 신문에서 편집 작품 모음 인 HTML을 생성하는 것입니다. 그래서 아침에 인쇄 할 수 있습니다. 이것은 매우 좁은 요구 사항이므로 이미 사용할 수있는 것을 찾을 수 없었기 때문에 스스로 글을 쓰려고 생각합니다.
이제 저는 이전의 삶에서 ~ 8 년 동안 프로그래머였습니다 (이제 MBA 이후 월스트리트 인 "어두운면"으로 흔들렸습니다). 나는 스크립팅 언어를 잘 선택할 수 있도록 프로그래밍에 대해 오늘 충분히 잘 알고 있지 않으므로 어떤 언어가 가장 적합한 언어가 될지 확신 할 수 없습니다 (성능은 핵심 문제, HTML을 구문 분석하는 라이브러리, 텍스트 처리 및 데이터를 끄는 것입니다. 라이브 웹 페이지가 더 중요합니다).
추신 : 나는 새로운 언어를 배우지 않습니다 (이전에는 x86 ASM, C 및 Visual C ++/MFC에서 광범위하게 일했습니다).
해결책
파이썬과 우수한 것을 사용하십시오 LXML HTML 스크래핑 라이브러리. CSS 선택기를 지원하는데, 이는 큰 편의성이며 다소 빠릅니다. 깨진 HTML도 잘 처리합니다.
다른 팁
해석 된 언어는 코드 생성과 잘 어울리므로 Perl 또는 Ruby에 대해 생각해야합니다.
제휴하지 않습니다 StackOverflow