この社説や論説アグリゲータープロジェクトのための最良のはどの言語ですか?
-
12-09-2019 - |
質問
私は私がフォローしたい英語の新聞の束のeditoralと論説ページのアグリゲータを探しています。目的は私が午前中にそれらをオフに印刷することができるように、国際的フォローしたいダース新聞からの社説作品の単なる集合体であるHTMLを生成することです。これは非常に狭い条件であるので、私は自分自身に1を書くことを考えていますので、私はすでに利用可能な何かを見つけることができませんでした。
さて、私は私の以前の生活の中で〜8年のプログラマであるために使用される(そして今、私のMBAの後、ウォールストリートである「ダークサイド」に振り回されてきました)。私は、このための最良の言語はパフォーマンスが重要な問題ではない(だろうが不明だスクリプト言語の良い選択をするプログラミングについての十分な今日精通していないよ、HTML、テキスト処理を解析するだけでなく、オフデータを取得するためのライブラリライブWebページ)がより重要である。
PS:私は、Win32環境でほぼ独占的に(以前私は、x86のASM、CおよびVisual C ++ / MFCで十分に働いていた)新しい言語を学ぶ気にしない。
解決
を使用するPythonと優れた lxmlののライブラリ。それは巨大な利便性である、CSSセレクタをサポートし、それはかなり速いです。それはあまりにも壊れたHTMLを処理します。
他のヒント
は、言語コード生成とうまくやって解釈し、あなたは、PerlやRuby
について考える必要があります所属していません StackOverflow