Question

Le problème est vraiment spécifique.

J'ai besoin d'une bibliothèque java qui peut prendre le contenu HTML et de générer du texte dans le même format qui est généré par le programme de lynx Linux.


Je dois exposer les données fournies par les serveurs 3ème partie pour les utilisateurs finaux sur Android. Format des données est ancienne, en HTML mal formaté, tellement que je l'ai essayé de le lire en utilisant java et il échoue parfois (inacceptable). Il est également en croissance chaque mois (préinstallation Exclue) et je ne peux pas les convaincre de changer de choses « moderne » (la vie serait génial en XML, etc.).

Shortest la route: j'ai écrit une classe pour utiliser le W3 service html2txt en ligne (recherche google il). Il a bien fonctionné sur l'application jusqu'à ce que je me suis plaint et a remarqué que le service W3 échoue de temps en temps. Ce n'est pas un gros problème, mais la logique de boîte noire attend que la sortie soit dans ce « lynx comme » format texte.

Je voudrais une bibliothèque pour effectuer la conversion (HTML-> TXT) dans « style lynx » à l'intérieur de l'application et éviter les pannes du service W3. Et d'ailleurs, la sortie de lynx probablement le meilleur que je l'ai vu, le plus organisé et bien rangé.

Êtes-vous les gars au courant de tout?

Était-ce utile?

La solution 2

Après un an, je renonce. La réponse est:.. aucun moyen de gérer cela, pas de bibliothèque en Java Au moins pour l'instant

Je ferme ce. Je vous remercie de votre attention.

Autres conseils

ne sais pas ce que vous entendez par le style de lynx, donc je pourrais être complètement en soumettant ce (si s'il vous plaît excusez-moi).

J'utilisé une pièce d'un code en arrière pour vérifier HTML / fichiers XML (à l'époque, je ne faisais que priting dehors dans les journaux

InputStream in = context.getResources () openRawResource (id). StringBuffer inLine = new StringBuffer (); InputStreamReader isr = new InputStreamReader (in); BufferedReader INRd = new BufferedReader (isr);

Texte de chaîne; while ((text = inRd.readLine ())! = null) {     inLine.append (texte);     inLine.append ( "\ n"); } joindre(); retour inLine.toString ();

J'espère que cela aide, mais je suis le sentiment que vous avez besoin quelque chose de plus complexe: P

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top