Pregunta

¿Existe una manera fácil de transformar HTML en rebajas con JAVA?

Actualmente estoy usando Java MarkdownJ Biblioteca para transformar Markdown a HTML.

import com.petebevin.markdown.MarkdownProcessor;
...
public static String getHTML(String markdown) {
    MarkdownProcessor markdown_processor = new MarkdownProcessor();
    return markdown_processor.markdown(markdown);
}

public static String getMarkdown(String html) {
/* TODO Ask stackoverflow */
}
¿Fue útil?

Solución

Utilizar esta XSLT.

Si necesita ayuda para usar XSLT y Java, aquí tiene un fragmento de código:

public static void main(String[] args) throws Exception {

        File xsltFile = new File("mardownXSLT.xslt");

        Source xmlSource = new StreamSource(new StringReader(theHTML));
        Source xsltSource = new StreamSource(xsltFile);

        TransformerFactory transFact =
                TransformerFactory.newInstance();
        Transformer trans = transFact.newTransformer(xsltSource);

        StringWriter result = new StringWriter();
        trans.transform(xmlSource, new StreamResult(result));
    }

Otros consejos

Encontré un comentario para convertir HTML en Markdown ver: http://remark.overzealous.com/manual/index.htmlDepende de JSoup, una potente biblioteca Java para trabajar con HTML del mundo real.

Estoy trabajando en el mismo tema y experimentando con un par de técnicas diferentes.

La respuesta anterior podría funcionar.Podrías usar el Biblioteca jTidy para realizar el trabajo de limpieza inicial y convertir de HTML a XHTML.tu usas el Hoja de estilo XSLT vinculado arriba.

Lamentablemente, no existe ninguna biblioteca que tenga una función única para hacer esto en Java.Podrías intentar usar el script Python. html2texto con Jython, ¡pero todavía no he probado esto!

Si está utilizando el editor WMD y desea obtener el código de rebajas en el lado del servidor, simplemente use estas opciones antes de cargar el wmd.js guion:

wmd_options = {
        // format sent to the server.  can also be "HTML"
        output: "Markdown",

        // line wrapping length for lists, blockquotes, etc.
        lineLength: 40,

        // toolbar buttons.  Undo and redo get appended automatically.
        buttons: "bold italic | link blockquote code image | ol ul heading hr",

        // option to automatically add WMD to the first textarea found.
        autostart: true
    };
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top