Estrarre il testo da pagina web visualizzata in un TWebBrowser
-
23-09-2019 - |
Domanda
Io uso Delphi 7 e vorrei estrarre solo il testo visualizzato in una pagina web direttamente da una pagina web visualizzata in un TWebBrowser (senza immagini ....). Potrebbe essere fatto e come posso farlo?
Soluzione
Ho usato il seguente ...
procedure TForm1.WebBrowser1DocumentComplete(Sender: TObject;
const pDisp: IDispatch; var URL: OleVariant);
var
Document: IHtmlDocument2;
begin
edit1.text:=url;
document := webbrowser1.document as IHtmlDocument2;
memo2.lines.add(trim(document.body.innerhtml)); // to get html
memo1.lines.add(trim(document.body.innertext)); // to get text
end;
Altri suggerimenti
Se la vostra voglia di caricare questo in un TRichEdit, allora vi suggerisco di guardare il WPTools componente che ha la capacità di caricare i dati da un flusso di HTML, e l'esportazione in formato RTF. Io uso questo componente per gestire il mio editor di posta elettronica interna (che appare è ciò che il vostro dopo).
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow