Projekt

Allgemein

Profil

« Zurück | Weiter » 

Revision f85be296

Von Moritz Bunkus vor etwa 3 Jahren hinzugefügt

  • ID f85be296b9862788320bc90ae34eb2c8c0db4b9e
  • Vorgänger 0d12df6d
  • Nachfolger e362ec12

SL::HTML::Strip: immer Leerzeichen zwischen Textenteilen lassen

Unterschiede anzeigen:

SL/HTML/Util.pm
27 27
  if (!%stripper) {
28 28
    %stripper = ( parser => HTML::Parser->new );
29 29

  
30
    $stripper{parser}->handler(text => sub { $stripper{text} .= $_[1]; });
30
    $stripper{parser}->handler(text => sub { $stripper{text} .= ' ' . $_[1]; });
31 31
  }
32 32

  
33 33
  $stripper{text} = '';
......
35 35
  $stripper{parser}->eof;
36 36

  
37 37
  $stripper{text} =~ s{\&([^;]+);}{ $entities{$1} || "\&$1;" }eg;
38
  $stripper{text} =~ s{^ +| +$}{}g;
39
  $stripper{text} =~ s{ {2,}}{ }g;
38 40

  
39 41
  return delete $stripper{text};
40 42
}

Auch abrufbar als: Unified diff