normalize neodstraní bílé znaky \xc2 \xa0
Upozornění: Tohle vlákno je hodně staré a informace nemusí být platné pro současné Nette.
- knyttl
- Člen | 196
Parsuju teď složitější texty a řešil jsem, proč mi na konci řádku zůstávají bílé znaky. Nakonec jsem tam našel \xc2 a \xa0. Normalize je samo o sobě neodstraní – nevím, jestli je to chyba, nebo prostě to už jsou znaky, které už ani nejsou „bílé“…
Taky by asi bylo fajn, kdyby normalize umělo odstranit bílé znaky i na začátku řádků – např. něco jako String::normalize($string, self::BOTH_SIDES).
- David Grudl
- Nette Core | 8228
Ono je to tím, že normalize() lze použít i na jiném kódování než UTF-8. Ale myslím, že kdybych ji omezil čistě na UTF-8 a naučil ořezávat nedělitelné mezery, k žádnému BC breaku by nedošlo.