Nette\String sanitize

Upozornění: Tohle vlákno je hodně staré a informace nemusí být platné pro současné Nette.
timbulko
Člen | 85
+
0
-

Zdravím,
nebolo by vhodné vyčleniť časť funkcie webalize a vytvoriť z nej funkciu sanitize, ktorá by iba odstraňovala diakritiku a nenahradzovala medzery pomlčkami? Už viac krát som podobnú funkciu v aplikácií potreboval, no príde mi zbytočné na to vytvárať vlastný Helper, keďže táto funkcia už v podstate existuje v triede String, len je začlenená do funkcie webalize.

Vďaka.

timbulko
Člen | 85
+
0
-

Čo myslíte?

jasir
Člen | 746
+
0
-

No mě to přijde jako dobrý nápad… Sám mám takovou funkci ve svých helperech, takže užitečné to je. Třeba když sem postneš novou implementaci webalize() a sanitize(), David to pak spíš zapracuje.

Snad jen ten název, nevím jestli ‚sanitize‘ je typické pojménování odstranění diakritiky, ale pokud ne, navrhoval bych něco přímočařejšího, jako convertSpecialChars() nebo něco takového…

BTW: Feature requests by asi mělo být vé fóru pod Vývoj Frameworku

Editoval jasir (29. 6. 2009 11:52)

timbulko
Člen | 85
+
0
-

Myslím, že najlepšie by to bolo rozdeliť takto:

<?php
	public static function sanitize($s, $charlist = NULL)
	{
		$s = strtr($s, '`\'"^~', '     ');
		if (ICONV_IMPL === 'glibc') {
			$s = @iconv('UTF-8', 'WINDOWS-1250//TRANSLIT', $s); // intentionally @
			$s = strtr($s, "\xa5\xa3\xbc\x8c\xa7\x8a\xaa\x8d\x8f\x8e\xaf\xb9\xb3\xbe\x9c\x9a\xba\x9d\x9f\x9e\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2"
				."\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf8\xf9\xfa\xfb\xfc\xfd\xfe",
				"ALLSSSSTZZZallssstzzzRAAAALCCCEEEEIIDDNNOOOOxRUUUUYTsraaaalccceeeeiiddnnooooruuuuyt");
		} else {
			$s = @iconv('UTF-8', 'ASCII//TRANSLIT', $s); // intentionally @
		}
		$s = str_replace(array('`', "'", '"', '^', '~'), '', $s);
		$s = preg_replace('#[^a-z0-9' . preg_quote($charlist, '#') . ']+#', ' ', $s);
		$s = trim($s);
		return $s;
	}



	/**
	 * Converts to web safe characters [a-z0-9-] text.
	 * @param  string  UTF-8 encoding
	 * @param  string  ASCII
	 * @return string
	 */
	public static function webalize($s, $charlist = NULL)
	{
		$s = self::sanitize($s, $charlist);
		$s = strtr($s, ' ', '-');
		$s = strtolower($s);
		return $s;
	}
?>

Editoval timbulko (4. 7. 2009 21:30)

Honza Marek
Člen | 1664
+
0
-

A co ten $charlist?

timbulko
Člen | 85
+
0
-

Honza M. napsal(a):

A co ten $charlist?

Aha, to som si nevšimol. Opravené.

David Grudl
Nette Core | 8144
+
0
-

A co webalize($s, ' ') ?

PetrP
Člen | 587
+
0
-

Nemyslím si že je takováto funkce tolika potřeba, ale možná by se webalize mohlo rozšířit o nějaké nastavení. Protože to jejich sanitize jeste neděla strtolower, ale webalize($s, ' ') ano.

timbulko
Člen | 85
+
0
-

Toto len nebude nahrádzať medzery, ale pomlčky to tam bude dávať stále. Ale požadované správanie je, aby namiesto pomlčiek medzi slovami dávalo medzery. Teda aby z „áäćč ďéě ťžô“ spravilo „aacc dee tzo“ a nie „aacc-dee-tzo“.

kravčo
Člen | 721
+
0
-

timbulko napsal(a):

Toto len nebude nahrádzať medzery, ale pomlčky to tam bude dávať stále. Ale požadované správanie je, aby namiesto pomlčiek medzi slovami dávalo medzery. Teda aby z „áäćč ďéě ťžô“ spravilo „aacc dee tzo“ a nie „aacc-dee-tzo“.

U mňa webalize('áäćč ďéě ťžô', ' ') vráti 'aacc dee tzo'

Problémy nastanú ak nebude text tak „jednoduchý“… webalize('John "Johnie" Walker', ' ') vráti trochu nepríjemné 'john -johnie- walker'. V tomto prípade by možno stálo za zváženie dať voliteľný i zástupný znak (štandardne spojovník) ako ďalší parameter.

Ondřej Brejla
Člen | 746
+
0
-

A možná přepínátko na zapnutí resp. vypnutí lowercasování?

David Grudl
Nette Core | 8144
+
0
-

Vypínaš lowercasování jsem přidal.

Ondřej Brejla
Člen | 746
+
0
-

Super, díky :)