webalize pre azbuku a ine kodovania

Upozornění: Tohle vlákno je hodně staré a informace nemusí být platné pro současné Nette.
japlavaren
Člen | 404
+
+1
-

Zdravim,

riesim jeden web kde chcu mat rustinu, a zistil som, ze funkcia webalize ignoruje azbuky a podobne – ak mam unikatne url je to dost problem. ma niekto napad ako to riesit?? programovo si to viem napisat, ale ko sa zachovat. dat azbuku na low case a normalne ju hodit do url alebo nejaky iny napad??

22
Člen | 1478
+
0
-

já bych řekl, že ruština a URL nejde moc dohromady.. :-)

edit: asi jde http://президент.рф/

Editoval 22 (26. 9. 2011 13:10)

David Grudl
Nette Core | 8228
+
0
-

Tohle bohužel záleží na konkrétní implementaci iconv. Pokud to nefunguje, zkus si vytvořit transliterační tabulku a převést znaky pomocí strtr.

frosty22
Člen | 373
+
+3
-

Kdyby ještě někdo někdy potřeboval, tak nyní jsem řešil jeden portál, který již je v cca 20 jazycích, a též jsem potřeboval webalize na jiné abecedy, tudíž zde jsou:

BTW: Napsal jsem tady od boku onu classu, v praxi to mám řešené trošku jinak, podstatné jsou však ony transliterační tabulky

<?php
class Convert extends Strings {

	/**
	 * Converts to ASCII.
	 * @param  string  UTF-8 encoding
	 * @param  string  lang 5-letter code
	 * @return string  ASCII
	 */
	public static function webalize($s, $lang)
	{
 		    switch ($lang) {
			case "ru_RU":
			case "uk_UA":
			case "be_BY": $s = self::cyrillicToLation($s); break;
			case "hy_AM": $s = self::armenianToLation($s); break;
		    }
       		    return parent::webalize($s);
        }


	/**
	 * Cyrillic to latin
	 * @param string $s
	 * @return string
	 */
	public static function cyrillicToLation($s) {
	    return strtr($s, array(
		'а' => 'a', 'і' => 'i', 'б' => 'b', 'в' => 'v', 'г' => 'g', 'д' => 'd', 'е' => 'e', 'ё' => 'jo', 'ж' => 'zh', 'з' => 'z', 'и' => 'i', 'й' => 'jj', 'к' => 'k', 'л' => 'l', 'м' => 'm', 'н' => 'n', 'о' => 'o', 'п' => 'p', 'р' => 'r', 'с' => 's', 'т' => 't', 'у' => 'u', 'ф' => 'f', 'х' => 'kh', 'ц' => 'c', 'ч' => 'ch', 'ш' => 'sh', 'щ' => 'shh', 'ъ' => '', 'ы' => 'y', 'ь' => '', 'э' => 'eh', 'ю' => 'ju', 'я' => 'ja',
		'А' => 'A', 'Б' => 'B', 'В' => 'V', 'Г' => 'G', 'Д' => 'D', 'Е' => 'E', 'Ё' => 'JO', 'Ж' => 'ZH', 'З' => 'Z', 'И' => 'I', 'Й' => 'JJ', 'К' => 'K', 'Л' => 'L', 'М' => 'M', 'Н' => 'N', 'О' => 'O', 'П' => 'P', 'Р' => 'R', 'С' => 'S', 'Т' => 'T', 'У' => 'U', 'Ф' => 'F', 'Х' => 'KH', 'Ц' => 'C', 'Ч' => 'CH', 'Ш' => 'SH', 'Щ' => 'SHH', 'Ъ' => '', 'Ы' => 'Y', 'Ь' => '', 'Э' => 'EH', 'Ю' => 'JU', 'Я' => 'JA',
		'ў' => 'u', 'у' => 'y'
	    ));
	}

	/**
	 * Covert armenian to latin
	 * @param string $s
	 * @return string
	 */
	public static function armenianToLation($s) {
	    return strtr(mb_strtolower($s), array(
		'ա' => 'a', 'բ' => 'b', 'գ' =>	'g', 'դ' => 'd', 'ե' => 'e', 'զ' => 'z', 'է' => 'e', 'ը' => 'e', 'թ' => 't', 'ժ' => 'z',
		'ի' => 'i', 'լ' => 'l', 'խ' => 'x', 'ծ' => 'c',	'կ' => 'k', 'հ' => 'h', 'ձ' => 'j', 'ղ' => 'g', 'ճ' => 'c', 'մ' => 'm',
		'յ' => 'y', 'ն' => 'n', 'շ' => 's', 'ո' => 'o', 'չ' => 'c', 'պ' => 'p', 'ջ' => 'j', 'ռ' => 'r', 'ս' => 's', 'վ' => 'v',
		'տ' => 't', 'ր' => 'r', 'ց' => 'c', 'ւ' => 'w', 'փ' => 'p', 'ք' => 'k', 'օ' => 'o', 'ֆ' => 'f', 'ու' => 'ow', 'և' => 'ew'
	    ));
	}


}
?>

Editoval frosty22 (9. 11. 2011 0:16)