Pády serveru (na rychlosti disku) po nasazení Nette apliakce

ondrapech
Člen | 49
+
0
-

Ahoj,
dnes jsme plně nasadili naší apliakci na produkční server a začalo ji používat více než 5 lidí a bohužel taky začal padat server na Amazonu, kde nám běží Plesk a pod ním všechny webový apky. Evidentně spadne úplně všechno protože se nejde dostat ani do Plesku (nastavení webového serveru), do databáze na FTP, .. ale Amazon píše, že ten server jede, jen prostě stránky timeoutují a adresa se nenačte.
Moje otýzka zní, co s tím? Čím by to mohlo být v nette aplikaci způsobeno? Může to být třeba tím, že si Nette cashuje moc dat?

Moc děkuju za rady.

chemix
Nette Core | 1296
+
0
-

@ondrapech muzes se vic rozepsat o architekture aplikce? Co aplikace dela? Kdyz do te vasi platformy date jen sandbox tak “zatez” zvladne?

Nepocitam ze tam mate zatez 100 000 uzivatelu najednou? To uz pak app stavis jinak.

Jak to ctu tak mate v amazonu vps a na nem plesk a na nem nejake weby?

Jake databaze pouzivate? Jakou cache pouzivate? Jake verze php a nette?

Kamil Valenta
Člen | 758
+
0
-

A co říkají logy?

Editoval kamil_v (3. 6. 2019 18:32)

ondrapech
Člen | 49
+
0
-

chemix napsal(a):

@ondrapech muzes se vic rozepsat o architekture aplikce? Co aplikace dela? Kdyz do te vasi platformy date jen sandbox tak “zatez” zvladne?

Nepocitam ze tam mate zatez 100 000 uzivatelu najednou? To uz pak app stavis jinak.

Jak to ctu tak mate v amazonu vps a na nem plesk a na nem nejake weby?

Jake databaze pouzivate? Jakou cache pouzivate? Jake verze php a nette?

Tu app dneska používalo tak 30 uživatelů za celý den. Je to celkem rozsáhlý systém s několika moduly ale v podstatě na začátku vývoje takže ještě nijak extrémě složitý. Před tím už jsem ho tam měli na testování pro pár uživatelů a vše bylo ok, takže to podle mě není zase takový nárůst, který yb server neměl zvládnout. Kromě toho tam máme ještě nějaké drobnější appky v Nette, který taky jedou v pohodě.

PHP 7.2.18
DB MySQl v5.5.60
Nette 2.4
Cashe se ukládají klasicky do souboru.

Apliakce především řeší objednávky zákazníků a proces kolem nich, je vícejazyčná, používá role a řízení přístupu pdole presenteru, posílá emaily a pak propisuje data do CRM ale o komuniakce se CRM se stará primárně jiný script. Jinak nic speciálního, …

V logu Plesku nebylo nic zvláštního, samotná apka zalogovalal akorát nějaké AJAXy které ztratily přístup k DB nebo timeoutovaly protože už to spadlo jinak žádná běhová chyba. Amazon psal že server na kterém je plesk jede akorát že tam je 2× větší zátěž než obvykle. Ale kdyby to to bylo něco ve scriptu tak by byl server přetíženej, to nebyl nebo aspoň notifikace nedošla.

Editoval ondrapech (3. 6. 2019 21:41)

Kamil Valenta
Člen | 758
+
0
-

Co přesně je myšleno tím, že je tam 2× větší zátěž než obvykle, je tam vysoký load? Pak by stálo za to vysledovat, proč je vysoký. Nestíhají jádra? Je jich málo? Nebo to vázne na IO a jádra se flákají?

Co je zač skript, který se stará o komunikaci s CRM? Nezůstávají tam otevřené konexe na Apache? Takové věci mohou spolehlivě po nějakém čase shodit daemona a chová se to přesně, jak popisuješ.

Když v neonu zakážeš cachování (nastavíš storage na DevNull), nastane změna?