Tipy
Dalsi
Seznam
Predchozi
Autor: CePal (#@#%#^%&%*) on 'Tipy'
Cas: Pa 10.7.2015 12:54.28
Titulek: komprese po stopadesate

                                                                                 
Pri pomahani dost tragicky neschopnym testerum, aby gigabajtama dumpovani 
odpadu na konzoli terminalu nezasirali filesystem logujici jejich aktivity, 
jsem narazil na nasledujici clanek analyzujici kompresi specificky log fajlu. 
Neni to vedecka analyza, netestuje ruzne typy log fajlu (java, apache, 
syslog...), ale i tak me to dost zaujalo - od ted na textova/log data uz 
nepouzuju nic ostrejsiho nez "xz -3", bo to jaksi postrada smysl, pokud 
cloveku nejde doslova o kazdej usetrenej bit:
 
http://stefanseidel.info/Log_file_compression
 
Je to teda z roku 2012 - nevim, jestli se od te doby vyvoj lzma2 nekam vyrazne 
treba neposunul... 
 
Predpokladam, ze bin-tree namisto hashovani je ucinnejsi pro jine typy dat, 
ale na logy je bin-tree strasne pomalej a dokonce snad s horsi vyslednou 
kompresi nez hash-tab... To bylo asi to zasadni a klicove pro me...
 
Ale asi bych trochu nesouhlasil s jeho metrikou v tom poslednim grafu - misto 
mocneni/odmocnovani bych asi (kdyz-uz-tak) logaritmoval cas a kompresi 
neumocnoval, ale nejakou "realistickou" metriku uz urcite nekdo nekde 
vymyslel... 
 
CePal
CePal

Dalsi Seznam Predchozi


[ Domu | Prstik | O Piskovisti | Deticky | Nastenky | Koutky ]