A method to compress Internet traffic packet traces, utilising similarities between packets within a connection, was developed. Along with compression, packet address fields can be anonymised while maintaining topology information and uniqueness of end hosts.
Internet traffic traces were collected over an 18 month period. This data has been analysed in order to identify basic properties of network traffic. Traffic properties of different application protocols were studied based on specifications and examples.
A flow, built up from a train of IP packets, can be defined by various criteria of which the most important are address granularity and packet interarrival time. Counts of flows were studied based on these criteria. It was found that some of application protocols were very sensive to the threshold selection.
User impatience may result in useless traffic being carried in the network. The most important factors for impatience turned out to be a transfer time exceeding 10 seconds and a low transfer rate. Available bandwidth between hosts was found variable even over short time scales. It was concluded that using test traffic probes does not guarantee quality of connection.
li.pdf (933K)
Työssä on kehitetty menetelmä Internetin liikennemittaustallenteiden tiivistämiseksi hyödyntämällä IP-verkkoliikentessä samaan yhteyteen kuuluvien pakettien keskinäistä samankaltaisuutta. Tiivistysmenetelmän yhteydessä voidaan toteuttaa myös osoitteiden anonymisointi kuitenkin säilyttäen verkkoliikenteen topologiainformaatio ja kohteiden yksikäsitteisyys.
Verkkoliikennettä kerättiin 18 kuukauden ajalta ja mittausaineistoa analysoitiin tarkoituksena havainnoida verkkoliikenteen perusominaisuuksia. Aluksi eri sovellusprotokollatyyppien liikenteellisiä ominaisuuksia analysoitiin määrittelyiden ja esimerkkien pohjalta.
Vuo, joka Internet-liikenteessä muodostuu pakettijonosta, voidaan määritellä eri kriteereillä, joista tärkeimmät ovat määrittelyn yksityiskohtaisuus ja pakettien välisten aikojen maksimipituus. Voiden määrää tutkittiin näiden kahden kriteerin perusteella, jolloin havaittiin eräiden sovellusprotokollien olevan hyvin herkkiä raja-arvojen valinnalle.
Käyttäjän kärsimättömyys voi aiheuttaa hukkaliikennettä verkkoon. Tärkeimmiksi HTTP-protokollan kärsimättömyystekijöiksi osoittautuivat 10 sekunnin siirtoajan ylittyminen ja alhainen siirtonopeus. Kaistanleveys päätelaitteiden välillä osoittautui hyvin vaihelevaksi lyhyeilläkin aika-asteikoilla, joten yhteyden varmentaminen testiliikenteellä ei aina takaa yhteyden laatua.