Sabtu, 26 Februari 2011

Performance Analysis

Pada Bab 7 ini mengevaluasi kinerja Superstring dalam hal distribusi uraian di atas node wide dan lokal area . Untuk wide area, deskripsi distribusi diukur secara langsung, dengan menghitung jumlah deskripsi komponen disimpan oleh masing-masing resolver. Analisis wilayah lokal query routing protocol sehingga menjamin diskusi yang lebih rinci. Karena jumlah deskripsi di daerah-daerah relatif kecil, fakta bahwa deskripsi didistribusikan secara merata di atas set node kurang penting daripada cara yang di mana distribusi berkembang untuk mengurangi waktu query. Dengan kata lain, distribusi skema di daerah-luas dioptimalkan untuk berbagi penyimpanan dan perhitungan biaya yang adil mungkin, sedangkan skema distribusi di daerah-daerah menjadi dioptimalkan untuk mengurangi waktu query, khususnya untuk sumber daya populer.

Matematika model data distribusi lokal dan wide-area dirumuskan dan dibandingkan dengan hasil eksperimen. Model matematika memiliki beberapa tujuan:
1. Pertama, jika output yang dihasilkan oleh model matematika sesuai dengan hasil yang diperoleh dari percobaan, maka ini adalah validasi pelaksanaan benar, terutama dalam hal protokol wide-area, yang benar-benar deterministik. Besar perbedaan antara model matematika dan hasil eksperimen karena itu akan mengungkap masalah dengan protokol pelaksanaan yang mungkin telah terdeteksi dengan menggunakan pendekatan tes standar. Seperti validasi mengasumsikan bahwa kemungkinan pelaksanaan dan model yang sedang tidak benar dalam cara yang sama diabaikan.
2. Yang kedua Tujuan dari model matematika adalah untuk memungkinkan prediksi dan simulasi data distribusi di jaringan jauh lebih besar daripada yang dapat dicapai melalui eksperimen langsung. Tentu saja, tujuan kedua adalah didasarkan pada yang pertama. Artinya, model matematika pertama yang harus ditemukan untuk setuju dengan hasil eksperimen
pada jaringan yang lebih kecil. Akhirnya, model matematis dapat mengungkapkan menarik perilaku yang menunjukkan cara dimana protokol dapat ditingkatkan.

Ada beberapa alasan untuk Analisis mendalam latency query tidak disediakan: Pertama, latency query masih sangat bergantung pada panjang rute dari query dan ekspresi untuk rute panjang diberikan dalam desain Superstring (Lihat Bab 4). Selanjutnya, data latency mutlak tergantung pada jaringan kecepatan data, kecepatan pemrosesan dan jumlah memori pada setiap node. Untuk ini alasan, ekspresi panjang rute memberikan indikator terbaik latency query. Akhirnya, dan yang paling penting, tidak ada data terhadap yang membandingkan latency hasil (misalnya, keterlambatan INS / Benang tidak diketahui).

7.1 Wide-Area Data Distribution
Pada bagian ini, distribusi deskripsi di daerah-luas dianalisis secara kuantitatif. Pertama-tama, model teori distribusi data diperkenalkan. Kemudian hasil percobaan tersebut dibandingkan dengan model teoritis. Model teoritis dan percobaan menggunakan set yang sama 980 deskripsi sumber daya.
Ini deskripsi sumber daya yang dihasilkan dari serangkaian tujuh puluh berbeda jenis sumber daya, dengan empat belas deskripsi yang dihasilkan untuk setiap tipe sumber daya, sehingga bahwa akan ada sekitar seribu deskripsi sumber daya secara keseluruhan. INS / Benang digunakan sebagai patokan terhadap yang hasilnya dibandingkan.

7.1.1 A Theoretical Model of Data Distribution
Model Derivation
Dalam Superstring, satuan granularity adalah rantai tersebut. Untai adalah penggabungan yang
komponen atribut dari akar deskripsi untuk setiap internal atau daun node. Analisa sampel set 980 deskripsi sumber daya ditemukan di sana untuk menjadi rata-rata 19,4 helai per deskripsi, sehingga total 19.012 helai. Pada jaringan resolver lima puluh, diharapkan bahwa 19012/50 = 380,24 helai akan tersimpan pada masing-masing resolver. Namun, analisis menunjukkan bahwa hanya sekitar 16 persen dari helai yang unik dalam kumpulan data. Superstring tidak menyimpan duplikat helai. Ini toko untai identik sekali, dan kemudian terus pointer ke catatan nama
untuk setiap sumber daya yang mengandung rantai tersebut. Oleh karena itu, angka ini dapat diturunkan untuk 380,24 * 0,16 = 60,8384 helai. Model ini menunjukkan bahwa diharapkan bahwa rata-rata 61 helai akan disimpan di masing-masing resolver, nomor yang mewakili kurang
dari sepertiga dari satu persen dari semua untai, atau hanya dua persen ketika hanya helai dianggap unik. Analisis ini mengarah ke ekspresi sederhana yang dapat digunakan untuk menghitung diharapkan jumlah helai di sebuah resolver.


dimana D adalah jumlah deskripsi, P adalah jumlah rata-rata helai per deskripsi, U adalah bagian dari helai yang unik, dan R adalah jumlah resolver pada jaringan.