Minggu, 03 April 2011

Analisis Dari Web - BAB IV

Belajar sifat-sifat dari Web sebagai objek formal menyediakan cukup banyak pengaruh untuk desainer dari sistembaru, dan badan standar yang tugasnya adalah menemukan dan menjaga variasi dari pengalaman Web padaskala besar. Pada bagian ini kita akan meninjau secara singkat upaya untuk mendeskripsikan topologi web.



4.1 Topologi Web

4.1.1 Struktur Web

Investigasi topologi dilakukan untuk memahami bentuk dasar dari arsitektur dan relasi diantara keduanya. Struktur dapat memberi kita banyak informasi. Penyelidikan struktur dari web selalu tergantung dari level pemisahan dari pendeskripsian struktur web. Seperti contohnya saja ukuran web yang mungkin memiliki perbedaan sangat kecil dalam kinerja dari komponennya mampu memberikan perbedaan besar di level makro.

Pemahaman struktur sangat penting untuk sejumlah aplikasi, seperti navigasi, pencarian, menyediakan sumber daya untuk mendukung komunitas online, atau efek dari perubahan mendadak dalam permintaan informasi.

Topologi Web berisi kompleksitas dari rantai linear sederhana. Pada bagian ini, kita akan membahas upaya untukmengukur struktur global dari Web, dan bagaimana halaman web individu dapat masuk ke dalam konteks itu.

4.1.2 Penelitian teoritis graph

Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah teori grafik. Web dapat dilihat sebagaigrafik yang besar pada tengah halaman dan bagian tepinya adalah link. Karena weblinks sangat sedikitberantakan, jelas bahwa tepi grafik mengkodekan banyak struktur yang terlihat oleh desainer dan penulis konten yang bagi mereka adalah sama pentingnya.

Konektivitas webgraph telah dianalisis secara rinci, menggunakan struktural seperti indikator seperti bagaimananode yang terhubung. Berbagai makro struktur scopic telah dilihat dan diukur, misalnya satu merangkak dari lebihdari 200 juta halaman menemukan bahwa 90% dari Web sebenarnya tersambung. Struktur berikutnya seringdisebut sebagai bentuk bowtie, seperti yang ditunjukkan pada Gambar di bawah. Simpul dasi sangat berhubungancluster (SCC) dari webgraph di mana terdapat jalur antara setiap pasangan node. SCC ini diapit oleh dua setcluster, mereka yang dihubungkan (link) ke SCC tetapi dari yang tidak ada backlink (ditandai sebagai DI dalam gambar), dan mereka yang terkait dari SCC tetapi tidak link kembali (OUT). Hubungan antara SCC, IN dan OUTmemberikan bentuk bowtie. Implikasi dari penemuan ini masih topologi perlu dipahami. Meskipun beberapa telahmengusulkan perubahan terhadap algoritma PageRank untuk mengambil keuntungan dari topologi dasar, masih ada banyak pekerjaan yang harus dilakukan untuk mengeksploitasi struktur terlihat.

http://2.bp.blogspot.com/-f3IqlHG8ukA/TZVzoHLJBxI/AAAAAAAAAGo/OTSGZYdJ9lA/s320/a.bmp



Struktur bowtie lazim di berbagai skala. Dill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki bentuk bowtie, sebuah petunjuk bahwa Web mempunyai sifat fractal yang menarik karakteristiksebagai Web pada umumnya.

Memang, pertanyaan skala dipotong dua arah. Ada yang lain, lebih kecil dari Web sekitar, dan web itu sendiridatang sebagai sesuatu dari kejutan bagi matematikawan dan ilmuwan komputer pada saat itu dimulai, sekarangstudi Web cenderung melihat Web. Struktur tersebut sebagai Intranets mempunyai sifat yang sangat berbeda,dalam hal ukuran, konektivitas, koherensi dan pencarian sifat; beberapa sifat terbawa dari Internet secara keseluruhan, sementara yang lainnya tidak. Telah ada sedikit pekerjaan atas struktur kontras, meskipun melihat untuk investigasi Intranet, dan subgraphs sesuai dengan topik scientific tertentu . Web cukup jarang tersambung,berarti bahwa subgraph disebabkan oleh satu set acak node akan hampir kosong, tetapi jika kita mencarikelompok non-acak (cluster tematis-bersatu atau TUCs) yang jauh lebih dihubungkan, maka kita melihat bentukbowtie muncul lagi. Setiap TUC akan memiliki SCC sendiri, dan sendiri IN dan OUT sisi, termuat di dalam SCCyang lebih luas. SCC skala yang lebih besar, karena sangat berhubungan, kemudian dapat bertindak sebagaitulang punggung navigasi antara TUCs.

4.2 Matematik dalam Web

Opez L 'Ortiz, dalam surveinya, terlihat di sejumlah paradigma berguna untuk memahami dasar-dasar algoritmikInternet pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma masalah jaringan,dalam konteks protokol tertentu mendasari Web, berpotensi sangat bermanfaat. Pertumbuhan dari Web, sepertiOpez L Ortiz tunjukkan, adalah yang paling canggih dari teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalam aplikasi standar pada awal tahun 1995, namun berjuang keras pada akhirtahun itu.

4.2.1 Model rasional

Salah satu paradigma penting adalah bahwa dari ekonomi mikro, mathemat diskrit
ics,
teori pilihan rasional dan teori permainan. Meskipun pengguna individu mungkin atau mungkin tidak "rasional",itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitas. Dalam hal ini,pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkanperilaku, dan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasa, dan apa yangbisa system mendukung perilaku tersebut.

http://4.bp.blogspot.com/-GPs4gTBuVQo/TZV0QfL9ckI/AAAAAAAAAGs/vnzXVsywo1c/s320/b.bmp



Jika, seperti dalam Gambar di atas, kurva penawaran adalah elastis sempurna (misalnya horizontal), ada tigakesetimbangan: dua titik di mana suplai persilangan kurva kurva permintaan (pada jaringan ukuran B dan C), dan titik di mana kurva penawaran hits sumbu y (A = 0). Jika jaringan ukuran tetap pada 0, maka permintaan tetap nihil,dan kami tinggal di posisi A. Pada C, posisi ini juga stabil; jaringan berisi semua customers siap untuk membayartarif pasar, dan tidak bisa tumbuh karena ada tidak ada orang lain siap untuk membayar. Jika jaringan tumbuh, itu harus karena harga telah jatuh (yaitu kurva penawaran telah bergerak ke bawah; jika menyusut jaringan, yang harus karena seseorang telah mengubah preferensi dan sekarang tidak lagi siap untuk membayar harga pasar(yaitu kurva permintaan telah bergerak ke bawah). Jika kita berasumsi bahwa dua kurva tetap diam, maka setiap perubahan akan mengakibatkan slip kembali ke C. Kuncinya adalah B, yang meskipun suatu kesetimbangan tidak stabil. Jika ukuran jaringan tergelincir di bawah B, maka tidak cukup banyak orang akan siap untuk membayartingkat pasar dan permintaan secara bertahap akan tergelincir kembali ke nol. Jika di sisi lain bisa mendapatkandari B, maka tiba-tiba banyak lebih banyak konsumen akan muncul yang siap untuk membayar harga pasar ataulebih, dan ukuran jaringan akan meningkat secara dramatis, mendapatkan lebih dari punuk kurva permintaan danmencapai C. Jadi B adalah massa kritis untuk jaringan.

4.2.2 Model Pencarian Keterangan

Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjataantara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar danlebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu ataukompleksitas dari query).

Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuknugget akal; masalah khas adalah kompleksitas dan kurangnya pola. Benchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi ilmiah makalah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat digunakan, seperti Intranet, juga ditandaidengan itikad baik dengan informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan sangat IRsistem yang theWeb dukungan baik yang semakin umum. IR berbasis web harus menghadapi tidak hanya skaladan kompleksitas informasi, tetapi upaya potensi untuk condong hasilnya dengan konten dimaksudkan ntukmenyesatkan.

4.2.3 Struktur Berbasis Pencarian

Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untukmembuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, danmereka yang tidak, hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur linksubgraphs lokal. Juga tidak HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam lainmasukan dari struktur dinyatakan uninterpreted dari hyperlink ke dan dari halaman Web.

Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang sesering mungkin, konsistendengan menekan biaya, sebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubah. Search engine dapat dibandingkan dengan menggunakan berbagai parameter,baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai olehmesin pencari), relevansi dari halaman kembali; waktu diambil, atau kualitas kembali. Sebagai salah satuharapkan, mesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

4.2.4 Metode Matematika untuk Menggambarkan Struktur

Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalamanWeb dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting properti yangmemiliki Web adalah ketahanan dalam menghadapi pengaruh undermining; baik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router dalamempat puluh turun di setiap saat satu. ASI Barab dan kolega advokasi.

Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas karya agak lebih rentan terhadap terarah, seranganterkoordinasi, bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan bisa merusak jika merekamenargetkan situs yang sangat terhubung, kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan diameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acaklain), dan kegagalan dari sejumlah besar situs yang sangat-tersambung bisa menyebabkan fragmentasi.

4.2.5 Metode Matematika untuk Menggambarkan Layanan

Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Webakan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klienmenghubungi penyedia layanan, representasi matematika baru, formalisms dan teori menjadi berguna untuk menggambarkan hubungan ini.

Ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada hidup perdebatan tentang jala Petri danπ-kalkulus, berfokus pada manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual, linier, aljabarevent.