Engineering The Web
Referensi & Identitas
Semantic Web bergantung pada Konvensi penamaan dengan URI,
dan tentu saja setiap bagian dari sistem label Web bergantung pada beberapa
Konvensi atau lainnya. tetapi kurangnya sentralisasi memungkinkan skema different dan Konvensi, dan memang kecerobohan, untuk
flourish, yang pada gilirannya membuka kemungkinan kegagalan referensi yang
unik.
Referensi: Ketika Apakah dua objek yang sama?
Di sisi lain, URI menyediakan Web sumber daya untuk
menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat
diselesaikan bahwa dua istilah yang menunjuk ke URI sama. Jadi jika
"bintang pagi" dan "malam bintang" menunjuk langsung ke
maka setiap grounding lebih lanjut adalah super fluous.
Di sisi lain, perbedaan kedua URI mungkin merujuk kepada
objek yang sama bebas yang jelas, dan dapat melakukannya melalui hanya beberapa
operasi yang digunakan. Sebuah metode heuristic untuk menyelesaikan
bentrokan seperti itu, di dunia nyata, adalah untuk membuat penilaian cerdas
yang didasarkan pada informasi agunan, dan ini telah menirukan online oleh
perhitungan komunitas praktek nama, berdasarkan jaringan sekitarnya setiap
sengketa kejadian hubungan.
Kapan adalah dua halaman yang sama?
Mengambil masalah referensi alternatif adalah
menentukan ketika halaman web dua halaman yang sama. Dasar pembuatan
kesamaan penilaian tidak hanya perlu konten pada halaman, tapi bisa juga
menjadi struktur hyperlink di mana halaman tertanam. Informasi yang
mengharuskan pengguna tidak perlu datang dari satu halaman, tetapi sebaliknya
dapat dikumpulkan dari gugus dokumen di sekitar topik dasar, dan begitu
struktur hubungan yang ada dapat menjadi sangat penting. Dan cara yang lebih
lanjut pemahaman kesamaan antara pola penggunaan tertentu halaman dua halaman
sering Diakses pada titik-titik yang sama dalam sesi surfing Web.
Kesamaan konten berbasis dapat didekati oleh pencocokan
kata atau subsequences dari dua halaman. Teknik relatif sederhana dapat
digunakan untuk menentukan kemiripan antara dua halaman (rasio antara ukuran
persimpangan subsequences dan ukuran kesatuan mereka), dan penahanan satu
dengan yang lain (rasio antara persimpangan dan ukuran dari set lengkap).
Web teknik: arah baru
Pengembangan Web adalah campuran dari pengaturan standar,
aktivitas terstruktur, desentralisasi dan inovasi, dan disengaja
rekayasa. Sebagai contoh, PageRank memerlukan merangkak dan caching
significant bagian web; Keberhasilan Google tergantung pada mampu menjaga cache
tractable sementara juga dari ukuran significant.
Pelebaran cakupan pencarian untuk mencakup item seperti
multimedia, Layanan atau komponen ontologi, juga akan membutuhkan mengejar
program penelitian akademis, effective
antarmuka dan model bisnis yang masuk akal, dan mengembangkan pendekatan
untuk memanfaatkan Web harus diperpanjang ke lingkungan Web baru ketika mereka
diciptakan (seperti jaringan P2P, misalnya).
Layanan Web
Layanan web adalah didistribusikan potongan kode yang
ditulis untuk menyelesaikan tugas-tugas specific, yang dapat berkomunikasi
dengan layanan lainnya melalui pesan. Sejumlah metode menentukan proses
telah berkembang selama beberapa tahun terakhir dan diterapkan ke domain
layanan Web. Sebagai contoh, WS-Net adalah bahasa Deskripsi arsitektur
berdasarkan teori berwarna Petri jaring (yaitu perpanjangan dari teori bersih
Petri sederhana dengan dihargai.
Layanan yang diperlukan untuk fungsi dan operasi internal.
Hasil akhirnya adalah sebuah model yang meliputi global dan lokal aspek sistem.
Layanan memfasilitasi integrasi layanan Web untuk mencapai tujuan baru,
sementara juga menyediakan formalism untuk integrasi evaluasi.
Proses algebras juga telah diterapkan ke layanan. BPEL4WS
adalah versi panjang dari bisnis proses eksekusi bahasa BPEL, yang menjadi cara
yang semakin penting untuk interleave layanan Web dengan proses bisnis. BPEL
memiliki batas-batas, tetapi memungkinkan penciptaan komposit layanan dari
layanan yang ada. Tahap berikutnya adalah untuk menyesuaikan pendekatan ini
untuk lingkungan P2P, dan saat ini sedang dikembangkan untuk itu CDL, alias WS
CDL, alias koreografi (Web Layanan koreografi Deskripsi bahasa), sebuah bahasa
berbasis XML untuk defining komplementer dan umum perilaku diamati di P2P
kolaborasi. Tujuannya adalah bahwa dioperasikan P2P kolaborasi dapat disusun
menggunakan koreografi tanpa seperti specifics sebagai platform yang mendasari
yang sedang digunakan; Alih-alih fokus adalah tujuan umum kolaborator.
Sedangkan BPEL memungkinkan layanan-layanan existing untuk digabungkan bersama-sama,
koreografi bergeser fokus ke Deskripsi global kolaborasi, pertukaran informasi,
memesan tindakan dan sebagainya, untuk mencapai tujuan yang telah disepakati.
Didistribusikan pendekatan: merasuk komputasi,
P2P dan grid
Komputasi mana-mana, P2P dan komputasi grid berbagi banyak
masalah-masalah penelitian serius, terutama koordinasi perilaku dalam sistem
berskala besar yang didistribusikan. Komputasi mana-mana pemerintah kecil,
relatif rendah didukung perangkat komputasi tertanam dalam lingkungan
pervasively berinteraksi dengan orang-orang. Misalnya, pencarian layanan
di paradigma meresap harus mengambil tempat tanpa manusia dalam lingkaran.
Layanan harus dapat mengiklankan diri mereka sendiri untuk memfasilitasi
penemuan. Ini adalah salah satu contoh lingkungan komputasi yang sedang
berkembang yang cenderung tumbuh dalam pentingnya. Dalam konteks Web Science
dan mencari dan deskripsi invariants pengalaman Web, penting bahwa
asumsi-asumsi yang kita buat mengenai lingkungan, dan teknologi yang hidup di
dalamnya, diminimalkan jaringan P2P, ditandai dengan otonomi dari server pusat,
intermiten konektivitas dan oportunistik penggunaan sumber daya, yang lain
menarik lingkungan untuk generasi berikutnya Web.
Godaan untuk mengeksploitasi secara radikal namanya
decentralised lingkungan seperti jaringan P2P di generasi berikutnya dari Web
kuat; desentralisasi adalah aspek kunci dari Web yang sukses. Jadi, misalnya,
salah satu bisa membayangkan jaringan P2P yang digunakan untuk menemukan halaman
cache untuk backup kegagalan atau kesalahan yang menyebabkan hilang halaman
atau menggantung link. Sedangkan sistem P2P mengeksploitasi distribusi skala
besar untuk mencapai banyak berakhir kecil, komputasi grid adalah
sering pendekatan terdistribusi untuk skala besar masalah menggunakan besar
daya komputasi untuk menganalisis data dalam jumlah besar. Masalah-masalah
koordinasi seperti ini selalu memiliki menjulang besar dalam berbagai disiplin
ilmu, dan kita seharusnya tidak terkejut untuk studi mereka di pusat ilmu Web.
Personalisasi
Personalisasi penting untuk meningkatkan nilai jaringan ,
dan peningkatan konsumen kunci . Recommender sistem yang jelas penerapan
teknologi untuk mendapatkan effective
personalisasi, harus ada terpadu penggunaan informasi dari berbagai sumber,
termasuk data tentang pengguna (klik streaming, men-download data pola, online
profiles), sumber daya yang disampaikan (konten situs, struktur situs) dan
domain pengetahuan, bersama dengan data pertambangan teknik sufficient untuk menciptakan pandangan menyeluruh
sumber daya yang mencakup banyak informasi yang dibutuhkan para pengguna.
Mengingat bahwa, di Web, informasi yang relevan cenderung
sangat didistribusikan dan dinamis, personalisasi diharapkan menjadi salah satu
keuntungan besar dari Web semantik, yang adalah pre-nyata struktur yang
memungkinkan penalaran melalui beberapa dan didistribusikan sumber data, Lain
penting untai teknik personalisasi adalah pengembangan alat untuk mengaktifkan
relatif neophytes untuk menciptakan atau meningkatkan artefak kompleks
pengetahuan teknik, seperti ontologi atau pembungkus.
Multimedia
Web adalah lingkungan yang multimedia, yang membuat untuk
kompleks semantik, hal ini tentu saja tidak masalah unik ke Web. Meta penalaran
dan Epistemologi sering menganggap media tekstual, meskipun sebenarnya banyak
pertimbangan dalam bentuk analog. Sebagai hibrida menarik telah diusulkan bahwa
kesenjangan semantik bisa mengisi dengan ontologi visual yang mencakup
persyaratan tingkat rendah dan memberikan semacam pemetaan ke tingkat yang
lebih tinggi konsep-konsep abstrak yang dinyatakan dalam permintaan dan
metadata .
Infrastruktur seperti yang telah dibuat, menggunakan
ontologi deskriptor visual (i) yang berdasarkan representasi RDF MPEG-7 visual
deskriptor, Ontologi struktur multimedia (ii) berdasarkan skema multimedia
Deskripsi MPEG-7 dan (iii) inti ontologi pemodelan primitif pada akar dari
hirarki konsep yang dimaksudkan untuk bertindak sebagai jembatan antara
ontologi, Semua dilengkapi dengan domain ontologi
Tentu saja, media yang dibayangkan di sini adalah gambar
dan video; pertanyaan terbuka penelitian tetap tidak hanya tentang seberapa
jauh yang bisa di Cari oleh pendekatan seperti itu, tetapi juga tentang
bagaimana berbagai media akan menyerah pendekatan seperti dalam cara yang
integrable.
Pemrosesan Bahasa Alami
NLP berkaitan dengan Web dalam beberapa cara. Di tempat
pertama, bahasa alami adalah sangat jarang domain, yang kebanyakan kalimat yang
diucapkan atau ditulis terjadi sekali saja atau sangat jarang, dan skala
raksasa Web menyediakan korpus menarik untuk NLP penalaran.
Kedua, mengingat masalah skala Web, teknik NLP akan penting
dalam tugas-tugas seperti summarisation (Lihat, misalnya, dokumen pemahaman
konferensi tahunan dan [69]), yang dapat memberikan dukungan berguna untuk
bagian manusia dari tugas Cari.
Ketiga, NLP memiliki potensi besar untuk pembangunan macam
antarmuka intuitif yang heterogen dan tidak selalu melek komputer komunitas
pengguna Web memerlukan. Memang itu mungkin membantu menjembatani kesenjangan
antara visi SW Web terdiri dari data yang dimanipulasi secara logis, dan visi
yang lebih tradisional dari Web sebagai tempat mana berguna dokumen yang
diperoleh.
Dengan demikian kita memiliki disanalogy langsung antara
NLP dan SW, yang adalah bahwa URI, seperti kata-kata, pemilik, dan sehingga
dapat diatur. Itu adalah bukan untuk mengatakan bahwa peraturan tersebut akan
memastikan kekebalan dari drift makna bahwa ahli bahasa mendeteksi, tetapi
mungkin menyediakan stabilitas sufficient atas pendek jangka menengah.
Comments
Post a Comment