Search Engine
Mesin pencari atau Search engine adalah program komputer yang dirancang untuk melakukan pencarian atas
berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis,
ataupun news group dalam sebuah ataupun
sejumlah komputer peladen
dalam suatu jaringan. Search engine merupakan perangkat
pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya
ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat
akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits.
Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam
jenis berkas seperti halaman situs web,
gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga
diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basisdata
ataupun direktori web.
Sebagian besar mesin
pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikan
dan basisdata
tertutup, di antaranya yang paling populer adalah Google (MSN Search
dan Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari
dengan sumber terbuka (open source), contohnya
adalah Htdig, Nutch, Egothor
Saat awal perkembangan internet, Tim
Berners-Lee membuat sebuah situs web yang berisikan daftar situs web yang
ada di internet melalui peladen web CERN. Sejarah yang mencatat sejak tahun 1992 masih ada hingga
kini.[2] Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak
lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama
kali digunakan untuk melakukan pencarian di internet adalah
Archie yang berasal dari kata "archive" tanpa
menggunakan huruf "v".[3] Archie dibuat tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter
Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas McGill, Amerika Serikat. Cara kerja program tersebut adalah mengunduh daftar direktori serta
berkas yang terdapat pada layanan ftp publik (anonim) kemudian memuatnya ke dalam basisdata yang
memungkinkan pencarian.
Mesin pencari lainnya seperti Aliweb, muncul di 1993 dan masih
berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang
berkembang menjadi usaha komersial yang cukup besar adalah Lycos, yang dimulai
di Carnegie Mellon University sebagai
proyek riset di tahun 1994.
Segera setelah itu, banyak mesin
pencari yang bermunculan dan bersaing memperebutkan popularitas. Termasuk di
antaranya adalah WebCrawler, Hotbot, Excite, Infoseek, Inktomi, dan AltaVista. Masing-masing
bersaing dengan menambahkan layakan-layanan tambahan seperti yang dilakukan
oleh Yahoo.
Tahun 2002 Yahoo! mengakuisisi Inktomi, setahun kemudian
mengakuisisi AlltheWeb dan Altavista kemudian meluncurkan
mesin pencari sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin
pencari yang telah diakuisisinya serta memberikan layanan yang mengutamakan
pencarian Web daripada layanan-layanan lainnya.
Di bulan desember 2003, Orase menerbitkan versi pertama dari
teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat
unjuk kerja yang jauh lebih baik.
Mesin pencari juga dikenal sebagai
target investasi internet yang terjadi pada akhir tahun 1990-an. Beberapa
perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui mencatat
keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan mesin
pencari, dan hanya memasarkannya pada edisi-edisi enterprise saja,
contoh Northern Light sebelumnya
diketahui merupakan salah satu perintis layanan mesin pencari di internet.
Buku Osmar R. Zaïane From
Resource Discovery to Knowledge Discovery on the Internet menjelaskan
secara rinci sejarah teknologi mesin
pencari sebelum munculnya Google. Mesin-mesin pencari lainnya mencakup a9.com, AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.
Salah
satu Search Engine dan pengertiannya:
Google muncul pada akhir tahun 1997,
dimana Google memasuki pasar yang telah diisi oleh para pesaing lain dalam
penyediaan layanan mesin pencari, seperti Yahoo, Altavista, HotBot, Excite,
InfoSeek dan Lycos, dimana perusahaan-perusahaan tersebut mengklaim sebagian
perusahaan yang bergerak dalam bidang layanan pencarian di internet. Hingga
akhirnya Google mampu menjadi sebagai penyedia mesin pencari yang cukup
diperhitungkan di dunia.
Saat tingginya persaingan antar mesin
pencari yang ada, namun mesin pencari lain tidak mampu menghentikan kesuksesan
Google. Setelah Yahoo mampu pada posisi puncak di sekitar tahun 2000, Google
mampu menerobos liga besar tersebut. sehingga Google dipandang sebagai mesin pencari
yang utama seperti yang kita ketahui pada hari ini.
Yahoo
Yahoo raja directori di internet, di
samping para pengguna internet melihat DMOZ serta LookSmart berusaha menurunkan
nya dari posisi puncak tersebut. Akhir-akhir ini, telah tumbuh secara cepat
dalam ukurannya, mereka pun sudah memiliki harga sehingga mudah untuk
memasukinya, dengan demikian, mendapatkan sebuah daftar pada direktori Yahoo
memang memiliki nilai yang tinggi.
pada tahun 2001, mesin pencari Google berkembang
besar. Keberhasilan ini didasarkan pada bagian konsep dasar dari link popularity dan PageRank. Setiap halaman
diurutkan berdasarkan seberapa banyak situs yang terkait, dari sebuah premis
bahwa situs yang diinginkan pasti lebih banyak terhubung daripada yang lain.
Rangking situs (The PageRank)dari sebuah link halaman dan jumlah link dari
halaman-halaman tersebut merupakan masukan bagi Rangking situs yang
bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya
berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang
ditemukannya. User interface Google sangat disukai oleh pengguna, dan
hal ini berkembang ke para pesaingnya.
Human Organized Search Engine
Mesin pencari yang di kelola sepenuhnya oleh tangan manusia. Mesin
pencari ini menggunakan metode dengan memilah-milih informasi yang relevan dan
dikelompokan sedemikian rupa sehingga lebih bermakna dan bermanfaaat bagi
penggunannya. Situs ini dalam prakteknya memperkerjakan para pakar dalam
bidang-bidang tertentu, kemudian para pakar tersebut dapat mengkelompokan
situs-situs tertentu sesuai dengan bidangnnya atau kategori situs itu sendiri.
Computer Created Search Engine
Search engine kategori ini banyak memiliki kelebihan karena banyak
menyajikan inforrmasi, walaupun kadang-kadang ada beberapa informasi yang tidak
relevan. Search engine ini telah menggunakan software spider yang berfungsi
menyusup pada situs-situs tertentu, kemudian mengunpulkan data serta
mengelompokan dengan sedikit bantuan tangan manusia.
Hybrid Seacrh Engine
Merupakan gabungan antara tangan manusia dengan computer, sehingga
menghasilkan hasil pencarian yang relative akurat. Peran manusia dalam hal ini
adalah sebagai penelaah dalam proses pengkoleksian database halaman web.
MetaCrawler/Metasearch
Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini
hanya akan mengirimkan permintaan pencarian ke berbagai mesin pencari serta
menampilkan hasilnya satu di layer browser sehingga akan menampilkan banyak
sekali hasil dari ber bagai mesin pencari yang ada.
Pengertian
Search Engine adalah suatu sistem dalam data base yang mengumpulkan index
alamat webiste beserta isi yang terkandung didalamnya untuk ditampilkan dalam
wadah tertentu yang mengacu dengan kata kunci. Kebanyakan masyarakat umum
sebenarnya sudah tidak asing lagi dengan istilah search engine ini bahkan sudah
terbiasa menggunakannya.
Keberadaan
search engine sendiri tidak terlepas oleh sejarah keberadaan Internet di muka
bumi ini, berkembangnya jaringan internet yang sedemikian cepat dalam dua
dekade terakhir ini membuat penggunaan seacrh engine sebagai mesin pencari
melonjak tajam. Anda tahu google, ya google merupakan search engine atau mesin
pencari terbesar di dunia. setiap kita akan mencari informasi, kita biasanya
akan langsung ke google. Selain google masih banyak lagi yang lainnya.
Manfaat
- mesin pencari merupakan tempat kebanyakan orang mencari sesuatu via internet. Menurut survei hampir 90% pengguna internet memakai mesin pencari untuk mencari lokasi tertentu di internet. dan di antara mesin pencari yang ada, google merupakan mesin pencari yang paling banyak digunakan.
- Sebagian besar pengguna mesin pencari tidak pernah melewatkan dua halaman pertama dari mesin pencari.
- Sebagian besar (hampir 70%) pengguna mesin pencari tidak pernah klik pada hasil pencarian sponsor. Dengan demikian, hasil pencarian yang organik (secara alami) akan membuat suatu website memperoleh posisi strategis dalam dunia internet.
- Di negara-negara maju, porsi penjualan yang dilakukan melalui internet sudah hampir mencapai 20% dari keseluruhan transaksi tahunan.
- Sebuah informasi yang mudah di akses oleh semua orang baik dalam maupun luar negeri.
- Memudahkan Masyarakat dalam mencari informasi di internet
Cara kerja mesin pencari
Mesin pencari web bekerja dengan cara
menyimpan informasi tentang banyak halaman web,
yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawler — browser
web otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap
halaman lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata
diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman
web disimpan dalam sebuah database indeks untuk digunakan dalam
pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan
seluruh atau sebagian halaman sumber (yang disebut cache) maupun
informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian
berupa pranala yang merujuk pada file, seperti file audio, file video, gambar, foto dan sebagainya,
serta informasi
tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang
semakin terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin
pencari dan memasukkan query, biasanya dengan memasukkan kata kunci,
mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai
dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen
dan kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin
pencari real-time, seperti Orase.
Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan mesin
tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan
sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time
ini unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada
pranala mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google
menggunakan hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga
kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang
diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung suatu
kata atau frasa, sebagian halaman mungkin lebih relevan, populer, atau
autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai
metode untuk menentukan peringkat hasil pencarian agar
mampu memberikan hasil "terbaik" lebih dahulu. Cara mesin menentukan
halaman mana yang paling sesuai, dan urutan halaman-halaman itu diperlihatkan,
sangat bervariasi. Metode-metode nya juga berubah seiring waktu dengan
berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web adalah
usaha komersial yang didukung pemasukan iklan dan karenanya
sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan
membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil
pencarian.
Pentingnya mesin pencari optimasi
Salah satu alasan yang menyebabkan
diperlukan mesin pencari optimasi adalah karena ada banyak World Wide Web
Wanderer yang sudah ada, dan akan terus bertambah di setiap bulannya.
Sebagai Contoh, seseorang mempunyai World Wide Web
Wanderer untuk menjual produk pertanian maka di Indonesia akan ada puluhan
atau ratusan Website sejenis. Sementara itu, jika ingin melihat segmen dunia
maka akan lebih banyak lagi jumlahnya. Untuk itu, dengan menempatkan posisi di
tingkat ada dalam hasil pencarian maka akan membuat website pengguna tersebut
ibarat toko strategis yang terletak di tepi jalan besar. Dengan SEO yang bagus
maka kemungkinan website anda dikunjungi oleh orang lain akan lebih besar.
Dengan Kaidah SEO yang bagus, website
menggunakan lebih jelas atau keluhan sehingga akan lebih diperhatikan oleh
mesin pencari. itulah inti dari SEO, yaitu untuk membuat website anda
diperhatikan oleh mesin pencari.
Pencarian
Proses Pencarian
Melakukan pencarian dokumen yang dimuat
pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi
mengignat begitu menyebarnya informasi dimana-mana, bahkan University of
Calofornia menyebutkan saat ini telah terdapat lebih dari 50 milyar halaman web
di internet,
meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan yang mungkin terjadi adalah
karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi isinya.
tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki
standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun
jumlahnya juga tidak sedikit.
Dalam pencarian di web,
pengguna selalu memperkirakan kata apa yang di kira-kira terdapat pada halaman
yang ingin anda temukan. atau kira-kira apa subjek yang dipilih oleh seseorang
untuk mengelolah halaman situs yang mereka kelola, topik apa saja kira-kira
yang di bahas.
Jika pengguna melakukan apa yang
dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan
pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada web benar-benar
terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server
diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian kepada
seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan
hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang
disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada
alat bantu itu tadi ke database yang dimiliki. data base tersebut mengkoleksi
situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan
hasil pencarian dalam bentuk hypertext link dengan URL menuju halaman
lainnya. ketika anda klik link ini, dan menuju ke alamat tersebut maka dokumen,
gambar, suara dan banyak lagi bentuk lainnya yang ada pada server
tersebut disediakan, sesuai dengan informasi yang terdapat di dalamnya. layanan
ini bisa menjangkau ke manapun di seluruh dunia.
Tidak mungkin seseorang untuk melakukan
pencarian ke seluruh komputer yang terhubung internet ini, atau bahkan alat
bantu pencarian yang mengklaim bahwa melakukannya, tidak benar.
Kategori Alat Pencari
Saat ini, tiga bentuk dari alat bantu pencarian
ini. Menggunakan strategi yang berbeda untuk memanfaatkan kemampuan potensial
dari masing-masing nya, yaitu
Mesin pencari dan mesin pencari-meta
Karakteristik:
- Menyimpan data dalam bentuk teks penuh pada halaman yang terpilih,
- Pencarian berdasarkan kata kunci, mereka mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang ada dalam dokumen,
- Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori,
- Database dijaring dan dikumpulkan oleh spidr, yaitu komputer yang memiliki program robot, dengan kemampuan seminimal mungkin dari pandangan atau sentuhan manusia,
- Ukuran search engine:dari skala kecil hingga mampu menyimpan sangat banyak (sekitar hingga 20 milyar halaman web).
- Meta-search engine dengan cepat melakukan pencarian ke dalam beberapa data base dari berbagai search engine dalam satu kali permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil pencarian dari beberapa mesin pencari yang mereka libatkan. Contoh : Search engine: Google, Yahoo Search, Ask.com. Meta-Search : Dogpile, Copernic, dan lainnya.
Subject Directories
- Karakteristik :
- Seleksi dari situs yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala para ahli untuk subjek tertentu,
- Sering dengan hati-hati dievaluasi dan menjaga keterbaruan informasi yang mereka miliki, namun tidak selalu, kadang-kadang tidak, terutama untuk mereka yang telah memiliki data yang banyak dan bersifat general,
- Biasanya dikelola dalam bentuk subjek dan direktori yang tersusun secara hirarki,
- Sering dilengkapi dengan catatan mengenai deskripsinya ( tidak untuk Yahoo),
- Subjek dapat di-browse subjek dan kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,
- Dokumen yang tidak penuh teks. pencarian diminta lebih spesifik dibandingkan dengan pencarian melalui mesin pencari, karena kata kunci tidak bisa dibandingkan dengan isi dari halaman suatu situs, melainkan hanya pada subjek, kategori-kategori, dan deskripsi.
- Terdapat ribuan atau bahkan lebih subjek direktori dalam praktek dan kenyataannya apa saja yang dipikirkan di sana.
Specialized Databade (Invisible Web)
Karakteristik :
- Merupakan web yang menyediakan akses melalui suatu kotak pencarian ke dalam isi database pada sebuah komputer di suatu tempat,
- Dapat saja berubah berbagai topik, dapat pula juga hal yang komersial, pekerjaan yang spesifik, pemerintahan, dll
- Juga terdiri dari banyak halaman yang menghasilkan hasil pencarian dari katalog direktori online.
Prinsip Umum Dari mesin pencari
Sistem kinerja mesin ini ada beberapa
hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitekrut
dan mekanismenya.
Spider
Merupakan program yang men-download
halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah
bahwa browser menapilkan secara langsung informasi yang ada (baik tekas,
gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu,
sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat
seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia,
spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk
mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database
yang dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki search
engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang
ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi kemana dan
mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler
mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search
engine.
Indexer
Komponen ini melakukan aktifitas untuk
menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers,
struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.
Database
Merupakan tempat standar untuk
menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah dianalisis.
kadang kala disebut juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan dan
penentuan peringkat dari hasil pencarian pada search engine. Mesin ini
menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian
berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan
ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma
perangkingan yang dimiliki oleh search engine tersebut, mengikuti kaidah
perangkingan hakaman yang dipergunakan oleh mereka adalah hak mereka, para
peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk
meningkatkan pencarian yang dihasilkan oleh serach engine tersebut.
Web Server
Merupakan komponen yang melayani
permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini
biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada halaman
tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan
oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil
pencarian yang dikirimkan kepada komputer yang meminta informasi.
Berikut
ini 10 dari macam-macam search engine yang ada di internet :
Askjeeves
Tidak ada komentar:
Posting Komentar