Sejarah pengembangan mesin pencari. Mesin pencari mesin pencari yang muncul sebelumnya

Pada tahap awal pengembangan Internet, pengguna adalah minoritas istimewa dan jumlah informasi yang tersedia relatif kecil. Pada saat itu, akses kepadanya, sebagian besar pekerja dari berbagai lembaga pendidikan dan laboratorium utama, dan data yang diperoleh digunakan untuk tujuan ilmiah. Pada saat itu, penggunaan jaringan tidak memiliki relevansi seperti sekarang.

Pada tahun 1990. Ilmuwan Inggris Tim Berners Li (yang juga penemu URI, URL, HTTP, World Wide Web) membuat situs web info.cern.ch.ch.yang merupakan katalog online pertama di dunia. Sejak saat itu, Internet mulai mendapatkan popularitas tidak hanya di antara komunitas ilmiah, tetapi juga di antara pemilik komputer pribadi yang sederhana.

Dengan demikian, cara pertama untuk memfasilitasi akses ke sumber daya informasi di Internet adalah pembentukan katalog situs. Tautan ke sumber daya di dalamnya dikelompokkan pada topik.

Proyek pertama dari jenis ini dianggap Yahoo, buka pada bulan April 1994.. Karena peningkatan cepat jumlah situs di dalamnya, segera ada kemungkinan menemukan informasi yang diperlukan berdasarkan permintaan. Tentu saja, itu bukan mesin pencari penuh. Pencarian hanya dibatasi oleh data yang ada di katalog.

Pada tahap awal pengembangan jaringan Internet, katalog referensi digunakan dengan sangat aktif, tetapi secara bertahap kehilangan popularitasnya. Alasannya sederhana: bahkan di hadapan banyak sumber daya dalam katalog modern, mereka masih hanya menunjukkan sebagian kecil dari informasi yang tersedia di Internet. Misalnya, katalog jaringan terbesar adalah - DMOZ. (Buka Proyek Direktori). Ini berisi informasi tentang sedikit lebih dari lima juta sumber daya, yang tidak dapat ditekankan dengan basis data pencarian Google yang berisi lebih dari delapan miliar dokumen.

Katalog bahasa Rusia terbesar adalah direktori Yandex. Ini berisi informasi tentang sedikit lebih dari seratus atau empat ribu sumber daya.

Kronologi Pengembangan Mesin Pencari

1945 tahun - Insinyur Amerika Vannevar Bush menerbitkan rekaman gagasan yang mengarah pada penemuan hypertext, dan alasan tentang perlunya mengembangkan sistem ekstraksi data cepat dari dengan demikian informasi yang disimpan (setara dengan mesin pencari saat ini). Konsep perangkat Expander memori yang diperkenalkan olehnya berisi ide-ide asli bahwa, pada akhirnya, diwujudkan di Internet.

1960-e. - Gerard Salton dan kelompoknya di Cornell University mengembangkan "sistem pengambilan informasi cerdas". (Sistem Pengambilan Informasi Cerdas). Smart - singkatan dari Text of Text Otomatis Sihir Salton, yaitu, "Extractor Otomatis Sihir Teks Salton". Gerard Salton dianggap sebagai bapak teknologi pencarian modern.

1987-1989 - dirancang. Archie. - Mesin pencari untuk mengindeks arsip FTP. Archie mewakili skrip yang mengotomatiskan pengantar ke daftar di server FTP, yang kemudian ditransfer ke file lokal, dan hanya kemudian dalam file lokal, pencarian cepat untuk informasi yang diperlukan dilakukan. Pencarian didasarkan pada perintah grep standar UNIX, dan akses data ke data didasarkan pada telnet.

Pada versi berikutnya, data dibagi menjadi database terpisah, salah satunya hanya berisi nama file teks; Dan yang lainnya adalah entri dengan mengacu pada direktori hierarkis ribuan host; Dan satu lagi menghubungkan dua yang pertama. Versi Archie ini lebih efisien daripada yang sebelumnya, karena pencarian dibuat hanya dengan nama file, tidak termasuk banyak repetisi yang sebelumnya ada.

Mesin pencari menjadi semakin populer, dan para pengembang berpikir bagaimana mempercepat pekerjaannya. Basis data yang disebutkan di atas diganti dengan yang lain, berdasarkan pada teori kayu terkompresi. Versi baru pada dasarnya membuat basis data berbasis cara penuh alih-alih daftar nama file dan jauh lebih cepat dari sebelumnya. Selain itu, perubahan kecil memungkinkan sistem Archie untuk mengindeks halaman web. Sayangnya, karena berbagai alasan, pekerjaan di Archie segera berhenti.

Pada tahun 1993. Mesin pencari pertama di dunia untuk jaringan di seluruh dunia dibuat. Wandex.. Word Word Wanderop Wanderer Bat diletakkan di fondasinya, dikembangkan oleh Matthew Massachusetts Institute.

Tahun 1993. - Martin Bonfire menciptakan Aliweb. - Salah satu mesin pencari pertama di World Wide Web. Pemilik situs web harus menambahkannya sendiri ke indeks Aliweb sehingga muncul dalam pencarian. Karena terlalu sedikit webmaster yang melakukannya, aliweb tidak menjadi populer

20 April 1994 - Brian Pinkerton dari University of Washington dirilis Webcrawler. - Bot pertama, yang mengindeks halaman sepenuhnya. Perbedaan utama dari mesin pencari dari pendahulunya adalah untuk memberikan kemampuan untuk mencari kata kunci apa pun pada halaman web apa pun. Saat ini, teknologi ini adalah standar untuk menemukan mesin pencari. Mesin pencari "Webcrawler" telah menjadi sistem pertama, yang diketahui berbagai pengguna. Sayangnya, bandwidth rendah dan pada siang hari sistem sering tidak dapat diakses.

20 Juli 1994 - dibuka Lycos. - Perkembangan serius dalam teknologi pencarian yang dibuat di Carnegie Melon University. Michael Maldin bertanggung jawab atas mesin pencari ini dan masih tetap menjadi spesialis terkemuka di Lycos Inc. Lycos dibuka dengan katalog dokumen 54.000. Dan selain ini, hasil yang ia berikan peringkat, selain itu, ia memperhitungkan awalan dan perkiraan kebetulan. Tetapi perbedaan utama antara LYCOS secara konstan diperbarui di katalog: Pada November 1996, 60 juta dokumen diindeks - lebih dari mesin pencari lainnya dari waktu itu.

Januari 1994. - didirikan Infoseks.. Dia tidak benar-benar inovatif, tetapi memiliki sejumlah tambahan yang bermanfaat. Salah satu penambahan populer adalah menambahkan halaman waktu nyata Anda.

1995. - Dimulai Altavista.. Muncul, mesin pencari Altavista dengan cepat menerima pengakuan atas pengguna dan menjadi pemimpin di antara dirinya sendiri seperti ini. Sistem ini praktis tidak terbatas pada saat itu throughput, itu adalah mesin pencari pertama di mana dimungkinkan untuk merumuskan permintaan dalam bahasa alami, serta merumuskan permintaan yang kompleks. Para pengguna diizinkan menambah atau menghapus URL mereka sendiri dalam waktu 24 jam. Juga Altavista menawarkan banyak tips dan rekomendasi untuk pencarian. Merit utama dari sistem Altavista dianggap untuk memastikan dukungan untuk banyak bahasa, termasuk Cina, Jepang dan Korea. Memang, pada tahun 1997, tidak ada mesin pencari di jaringan yang bekerja dengan beberapa bahasa, terutama dengan langka.

1996. - Mesin pencari ATAVISTA meluncurkan ekstensi morfologis untuk bahasa Rusia. Pada tahun yang sama, mesin pencari domestik pertama diluncurkan - Rambler.ru dan APORT.RU. Penampilan mesin pencari domestik pertama menandai tahap baru pengembangan runet, yang memungkinkan pengguna berbahasa Rusia untuk meminta dalam bahasa ibu mereka, serta merespons dengan cepat terhadap perubahan yang terjadi dalam jaringan.

20 Mei 1996 - APKTOMI muncul bersama dengan mesin pencarinya Hotbot.. Penciptanya adalah dua tim dari University of California. Ketika situs muncul, ia dengan cepat menjadi populer. Pada Oktober 2001, Danny Sullivan menulis sebuah artikel berjudul "Basis Database Inktomi situs terbuka untuk penggunaan umum", yang menggambarkan bagaimana Inktomi secara tidak sengaja membuat basis data situs spam, yang sudah berjumlah sekitar 1 juta URL yang tersedia untuk penggunaan universal.

1997. - Di negara-negara barat, titik balik terjadi dalam pengembangan mesin pencari, ketika S. Brin dan L. Halaman dari Standford University didirikan Google. (Nama awal proyek backrub). Mereka mengembangkan mesin pencari mereka sendiri, yang memberi pengguna kesempatan untuk menggunakan pencarian berkualitas tinggi dengan morfologi, kesalahan dalam menulis kata-kata, serta meningkatkan relevansi dalam hasil penerbitan permintaan.

23 September 1997 - Diumumkan Yandex.yang dengan cepat menjadi yang paling populer dari pengguna internet yang berbahasa Rusia dari sistem pencarian. Dengan peluncuran mesin pencari Yandex, mesin pencari domestik mulai bersaing satu sama lain, meningkatkan sistem pencarian dan pengindeksan situs, mengeluarkan hasil, serta menawarkan layanan dan layanan baru

Dengan demikian, pengembangan mesin pencari dan formasi mereka dapat ditandai dengan tahapan yang tercantum di atas.

Hingga saat ini, tiga pemimpin - Google, Yahoo dan Bing menetap di pasar dunia. Mereka memiliki basis data sendiri, dan algoritma pencarian mereka. Banyak mesin pencari lainnya menggunakan hasil dari tiga mesin pencari utama ini. Misalnya, AOL menggunakan basis data Google sementara Altavista, Lycos dan Alltheweb menggunakan database Yahoo semua mesin pencari lainnya dalam berbagai kombinasi menggunakan hasil (penerbitan) dari sistem yang terdaftar.

Jika Anda memiliki analisis yang serupa dari mesin pencari, populer di negara-negara CIS, maka kami akan melihat bahwa mail.ru menyiarkan pencarian Google, sambil tumpang tindih dengan perkembangan baru, Rambler, pada gilirannya, menerjemahkan Yandex. Oleh karena itu, seluruh pasar runet dapat dibagi antara kedua raksasa ini.

Itulah sebabnya, di negara-negara CIS, promosi situs biasanya dilakukan hanya dalam dua PS ini.

Kisah tentang bagaimana sistem pencarian muncul, dimulai pada Juli 1945, ketika seorang ilmuwan dari America Vanniver Bush (Vannevar Bush) dapat menulis artikel terkenal "sementara kami berpikir," Dia dapat memprediksi munculnya komputer pribadi, dan bisa Juga merumuskan gagasan hiperteks. Perhatikan bahwa Vanniver Bush dan dirinya berpartisipasi dalam penciptaan prototipe mesin pencari yang kita gunakan hari ini. Namun, kemudian, di bawah 1938, ia dapat mengembangkan dan mematenkan perangkat yang dapat dengan cepat mencari informasi tentang mikrofilm.

Terlepas dari kenyataan bahwa setidaknya Vanniva Bush mempertimbangkan teknologi pencarian dan ide-ide Internet, tetapi para ilmuwan lain telah menerapkan ide-idenya dalam praktik. Pada tahun 1958, Departemen AS diciptakan di Amerika Serikat (Badan Proyek Penelitian Lanjutan, ARPA, Badan Proyek Penelitian Lanjutan), di dalamnya dari tahun 1963 hingga 1969 para ilmuwan dapat mengerjakan konsep yang sama sekali baru, yang memungkinkan untuk mentransfer informasi melalui komputer melalui komputer jaringan.

Pada awalnya, koneksi yang diizinkan untuk mengirimkan data terenkripsi direncanakan untuk digunakan untuk keperluan militer, tetapi tingkat keamanan untuk transmisi informasi sangat rendah, sehingga militer meminta untuk menolak untuk melanjutkan perkembangan.

Namun, hanya pada akhir 1980-an, gagasan untuk menciptakan jaringan komputer dibangkitkan kembali. Beberapa universitas di Amerika Serikat membantu ini, yang dalam perkembangan mereka dapat menggabungkan perpustakaan informasi mereka, yang merupakan pendidikan, menggunakan koneksi jaringan.

Pada 1990-an, perkembangan tajam Internet dimulai. Sejak Februari 1993, segera setelah Mark Andressen (Mark Andressen) dari NCSP (Pusat Nasional Aplikasi Superkomputer, NCSA, Pusat Nasional Supercomputing, www.ncsa.uiuc.edu) dapat menyelesaikan versi awal program, Yang memvisualisasikan Mosaic Hypertext di bawah Unix setelah semua, adalah dia yang memiliki antarmuka grafis yang nyaman dan dia bisa menjadi prototipe browser, yang kami gunakan di zaman kita. Internet mulai mendapatkan popularitas.

Pada pertengahan 1990-an, untuk menemukan informasi yang diperlukan, perlu menggunakan katalog di mana situs berada. Pada saat itu, katalog ini tidak banyak, dan mereka tidak meniup situs, tetapi informasi itu dipesan pada judul dan topik. Perlu dicatat bahwa pada tahun 1993 tiga bot mesin pencari sudah ada di jaringan. Data pengembangan non-komersial dan setelah masuknya sejumlah besar informasi tidak dapat mengatasi pekerjaan, sehingga mereka menghilang karena perkembangan tajam Internet.

Sejak 1995, tempat utama di Internet global telah diambil oleh mesin pencari, yang selanjutnya sangat besar, di barat - Google, Yachoo, Alta Vista, dan di Rusia - Yandex, Rambler, APORT.

Mendistribusikan ke Sejarah Pengembangan Mesin Pencari Rusia. Di sini, mesin pencari kami menunggu dengan cara mudah kami. Ada juga kemenangan dan kekalahan mereka.

Yandex mulai berkembang pada tahun 1990, tetapi hanya pada tahun 1997 ia menjadi mesin pencari yang kami ketahui dengan sempurna.

Yandex. Ini dianggap sebagai pemimpin tanpa syarat di Rusia, karena cakupan audiens Yandex untuk bulan ini menurut perkiraan spesialis terkemuka berjumlah sekitar setengah dari audiens reguler Internet di Rusia. Angka-angka ini di kepala lebih unggul dari potensi audiens APORT dan Rambler. Baru-baru ini, pencarian yang cukup kuat untuk GO MAIL lahir dari layanan elektronik utama lainnya, yang terlibat dalam surat, tetapi dalam hal ini perusahaan dapat menggunakan algoritma Yandex dan, karena ini, cari dari halaman sistem surat yang kami bisa atribut ke pencarian di Yandex. Tapi Skandal Skandal terakhir kelompok surat untuk pergi dari pencarian Yandex. Penyebab pasti sesaknya tidak tahu sejauh ini.

Dalam pencarian Yandex, berita utama diperhitungkan, serta temuan wajib kata dalam tubuh dokumen. Preferensi diberikan kepada kata-kata yang merupakan frasa yang terletak dekat satu sama lain dan dalam satu paragraf. Pencarian di Yandex terjadi dengan memperhitungkan morfologi bahasa Rusia, ini adalah fitur khasnya, yaitu, dalam hal permintaan "Foto Alam" atau "Nature", itu juga akan dikeluarkan oleh mereka dan dokumen-dokumen lainnya. yang memenuhi kata-kata ini.

Pengembara Ini adalah layanan pencarian pertama Runet, pada musim gugur 1997 oleh sekelompok ilmuwan dari mikrobiologi di kota Pushchino di wilayah Moskow. Di Rambler, pencarian dibangun dengan mengindeks kata-kata utama pada halaman yang disorot oleh huruf tebal (tag kuat dan b) dan jika mereka sering muncul dalam headline (tag H1). Berbeda dengan pencarian Rambler Yandex, tag kata kunci dapat mengabaikan, karena yang suka disebut pencarian bersih, tetapi pada saat yang sama pencarian pencarian yang tepat belum terlihat. Masalah ini berkedip di mesin pencari lainnya. Saat ini, posisi pencarian Rambler jatuh sangat jatuh dan para ahli dan peramal menutupi sistem ini melatih kembali ke portal hiburan reguler. Satu-satunya hal yang membuatnya menjadi afloat sistem ini adalah jaringan periklanan sendiri Blogun.

Mesin pencari "APORT" pertama kali ditunjukkan pada Februari 1996 selama konferensi pers "Agama" untuk menghormati pembukaan "Klub Rusia", pada saat itu belum menjadi mesin pencari skala besar di seluruh dunia. Perbedaan antara APTAP dari mesin pencari lain adalah ia dapat mencari kata kunci yang ditentukan tidak hanya dalam kata kunci, tetapi juga dalam tanda tangan ke gambar (alt), dan dalam deskripsi (deskripsi). Tetapi inovasi ini terus tidak lama. Mesin pencari lain juga mengulangi hal yang sama dan selain sekarang tidak ada lagi yang mengejutkan pengguna mereka. Untuk 2011, sistem pencarian Aport kemungkinan besar menunggu penyerapan dari pemain pasar pencarian yang lebih besar.

Kerugian Pencarian

Pada saat ini, mesin pencari dengan cara apa pun terus meningkatkan teknologi pencarian mereka. Tapi, sayangnya, pencarian sempurna untuk tidak ada yang bisa membanggakan, tidak peduli seberapa tinggi mereka dikembangkan. Saat ini, kerugian utama dari mesin pencari dapat mencakup sistem generalisasi kueri yang dikembangkan dengan lemah dan ketergantungan besar pada pilihan sumber informasi. Jika tidak memadai informasi, masih mungkin untuk entah bagaimana mengkompensasi kelimpahan memilih hasil pencarian. Tetapi di sini untuk menjelaskan komputer dengan bahasa manusia, apa yang ingin mereka temukan orang belum mungkin diterjemahkan menjadi kenyataan. Karena itu, tidak ada mesin pencari yang dapat menyebut diri mereka ensiklopedia. Namun, itu bukan lagi rahasia bahwa masa depan pasti untuk pencarian informatif, yang akan difokuskan pada mengobati konsep manusia.

Mesin pencari (PS) sudah layak waktu adalah bagian wajib dari Internet. Hari ini mereka adalah mekanisme besar dan paling rumit yang bukan hanya alat untuk menemukan informasi yang diperlukan, tetapi juga area yang cukup menarik untuk bisnis.


Banyak pengguna pencarian tidak pernah memikirkan prinsip-prinsip pekerjaan mereka, tentang cara menangani permintaan pengguna, bagaimana data sistem dibangun dan berfungsi. Bahan ini akan membantu orang-orang yang terlibat dalam optimasi dan, memahami perangkat dan fungsi dasar mesin pencari.

Fungsi dan konsep ps

Sistem Pencarian - Ini adalah paket perangkat keras dan perangkat lunak yang dimaksudkan untuk mengimplementasikan fungsi pencarian Internet, dan menanggapi kueri pengguna yang biasanya ditentukan sebagai frasa teks (atau permintaan pencarian yang lebih akurat), mengeluarkan daftar referensi ke sumber informasi yang dilakukan oleh relevansi. Sistem pencarian yang paling umum dan besar: Google, Bing, Yahoo, Baidu. Di Runet - Yandex, Mail.ru, Rambler.

Pertimbangkan secara lebih rinci nilai kueri pencarian itu sendiri, mengambil sistem Yandex misalnya.

Permintaan harus dirumuskan oleh pengguna dalam kepatuhan penuh dengan subjek pencariannya, sesederhana mungkin dan singkat. Misalnya, kami ingin mencari informasi dalam mesin pencari ini: "Cara memilih mobil untuk diri sendiri." Untuk melakukan ini, buka halaman utama dan masukkan permintaan untuk mencari "Bagaimana memilih mobil." Kemudian fungsi kami dikurangi untuk memasukkan tautan ke sumber informasi yang disediakan di jaringan.




Tetapi bahkan berakting dengan cara ini, Anda dapat dan tidak mendapatkan informasi yang Anda butuhkan. Jika kita mendapat hasil negatif yang serupa, Anda hanya perlu mereformasi permintaan Anda, atau dalam basis data pencarian sebenarnya tidak ada informasi berguna tentang jenis permintaan ini (seperti itu sangat mungkin pada parameter permintaan "sempit" yang ditentukan, misalnya, misalnya , "Bagaimana memilih mobil di Anadyri").

Tugas paling dasar dari setiap mesin pencari adalah mengirimkan kepada orang-orang jenis informasi yang mereka butuhkan. Dan untuk membuat pengguna untuk membuat jenis permintaan "benar" untuk mesin pencari, yaitu frasa yang akan sesuai dengan prinsip-prinsip pekerjaan mereka, praktis tidak mungkin.

Itulah sebabnya spesialis pengembangan mesin pencari membuat prinsip dan algoritma karya mereka yang akan memberi pengguna untuk menemukan informasi mereka. Ini berarti bahwa sistem harus "berpikir" sama seperti seseorang berpikir ketika menemukan informasi yang diperlukan di Internet.

Ketika dia memasuki permintaannya ke mesin pencari, dia ingin menemukan apa yang dia butuhkan, semudah mungkin dan lebih cepat. Setelah menerima hasilnya, pengguna menyumbang penilaian sistem, dipandu oleh beberapa kriteria. Apakah dia bisa menemukan informasi yang diperlukan? Jika tidak, berapa kali harus mereformasi teks kueri untuk menemukannya? Seberapa relevan informasi yang diperolehnya? Seberapa cepat mesin pencari telah memproses permintaannya? Seberapa nyaman hasil pencarian? Apakah hasil yang diperlukan terlebih dahulu, atau terletak di tempat ke-30? Berapa banyak "sampah" (informasi yang tidak perlu) ditemukan dengan informasi yang bermanfaat? Apakah akan ada informasi yang relevan untuk itu, ketika menggunakan PS, dalam seminggu, atau dalam sebulan?




Untuk mendapatkan jawaban yang tepat untuk pertanyaan-pertanyaan seperti itu, pengembang pencarian terus-menerus meningkatkan prinsip peringkat dan algoritme, tambahkan peluang dan fungsi baru dan sarana apa pun yang berusaha membuat sistem bekerja lebih cepat.

Karakteristik utama mesin pencari

Menunjukkan karakteristik pencarian utama:

Kesempurnaan.

Fullness adalah salah satu karakteristik pencarian paling penting, ini adalah rasio angka yang ditemukan berdasarkan permintaan dokumen informasi ke jumlah total mereka di Internet yang berkaitan dengan permintaan ini. Misalnya, ada 100 halaman dengan frasa "Bagaimana memilih mobil", dan dalam permintaan yang sama hanya ada 60 dari total, maka dalam hal ini pencarian penuh 0,6 adalah 0,6. Jelas bahwa semakin besar pencarian itu sendiri, semakin besar kemungkinan pengguna akan menemukan dokumen yang ia butuhkan, tentu saja, jika dia ada sama sekali.

Ketepatan.

Fungsi dasar lain dari mesin pencari adalah akurasi. Ini menentukan tingkat kepatuhan dengan permintaan pengguna untuk halaman yang ditemukan di jaringan. Misalnya, jika frasa kunci "bagaimana memilih mobil" ada seratus dokumen, setengah dari mereka berisi frasa ini, dan sisanya Anda hanya memiliki kata-kata seperti itu (bagaimana memilih radio mobil, dan menginstalnya di mobil "), kemudian akurasi pencarian sama dengan 50/100 \u003d 0,5.

Dari pencarian lebih akurat, semakin cepat pengguna akan menemukan informasi yang Anda butuhkan, "sampah" yang kurang beragam akan bertemu di antara hasil, semakin sedikit dokumen yang ditemukan tidak sesuai dengan arti permintaan.

Relevansi.

Ini adalah komponen pencarian yang signifikan, yang mencirikan waktu berlalu dari saat menerbitkan informasi di Internet sampai dipublikasikan di basis indeks mesin pencari.

Misalnya, hari berikutnya setelah informasi tentang rilis iPad baru, banyak pengguna beralih ke pencarian dengan jenis permintaan yang sesuai. Dalam kebanyakan kasus, informasi tentang berita ini sudah tersedia dalam pencarian, meskipun sangat sedikit telah berlalu sejak penampilannya. Ini karena keberadaan "pangkalan cepat" dari mesin pencari besar, yang diperbarui beberapa kali per hari.

Kecepatan pencarian.

Fungsi ini sebagai kecepatan pencarian terkait erat dengan apa yang disebut "stabilitas beban". Setiap pencarian kedua ditarik oleh sejumlah besar orang, beban kerja semacam itu membutuhkan pengurangan waktu yang signifikan untuk menangani satu permintaan. Di sini, minat pada mesin pencari dan pengguna bertepatan: pengunjung ingin mendapatkan hasil secepat mungkin, dan mesin pencari harus mengerjakannya secepat mungkin, agar tidak memperlambat pemrosesan permintaan berikutnya.

Visualitas.

Representasi visual dari hasilnya adalah elemen penting dari kenyamanan pencarian. Menurut banyak permintaan, mesin pencari menemukan ribuan, dan dalam beberapa kasus jutaan dokumen yang berbeda. Karena ketidakjelasan kompilasi frasa kunci untuk pencarian atau tidak akurasi, bahkan hasil permintaan pertama tidak selalu hanya memiliki informasi yang diperlukan.

Ini berarti bahwa seseorang sering memiliki pencarian sendiri di antara hasil yang disediakan. Berbagai komponen halaman penerbitan PS membantu menavigasi dalam hasil pencarian.

Sejarah Pengembangan Mesin Pencari

Ketika Internet mulai berkembang, jumlah pengguna regulernya kecil, dan jumlah informasi untuk akses relatif kecil. Sebagian besar akses ke jaringan ini hanya memiliki spesialis bidang penelitian. Pada saat itu, tugas menemukan informasi tidak begitu relevan seperti sekarang.

Salah satu metode pertama penyelenggara akses luas ke sumber daya informasi adalah penciptaan katalog situs, dan referensi kepada mereka mulai mengelompokkan topik. Jadi proyek pertama adalah sumber daya yahoo.com, yang dibuka pada musim semi 1994. Selanjutnya, ketika jumlah situs dalam direktori yahoo meningkat secara signifikan, opsi untuk menemukan informasi yang diperlukan pada katalog ditambahkan. Belum sepenuhnya mesin pencari, karena area pencarian seperti itu terbatas hanya oleh situs yang termasuk dalam direktori ini, dan tidak sepenuhnya semua sumber daya di Internet. Katalog tautan cukup banyak digunakan sebelumnya, tetapi saat ini, hampir sepenuhnya kehilangan popularitasnya.

Lagi pula, bahkan hari ini, katalog besar memiliki informasi tentang sedikit bagian dari situs web di Internet. Katalog yang paling terkenal dan besar di dunia memiliki informasi sekitar lima juta situs ketika Google Base berisi informasi tentang lebih dari 25 miliar halaman.




Mesin pencari nyata pertama adalah webcrawler, yang muncul pada tahun 1994.

Tahun depan, Altavista dan Lycos muncul. Selain itu, yang pertama adalah pemimpin dalam mencari informasi waktu yang lama.




Pada tahun 1997, Sergey Brin, bersama dengan Larry Page, menciptakan mesin pencari Google sebagai proyek penelitian di Universitas Standford. Hari ini, Google, mesin pencari paling populer dan populer di dunia.




Pada bulan September 1997, Yandex diumumkan (secara resmi), yang saat ini merupakan sistem pencarian paling populer di Runet.




Menurut N. September 2015.Bagian mesin pencari di dunia didistribusikan sebagai berikut:
  • Google - 69,24%;
  • Bing - 12,26%;
  • Yahoo! - 9,19%;
  • Baidu - 6,48%;
  • AOL - 1,11%;
  • Tanyakan - 0,23%;
  • Excite - 0,00%


Menurut N. desember 2016., Tanda-tanda Mesin Pencari di Runet:

  • Yandex - 48,40%
  • Google - 45.10%
  • Search.mail.ru - 5,70%
  • Rambler - 0,40%
  • Bing - 0,30%
  • Yahoo - 0,10%

Prinsip Mesin Pencari

Di Rusia, sistem pencarian utama adalah Yandex, lalu Google, dan kemudian [email protected]. Semua sistem pencarian besar memiliki struktur sendiri, yang sangat berbeda dari yang lain. Tetapi Anda masih dapat memilih elemen utama yang umum untuk semua mesin pencari.

Modul pengindeksan.

Komponen ini terdiri dari tiga program robot:

Laba-laba. (Dalam bahasa Inggris. Spider) - program yang dimaksudkan untuk mengunduh halaman web. "Laba-laba" mengunduh halaman tertentu, pada saat yang sama menghapus semua tautan darinya. Kode HTML diunduh dengan hampir setiap halaman. Untuk ini, robot menggunakan protokol HTTP.




"Spider" berfungsi sebagai berikut. Robot mentransmisikan permintaan ke server "Get / Path / Document" dan perintah query http lainnya. Sebagai tanggapan, program robot menerima aliran teks yang berisi informasi dari jenis layanan dan, tentu saja, dokumen itu sendiri.
  • URL halaman yang diunduh;
  • tanggal ketika halaman diunduh;
  • header server respons HTTP;
  • kode HTML, halaman "Tubuh".
Crawler. ("Bepergian" laba-laba). Program ini secara otomatis memasuki semua tautan yang ditemukan pada halaman, dan juga menyoroti mereka. Tugasnya adalah memutuskan di mana di masa depan laba-laba harus ditemukan, berdasarkan tautan ini atau berdasarkan daftar alamat yang ditentukan.

Indexer. (Robot Indexer) adalah program yang menganalisis halaman yang diunduh laba-laba.



Pengindeks sepenuhnya membongkar halaman ke elemen komposit dan menganalisis analisis mereka, menerapkan jenis algoritma morfologis dan leksikal.

Analisis dilakukan melalui berbagai bagian halaman, seperti tajuk utama, teks, tautan, fitur gaya dan struktural, tag HTML, dll.

Dengan demikian, modul pengindeksan memungkinkan untuk menjalani referensi dari jumlah sumber daya yang ditentukan, mengunduh halaman, mengekstrak massa referensi ke halaman baru dari dokumen yang diterima dan membuat analisis terperinci.

Database.

Database. (atau Indeks Mesin Pencari) adalah satu set penyimpanan data, berbagai informasi di mana parameter yang disesuaikan dari setiap indeks pengindeksan dan dokumen yang diunduh disimpan.

Server pencarian.

Ini adalah elemen terpenting dari seluruh sistem, karena kecepatan dan, tentu saja, kualitas pencarian tergantung pada algoritma yang mendasari fungsinya.

Server pencarian berfungsi sebagai berikut:

  • Permintaan yang berasal dari pengguna mengalami analisis morfologis. Lingkungan informasi dari setiap dokumen yang tersedia dalam database dihasilkan (itu akan terus ditampilkan sebagai cuplikan, I.E. Bidang informasi teks dari permintaan yang sesuai).
  • Data yang diperoleh mentransmisikan sebagai parameter input dengan modul peringkat khusus. Mereka diproses dalam semua dokumen, dan pada akhirnya, untuk setiap dokumen tersebut, peringkatnya dihitung, yang mencirikan relevansi dokumen tersebut sebagai permintaan pengguna, dan komponen lainnya.
  • Tergantung pada kondisi pengguna yang ditentukan oleh pengguna, peringkat ini mungkin disesuaikan dengan tambahan.
  • Itu kemudian dihasilkan oleh cuplikan sendiri, mis. Untuk dokumen apa pun yang ditemukan dari tabel yang sesuai, judul, anotasi yang sebagian besar memenuhi kueri diambil, dan tautan ke dokumen ini, sedangkan bentuk kata dan kata-kata yang ditemukan disorot.
  • Hasil pencarian yang diterima dikirimkan ke orang dalam bentuk halaman yang dihasilkan hasil pencarian (SERP).
Semua elemen ini terkait erat satu sama lain dan berfungsi, berinteraksi, membentuk mekanisme yang berbeda, tetapi agak sulit untuk berfungsinya PS, yang membutuhkan biaya sumber daya yang sangat besar.

Sejarah pengembangan Internet Rusia (Runet) secara resmi melakukan hitungan mundur sejak 1994. Saat itulah domain zone.ru terdaftar, dan situs pertama mulai muncul, banyak di antaranya kemudian naik ke portal populer.

Perpustakaan Moshkova, RosbizonsontSalting News Agency, Studio Artemia Lebedev - Semua sumber daya ini didirikan pada pertengahan 90-an abad terakhir.

Bagaimana mesin pencari pertama muncul

Untuk waktu yang cukup lama, "populasi" runet terbatas pada sejumlah kecil pelopor teknologi jaringan ini. Mereka sangat sedikit bahwa konsep "pencarian" pada waktu itu tidak ada.

Sebagian besar situs yang diperlukan dapat disimpan di bookmark browser, dan sisanya ada direktori, di mana semua tautan dikelompokkan ke dalam beberapa kategori utama. Katalog pertama seperti Rusia di internet (http://www.ru), sedikit kemudian, Dmoz, Yahoo dan Yandex.Catalog muncul sedikit kemudian.

Namun, seiring waktu, jumlah pengguna internet meningkat, jumlah situs yang dibuat agar pengguna ini juga dapat mengunjungi mereka dan menerima informasi yang mereka butuhkan.

Secara bertahap, database direktori tumbuh sangat banyak sehingga sangat sulit untuk menemukan sesuatu secara manual. Kemudian idenya muncul untuk mengotomatiskan proses pencarian dan membuat layanan interaktif khusus untuk ini.

Permintaan selalu memunculkan kalimat, jadi di Internet, proyek pencarian dari penulis yang berbeda mulai muncul di Internet. Beberapa dari mereka, seperti Webcrawler, Lycos, InfoSEEK dan lainnya gagal mencapai kesuksesan serius dan setelah beberapa waktu mereka telah bekerja dalam ketidakjelasan pada ruang tanpa akhir dari World Wide Web.

Tetapi untuk perusahaan lain yang lebih sukses, semuanya berkembang jauh lebih baik - pengembang modern mesin pencari terkemuka terbentuk selama periode ini dan selama beberapa tahun terakhir berhasil mencapai hasil yang menakjubkan.

Apa itu mesin pencari

Mesin pencari modern adalah mekanisme kompleks yang membutuhkan sumber daya besar (baik manusia maupun material) untuk mendukung pekerjaan saat ini dan pembangunan berkelanjutan.

Di jantung pencarian penerbitan pencarian terletak rumus peringkat terkenal, yang memperhitungkan ratusan berbagai faktor, mulai dari perangkat internal situs dan teks-teks halamannya dan berakhir dengan referensi eksternal, daya tarik proposal komersial yang diposting Pada sumber daya, dan fitur perilaku pengguna yang beralih ke sana dari pencarian.

Kembali pada 2006-2007, perwakilan Yandex menyatakan bahwa untuk menguraikan algoritma mereka yang dibutuhkan seluruh lembaga penelitian, karena pencarian mereka didasarkan pada lebih dari 800 faktor yang berbeda. Sejak itu, bertahun-tahun telah berlalu, formula peringkat menjadi lebih rumit oleh beberapa urutan besarnya, dan faktor-faktor yang memiliki dampak terbesar pada hasil penerbitan secara praktis tidak mungkin untuk mempengaruhi faktor-faktor tersebut.

Jadi, di balik kesederhanaan eksternal dari halaman utama dan reaksi cepat Yandex atau Google ke frasa pencarian yang diperkenalkan oleh Anda, karya yang melelahkan ribuan orang dan investasi keuangan besar dalam infrastruktur, peralatan dan sumber daya manusia disembunyikan.

Pada saat yang sama, jelas bahwa para pemimpin saat ini memastikan keunggulan tersebut atas mereka yang ingin membuat mereka setidaknya beberapa persaingan yang harga tiket masuk ke pasar ini diukur dengan miliaran dolar.

Konfirmasi keadaan seperti itu dapat menjadi sejarah upaya untuk menembus mesin pencari di perusahaan perangkat lunak yang terkenal dan terkaya Microsoft. Mesin pencari Bing selama lebih dari sepuluh tahun diposisikan sebagai pesaing serius bagi para pemain terkemuka, yang merupakan dana besar diinvestasikan.

Dan dalam beberapa tahun terakhir, investasi ini sudah mulai memberikan hasil pertama, meskipun mereka dapat memuaskan memuaskan untuk dipanggil hanya dengan berlebihan yang sangat besar: pangsa Bing di pasar Rusia pada saat penulisan artikel itu kurang dari satu persen.

Contoh lain, kesimpulan ilustratif yang dibuat sebelumnya - mesin pencari Nigma Rusia. Penciptanya memilih strategi pemasaran niche. Rupanya, jelas dipahami bahwa di bidang terbuka pencarian umum, persaingan kutub pasar hampir mustahil, pengembang algoritma melanjutkan cara menyediakan layanan pencarian pada struktur pendidikan di bidang kimia, matematika , fisika dan ilmu lainnya.

Namun, target audiens proyek semacam itu jelas beberapa, yang pasti tercermin dalam kehadirannya: menurut LiveInnternet Meter, jumlah pengguna sistem ini hanya sepersepuluh persen.

  1. Pemimpin peringkat tanpa syarat adalah Yandex. Menurut meter yang sama, Yandex memiliki "pengendalian saham" di pasar mesin pencari: Pada Juli 2014, fraksi mesin pencari lebih dari 52%.
  2. Di posisi kedua, Google merasa percaya diri - 38%.
  3. Tempat ketiga dengan margin yang agak besar menempati portal mail.ru. Beberapa waktu lalu, situs populer, tampaknya, terlibat dalam pencarian kakak laki-laki, yang bisa lebih mahal - mesin Yandex dan Google bergantian diintegrasikan ke dalam taman bermain mereka. Tetapi sejak 2013, perusahaan telah mengikuti kursus pengembangan independen, dan sekarang situs tersebut telah dilaksanakan oleh algoritma pencarian pengembangannya sendiri. Benar, itu tidak mempengaruhi bagian dari sistem sistem, yang, tampaknya, ditentukan terutama oleh promosi merek dan daya tarik layanan yang disajikan di situs. Selama beberapa tahun terakhir, kehadiran layanan Go.mail.ru berfluktuasi di sekitar tanda 7%.

Semua mesin pencari lainnya, termasuk Rambler yang dulu perkasa, dapat dianggap kecuali sebagai latar belakang alami - mereka semua tidak memiliki dampak signifikan pada distribusi kursi di bagian atas mesin pencari, berada di level 0,1-0,7 persen dari pasar .

Analisis Pasar Pencarian Online Rusia

Pasar mesin pencari di Rusia sangat spesifik. Untuk uraiannya, Anda dapat menggunakan dua karakteristik: terkonsentrasi dan kompetitif yang lemah. Memang, bagian dari tiga pemain utama melebihi 97%, yang menunjukkan keuntungannya yang luar biasa atas semua yang lain.

Posisi dominan memiliki mesin pencari Rusia Yandex. Seperti yang telah kami katakan, bagiannya melebihi 50%. Dalam hal ini, negara kita unik: Hanya kita, di Cina dan Republik Ceko, mesin pencari nasional memiliki persaingan nyata bagi raksasa dunia - Google.

Dengan jumlah kueri pencarian diproses, Yandex menempati peringkat keempat di dunia. Pada saat yang sama, jika tempat pertama Google dalam daftar ini tidak dapat dikenakan keraguan, maka tempat kedua Baidu Cina hanya disebabkan oleh jumlah besar negara ini. Tempat ketiga - Yahoo memiliki keunggulan ganda relatif terhadap monopoli Rusia.

Menurut aturan pasar Eropa, Yandex benar-benar dapat disebut monopoli - definisi seperti itu ditugaskan di sana untuk perusahaan mana pun, pangsa pasar yang melebihi 35%.

Di negara kita, keadaan ini disebut dominasi dan tidak dapat dihukum sampai manfaat yang ada terbukti. Jelas bahwa di lingkungan internet fakta pelanggaran mengkonfirmasi sangat sulit.

Cara menentukan bagian dari mesin pencari dalam total lalu lintas

Penilaian obyektif dari indikator ini cukup sederhana. Faktanya adalah bahwa mayoritas situs Rusia telah menginstal meter dari operator terkemuka statistik Internet LiveNinternet.

Tentu saja, penghitung ini tidak menempatkan semua situs, selain itu, tautan berikut tidak diperhitungkan zona domain .su dan Federasi Rusia. Tetapi masih sampel di atas dapat dianggap cukup representatif, itu memperhitungkan semua tema utama, wilayah dan jenis situs yang saat ini tersedia di Runet.

Jadi, untuk menonton posisi urusan saat ini dengan referensi: http: //www.liveinternet.ru/stat/ru/searches.html? Tanggal \u003d 2014-07-31; ....

Ini adalah ringkasan lengkap dari jumlah pengunjung yang telah datang ke situs yang terdaftar di pengguna Rusia untuk Juni dan Juli 2014.

Kesimpulannya jelas. Analisis posisi hal-hal yang telah kami letakkan di bagian sebelumnya.

Karakteristik Mesin Pencari Utama Rusia

Yandex.

Munculnya mesin pencari ini di pasaran sangat baik mengilustrasikan situasi di negara ini pada saat ia mulai memperoleh garis besar modern. Tidak heran Yandex disebut Runet Mirror - rupanya, definisi ini dapat diperluas pada realitas objektif.

Perkembangan perusahaan sangat mirip dengan evolusi seluruh masyarakat, jadi sampai batas tertentu pemimpin nasional adalah cermin dari seluruh negara akhir abad ke-20.

Untuk mengilustrasikan pernyataan yang begitu berani, mari putuskan sebentar ke Sejarah Perusahaan dan Mesin Pencari Yandex.

Waktu setelah restrukturisasi ditandai oleh penilaian ulang yang serius dari nilai-nilai yang paling aktif dari masyarakat dan munculnya orang-orang energik baru di arena politik dan bisnis, bersatu dalam kehidupan mereka: untuk memodernisasi kondisi keberadaannya dari diri mereka sendiri dan negara mereka untuk memastikan standar hidup yang layak untuk setiap orang yang berbagi keyakinan mereka.

Salah satu kornea dari era itu adalah Arkady Vólozh, yang berhasil mempersatukan spesialis workaholik terbaik di sekitarnya yang meletakkan dasar dari mesin pencari di masa depan.

Yandex, mungkin, tidak akan pernah menjadi cermin runet jika tidak ada bakat arkady Volodya yang luar biasa, yang berhasil melihat perspektif utama waktu dalam pembangunan mesin pencari Rusia.

Untuk mengimplementasikan idenya, ia berhasil mengarahkan aliran keuangan ke proyek ini, yang dibentuk dari transaksi barter untuk pertukaran pihak yang diimpor ke negara kami dengan imbalan eselon biji labu Kuban.

Tentu saja, proyek besar tidak dibuat tanpa tim orang-orang yang berpikiran sama. Dan kemudian pendiri Yandex beruntung - dia berhasil menarik para fisikawan Ilya Segalovich ke sisinya yang berbakat dan memegang harapan yang sangat tinggi, dengan siapa dia akrab dengan bangku sekolah.

Sulit untuk mengatakan apa itu jerami terakhir, mengencangkan masa depan ilmuwan besar semua prospek karir ilmiah yang cemerlang. Mungkin itu adalah bahwa peran penting dimainkan oleh obsesi nyata dan bakat keyakinan Direktur Tetap Yandex, tetapi Ilya menjadi Direktur Teknis Perusahaan dan memberikan kontribusi yang tak ternilai bagi perkembangannya.


Dialah yang menjadi penulis nama dan logo, yang sekarang diketahui oleh semua yang setidaknya pernah pergi ke Internet. Segalovich tertarik pada gagasan analisis morfologis dari frasa dalam Rusia dan kemungkinan mengklasifikasikan teks berdasarkan aturan untuk membangun struktur tata bahasa.

Akibatnya, ungkapan "namun indeks lain" muncul - "indeks lain", yang dalam versi singkat dengan tangan cahaya mesin pencari menjadi kata Yandex. Di masa depan, untuk menekankan tujuan utama mesin pencari - untuk mencari di segmen Internet berbahasa Rusia - logo diubah menjadi Yandex.

Ilya Segalovich mendedikasikan semua hidupnya dengan formasi dan pengembangan proyek ini. Sayangnya, pada tahun 2013 itu tidak menjadi, tetapi hidupnya, Yandex meningkatkan keunggulannya atas pesaing, terus-menerus meningkatkan algoritma pencarian, fondasi yang meletakkan terlambat direktur teknologi dan pengembangannya.

Google.

Mesin Pencari Google didirikan selama setahun lebih awal dari Yandex, tetapi di pasar Rusia hanya muncul pada tahun 2004. Tentu saja, selama bertahun-tahun, Yandex berhasil mengadaptasi pencariannya untuk spesifik negara kita.

Terlepas dari kenyataan bahwa jumlah pengguna internet yang cukup signifikan untuk pertanyaan, jawaban yang tidak mereka ketahui ditawarkan kepada "Google", dan tidak "bertanya kepada Yandex", masalah utama dari raksasa morfologi yang tidak memadai Teks berbahasa Rusia, sebagai akibat dari mana jawaban untuk meminta pengguna seringkali tidak lengkap atau sedikit terdistorsi.

Anda dapat berdebat untuk waktu yang lama, yang pencariannya lebih baik dan dari mana sistem lebih termotivasi (atau "panas" klien. Tetapi, seperti yang menurut kami, gambaran khas untuk pengguna Rusia adalah sebagai berikut: Pertama, "Runet Mirror" diminta, dan jika hasil pencariannya tidak relevan (dan seterusnya, itu terjadi cukup sering) , permintaan itu reheusary ke google.


Keturunan Global Google terjadi jauh lebih jarang daripada Yandex. Tetapi mereka mengubah penerbitan begitu serius sehingga banyak situs otoritatif, yang di atas, berada di akhir ratusan hasil penerbitan pertama.

Jadi, misalnya, versi terbaru dari algoritma "panda" sangat bagus untuk beberapa toko online terkemuka, menyentuh Amazon.com yang tampaknya tidak dapat diganggu gugat dan lainnya.

Pada 2013, perusahaan akhirnya berhenti menyiarkan pencarian orang lain di taman bermainnya dan menerapkan opsi mesin pencari sendiri di go.mail.ru.

Langkah ini hanya dapat disambut, karena di masa depan mesin pencari dari mail.ru dapat memiliki perlawanan serius terhadap duet para pemimpin, yang masih bisa rileks, tanpa merasakan napas tak putus-putus pesaing untuk punggung mereka.

Bagian dari mesin pencari ini sekarang tidak melebihi 7%, tetapi memiliki perspektif yang baik untuk peningkatan pengembangan layanan sosial yang disediakan oleh perusahaan: teman sekelas, lingkaran saya, dll.

Mesin pencari dengan pangsa pasar kurang dari 1%

Grup ini berfokus terutama dalam sistem utama, yang tidak dapat dibuat untuk elit pencarian Rusia. Di antara mereka, perusahaan Rambler menempati situasi khusus, pernah dengan percaya diri menduduki tempat kedua dan menunjukkan tren yang sangat menjanjikan.

Pengembara

Muncul pada tahun 1996, ketika gagasan pemrogram ilmu pushchino di bawah kepemimpinan penggemar berbakat Dmitry Kryukov, Rambler segera menjadi pemimpin pasar mesin pencari. Pada masa itu, Yandex belum, dan Google baru memulai prosesi di wilayah Amerika dan negara-negara terdekat.

Tampaknya forah seperti itu seharusnya membantu "tramp" (dan itu diterjemahkan dari kata Inggris Rambler) untuk mendapatkan keunggulan kompetitif yang nyata dalam pengembangan.

Tetapi apakah konflik internal di perusahaan, apakah kurangnya strategi yang diucapkan secara jelas menyebabkan fakta bahwa Rambler sekarang menyiarkan pencarian Yandex dan lebih dikenal dengan agregator beberapa layanan populer, termasuk peringkat situs Rambler Top100

Bing.

Dia adalah pencarian MSN, Live Seacrh, Windows Live Seacrh - produk Microsoft, sangat berjuang untuk tempat di bawah matahari di pasar mesin pencari. Ini adalah salah satu dari sedikit layanan yang menggunakan mesin Anda sendiri.

Hasil pencarian cukup dapat diterima, masalah utama situs, rupanya, adalah ketenaran rendah di antara pengguna.

Afort.

Contoh lain dari nasib sedih sekali oleh salah satu pemimpin pasar. Ada saat-saat ketika mesin pencari ini dipegang ketiga setelah Yandex dan Rambler, dan di direktori webmasternya berusaha untuk mendapatkan secara aktif seperti dalam katalog DMOZ atau Yandex.

Sekarang situs ini memiliki toko online barang-barang rumah tangga populer. Cari Aige jika tetap ada, itu disembunyikan di suatu tempat di kedalaman sumber daya, pada salah satu subdomainnya.

Apa yang Anda butuhkan untuk menulis mesin pencari Anda sendiri

Untuk menjawab pertanyaan ini, perlu membayangkan dengan baik apa mesin pencari dan cara kerjanya. Sebagian, kami telah mempertimbangkan prinsip-prinsip dasar membangun formula peringkat situs dalam hasil pencarian. Selain itu, perlu dicatat poin-poin berikut:

Tugas utama dari mesin pencari adalah menjawab permintaan pengguna. Jawabannya harus jelas dan relevan, jika tidak, pengguna akan pergi ke sistem lain, bahkan meskipun rendahnya persaingan di industri ini.

Untuk memberikan jawaban seperti itu, algoritma pencarian diperlukan pada saat pembentukannya untuk melihat konten banyak miliar halaman pada jaringan untuk mencari permintaan tertentu. Untuk melakukan ini, mesin pencari membuat database mereka sendiri yang disebut indeks dan menyimpan semua informasi yang diperlukan di sana.

Indeks ini dibentuk dengan terus memindai jaringan untuk mencari situs baru yang muncul serta perubahan halaman yang sudah diindeks. Program khusus mengacu pada karya ini, disebut Robot Indeks.

Mereka berjalan sepanjang waktu di situs dan membaca informasi yang diperbarui. Organisasi pekerjaan robot tersebut membutuhkan pembangunan pusat data besar menjadi beberapa ribu komputer yang kuat dengan semua infrastruktur, mulai dari daya dan pendinginan yang tidak terputus dan berakhir dengan layanan dan modernisasi reguler.

Pengguna ingin menerima jawaban yang cepat dan memadai untuk permintaan mereka. Oleh karena itu, mesin pencari modern harus memperhitungkan tidak hanya karakteristik situs yang diketahui, tetapi juga preferensi, fitur perilaku dan posisi geografis dari masing-masing klien mereka.

Untuk ini, algoritma pencarian harus memiliki elemen kecerdasan buatan dan dapat belajar secara independen dalam proses pekerjaan mereka. Jelas, karena menulis mesin seperti itu, Anda memerlukan tim besar programmer kelas tertinggi.

Mempertimbangkan bahwa mesin pencari terkemuka telah memutuskan semua masalah ini dan memiliki semua potensi yang diperlukan untuk pengembangan lebih lanjut, biaya memasuki pasar ini tampaknya hampir diterjemahkan.

Oleh karena itu, pemain baru dapat muncul dalam waktu dekat dalam waktu dekat, mampu menaikkan tempat yang layak dalam sejumlah sistem yang ada. Meskipun, jika ini tiba-tiba terjadi, semua orang akan menang - dan mesin pencari itu sendiri yang akan menerima insentif baru untuk perbaikan yang lebih besar, dan kami, pengguna biasa yang selalu kekurangan sesuatu dan ingin mencari setiap hari menjadi lebih baik dan lebih baik.

Diharapkan Google menduduki peringkat pertama di peringkat dunia. Sahamnya harus lebih dari 70% dari permintaan pencarian dari warga dari seluruh negeri. Apalagi sepertiga dari seluruh lalu lintas Google.com jatuh pada warga AS. Selain itu, Google adalah situs yang paling banyak dikunjungi di dunia. Durasi harian rata-rata penggunaan mesin pencari Google adalah 9 menit.

Keuntungan dari mesin pencari Google adalah kurangnya item yang tidak perlu pada halaman. Hanya bilah pencarian dan logo perusahaan. Fishka. Mereka adalah gambar animasi dan permainan browser yang didedikasikan untuk liburan populer dan lokal.

2. Bing.

Bing - mesin Pencari Microsoftmemimpin sejarahnya sejak 2009. Mulai sekarang, telah menjadi atribut wajib dari smartphone pada Windows. Bing juga membedakan minimalis - selain tajuk dengan daftar semua produk Microsoft, hanya string pencarian dan nama sistem yang terletak di halaman. Bing paling populer di Amerika Serikat (31%), Cina (18%) dan Jerman (6%).

3. Yahoo!

Tempat ketiga dikonsolidasikan di salah satu mesin pencari tertua - Yahu. Sebagian besar pengguna juga tinggal di Amerika Serikat (24%). Tampaknya seluruh dunia secara sadar menghindari bantuan robot pencarian ...Mesin pencari juga populer di India, Indonesia, Taiwan dan di Inggris. Selain string pencarian, pada halaman Yahoo! Prakiraan cuaca di wilayah Anda, serta tren dunia dalam bentuk umpan berita.

4. Baidu.

Mesin pencari Cina, yang di Rusia telah mendapatkan ketenaran buruk. Karena kebijakan agresif dan kurangnya terjemahan ke dalam bahasa Rusia atau Inggris, perluasan mesin pencari ini dianggap sebagai virus. Mereka sangat sulit untuk dihapus sampai akhir dan menyingkirkan jendela sembul dengan hieroglif. Namun, situs ini keempat di dunia Dengan kehadiran. 92% dari audiensnya membentuk warga China.

5. AOL.

AOL adalah mesin pencari Amerika, yang namanya didekripsi sebagai Amerika online. Popularitasnya secara signifikan lebih rendah dari sistem sebelumnya. Fajarnya terjadi pada tahun 90-an dan 00s. Hampir 70% audiir AOL adalah penduduk Amerika Serikat.

6. Ask.com.

Mesin pencari ini memimpin sejarahnya sejak 1995, cukup antarmuka yang tidak biasa. Semua permintaan, ia merasakan sebagai pertanyaan dan menawarkan jawaban sesuai dengan hasil pencarian. Ini adalah sesuatu yang diingatkan oleh respons layanan. Laki-laki. Namun, bukan jawaban pecinta yang termasuk dalam penerbitan, tetapi artikel penuh. Selama setahun terakhir, situs kehilangan sekitar 50 posisi di peringkat dunia sumber daya Internet paling populer dan hari ini hanya membutuhkan ke-104.

7. Excite.

Mesin pencari ini tidak luar biasa, dan mirip dengan banyak situs lain. Ini menawarkan banyak layanan layanan (seperti berita, surat, cuaca, perjalanan, dll.) Antarmuka situs juga menyebabkan ingatan webi tahun 90-an dan, dan dapat diasumsikan, telah berubah sedikit sejak itu.

8. DuckDuckGo.

Pengembang segera memperingatkan bahwa mesin pencari ini tidak melacak tindakan Anda on line. Saat ini, ini adalah argumen berbobot saat memilih mesin pencari. Desain situs dibuat dengan cara modern, menggunakan warna-warna cerah dan gambar lucu. Tidak seperti mesin pencari lainnya, "Mesin Pencari Bebek" diterjemahkan ke dalam bahasa Rusia. Selama setahun terakhir, situs ini telah memainkan sekitar 400 posisi dan pada Maret 2017. Terletak 504 garis peringkat popularitas Alexa.

9. Wolframalpha.

Fitur khas dari pencarian ini adalah berbagai layanan tambahan yang dirancang untuk permintaan yang terkait dengan mereka atau pengetahuan lainnya. Yaitu, dalam ekstradisi Anda tidak akan melihat tautan ke pos di jejaring sosial atau artikel pers kuning. Anda akan ditawari angka spesifik dan fakta-fakta yang terbukti. dalam bentuk satu dokumen. Browser ini sangat ideal untuk anak sekolah dan siswa.

10. Yandex.

Mesin pencari adalah yang paling populer di Rusia dan negara-negara CIS. Selain itu, sekitar 3% dari audiens situs adalah penduduk Jerman. Situs ini terkenal untuk sejumlah besar layanan untuk semua kesempatan (musik, radio, jadwal transportasi sosial, real estat, penerjemah, dll.) Juga sumber daya menawarkan banyak pilihan situs desain individu, serta menyiapkan widget "di bawah dirimu". Yandex menempati urutan ke-31 di dunia popularitas, kehilangan 11 posisi selama setahun terakhir.